※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

平均値の差の検定に関する話です。同じように「平均値の差」を検定しても、結果が異なることがある、というようなことが述べられています。

以下レジメ

2人のゴルファーAとBが腕比べをした。
ゴルフ場のコースは様々なので、公平にするために、6箇所のゴルフ場で勝負を決めることにした。
成績は以下の様になった。

ゴルファー\ゴルフ場 平均
A 209 205 210 208 207 207 207.7
B 201 197 211 200 208 199 202.7
A-B +8 +8 -1 +8 -1 +8 +5

符号検定

各ゴルフ場ごとにAのスコアからBのスコアを引き、+と-の符号の数で検定する。
(+:4個、-:2個)

帰無仮説:AとBの腕前という母集団の平均値に差がない
  →正しいならば、+:3個、-:3個が期待できる。

\chi^2=\frac{(4-3)^2}{3} + \frac{(2-3)^2}{3} =0.67

自由度1の\chi^2分布の5%点は3.84であり、0.67より大きい。
帰無仮説は捨てられない。→Bの方が腕前が上とは言えない。よってどちらも同じ腕前。

t検定

符号検定と同じ方法で、符号だけでなく差の値で検定する。
AとBの腕前に差が無い場合、6個の差の平均はゼロになることが期待できる。
「5という平均値\bar{x}は、平均\bar{x}がゼロの母集団から抽出したものだと考えるべきか?」

(5-0)/(\bar{x}の標準偏差)
→十分に大きければ、5は平均値\bar{x}がゼロの母集団から抽出されたものではないと言える

t=\frac{5-0}{\left{\frac{4.648}{\sqrt{6}}\right}}=2.63  (自由度5のt分布の5%点は2.57)

「5と言う平均値は、母平均ゼロの母集団から抽出した試料である」という仮説が捨てられる。
→AとBの平均値の差は本物である。よってBの方が腕前が上。

同一のデータに対して異なった検定法を採用するとき、異なった結論を得る場合がある。
符号検定は差の大きさは無視して考えるが、t検定は差の大きさも考慮するため、t検定のほうがデータの情報を多く活かしている。そのため、t検定のほうが平均値の差を見つけやすい。「t検定の方が件出力が大きい」と言う。
どのような検定方法をとるかは実験前に決めておくべきである。

これらの平均値の差の検定方法は、AとBのゴルフ場ごとの2つずつのデータのように、対応のあるデータのみに適用できる。