平均値の差の検定に関する話です。同じように「平均値の差」を検定しても、結果が異なることがある、というようなことが述べられています。
以下レジメ
2人のゴルファーAとBが腕比べをした。
ゴルフ場のコースは様々なので、公平にするために、6箇所のゴルフ場で勝負を決めることにした。
成績は以下の様になった。
ゴルファー\ゴルフ場 |
イ |
ロ |
ハ |
ニ |
ホ |
ヘ |
平均 |
A |
209 |
205 |
210 |
208 |
207 |
207 |
207.7 |
B |
201 |
197 |
211 |
200 |
208 |
199 |
202.7 |
A-B |
+8 |
+8 |
-1 |
+8 |
-1 |
+8 |
+5 |
符号検定
各ゴルフ場ごとにAのスコアからBのスコアを引き、+と-の符号の数で検定する。
(+:4個、-:2個)
帰無仮説:AとBの腕前という母集団の平均値に差がない
→正しいならば、+:3個、-:3個が期待できる。
自由度1の
分布の5%点は3.84であり、0.67より大きい。
帰無仮説は捨てられない。→Bの方が腕前が上とは言えない。よってどちらも同じ腕前。
t検定
符号検定と同じ方法で、符号だけでなく差の値で検定する。
AとBの腕前に差が無い場合、6個の差の平均はゼロになることが期待できる。
「5という平均値
は、平均
がゼロの母集団から抽出したものだと考えるべきか?」
(5-0)/(
の標準偏差)
→十分に大きければ、5は平均値
がゼロの母集団から抽出されたものではないと言える
(自由度5のt分布の5%点は2.57)
「5と言う平均値は、母平均ゼロの母集団から抽出した試料である」という仮説が捨てられる。
→AとBの平均値の差は本物である。よってBの方が腕前が上。
同一のデータに対して異なった検定法を採用するとき、異なった結論を得る場合がある。
符号検定は差の大きさは無視して考えるが、t検定は差の大きさも考慮するため、t検定のほうがデータの情報を多く活かしている。そのため、t検定のほうが平均値の差を見つけやすい。「t検定の方が件出力が大きい」と言う。
どのような検定方法をとるかは実験前に決めておくべきである。
これらの平均値の差の検定方法は、AとBのゴルフ場ごとの2つずつのデータのように、対応のあるデータのみに適用できる。
最終更新:2008年08月25日 18:46