「1. ゴルファーの腕比べの話」の編集履歴(バックアップ)一覧はこちら
「1. ゴルファーの腕比べの話」(2008/08/25 (月) 18:46:00) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
平均値の差の検定に関する話です。同じように「平均値の差」を検定しても、結果が異なることがある、というようなことが述べられています。
以下レジメ
----
2人のゴルファーAとBが腕比べをした。
ゴルフ場のコースは様々なので、公平にするために、6箇所のゴルフ場で勝負を決めることにした。
成績は以下の様になった。
|ゴルファー\ゴルフ場|イ|ロ|ハ|ニ|ホ|ヘ|平均|
|A|209|205|210|208|207|207|207.7|
|B|201|197|211|200|208|199|202.7|
|A-B|+8|+8|-1|+8|-1|+8|+5|
**符号検定
各ゴルフ場ごとにAのスコアからBのスコアを引き、+と-の符号の数で検定する。
(+:4個、-:2個)
帰無仮説:AとBの腕前という母集団の平均値に差がない
→正しいならば、+:3個、-:3個が期待できる。
$$\chi^2 = (4-3)^2/3 + (2-3)^2/3 = 0.67$$
自由度1の$$\chi^2$$分布の5%点は3.84であり、0.67より大きい。
帰無仮説は捨てられない。→Bの方が腕前が上とは言えない。よってどちらも同じ腕前。
**t検定
符号検定と同じ方法で、符号だけでなく差の値で検定する。
AとBの腕前に差が無い場合、6個の差の平均はゼロになることが期待できる。
「5という平均値$$\bar{x}$$は、平均$$\bar{x}$$がゼロの母集団から抽出したものだと考えるべきか?」
(5-0)/($$\bar{x}$$の標準偏差)
→十分に大きければ、5は平均値$$\bar{x}$$がゼロの母集団から抽出されたものではないと言える
$$t=\frac{5-0}{4.648/\sqrt{6}}=2.63$$ (自由度5のt分布の5%点は2.57)
「5と言う平均値は、母平均ゼロの母集団から抽出した試料である」という仮説が捨てられる。
→AとBの平均値の差は本物である。よってBの方が腕前が上。
同一のデータに対して異なった検定法を採用するとき、異なった結論を得る場合がある。
符号検定は差の大きさは無視して考えるが、t検定は差の大きさも考慮するため、t検定のほうがデータの情報を多く活かしている。そのため、t検定のほうが平均値の差を見つけやすい。「t検定の方が件出力が大きい」と言う。
どのような検定方法をとるかは実験前に決めておくべきである。
これらの平均値の差の検定方法は、AとBのゴルフ場ごとの2つずつのデータのように、対応のあるデータのみに適用できる。
----
平均値の差の検定に関する話です。同じように「平均値の差」を検定しても、結果が異なることがある、というようなことが述べられています。
以下レジメ
----
2人のゴルファーAとBが腕比べをした。
ゴルフ場のコースは様々なので、公平にするために、6箇所のゴルフ場で勝負を決めることにした。
成績は以下の様になった。
|ゴルファー\ゴルフ場|イ|ロ|ハ|ニ|ホ|ヘ|平均|
|A|209|205|210|208|207|207|207.7|
|B|201|197|211|200|208|199|202.7|
|A-B|+8|+8|-1|+8|-1|+8|+5|
**符号検定
各ゴルフ場ごとにAのスコアからBのスコアを引き、+と-の符号の数で検定する。
(+:4個、-:2個)
帰無仮説:AとBの腕前という母集団の平均値に差がない
→正しいならば、+:3個、-:3個が期待できる。
$$\chi^2=\frac{(4-3)^2}{3} + \frac{(2-3)^2}{3} =0.67$$
自由度1の$$\chi^2$$分布の5%点は3.84であり、0.67より大きい。
帰無仮説は捨てられない。→Bの方が腕前が上とは言えない。よってどちらも同じ腕前。
**t検定
符号検定と同じ方法で、符号だけでなく差の値で検定する。
AとBの腕前に差が無い場合、6個の差の平均はゼロになることが期待できる。
「5という平均値$$\bar{x}$$は、平均$$\bar{x}$$がゼロの母集団から抽出したものだと考えるべきか?」
(5-0)/($$\bar{x}$$の標準偏差)
→十分に大きければ、5は平均値$$\bar{x}$$がゼロの母集団から抽出されたものではないと言える
$$t=\frac{5-0}{\left{\frac{4.648}{\sqrt{6}}\right}}=2.63$$ (自由度5のt分布の5%点は2.57)
「5と言う平均値は、母平均ゼロの母集団から抽出した試料である」という仮説が捨てられる。
→AとBの平均値の差は本物である。よってBの方が腕前が上。
同一のデータに対して異なった検定法を採用するとき、異なった結論を得る場合がある。
符号検定は差の大きさは無視して考えるが、t検定は差の大きさも考慮するため、t検定のほうがデータの情報を多く活かしている。そのため、t検定のほうが平均値の差を見つけやすい。「t検定の方が件出力が大きい」と言う。
どのような検定方法をとるかは実験前に決めておくべきである。
これらの平均値の差の検定方法は、AとBのゴルフ場ごとの2つずつのデータのように、対応のあるデータのみに適用できる。
----