「1. ゴルファーの腕比べの話」の編集履歴(バックアップ)一覧はこちら

1. ゴルファーの腕比べの話」(2008/08/25 (月) 18:46:00) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

平均値の差の検定に関する話です。同じように「平均値の差」を検定しても、結果が異なることがある、というようなことが述べられています。 以下レジメ ---- 2人のゴルファーAとBが腕比べをした。 ゴルフ場のコースは様々なので、公平にするために、6箇所のゴルフ場で勝負を決めることにした。 成績は以下の様になった。 |ゴルファー\ゴルフ場|イ|ロ|ハ|ニ|ホ|ヘ|平均| |A|209|205|210|208|207|207|207.7| |B|201|197|211|200|208|199|202.7| |A-B|+8|+8|-1|+8|-1|+8|+5| **符号検定 各ゴルフ場ごとにAのスコアからBのスコアを引き、+と-の符号の数で検定する。 (+:4個、-:2個) 帰無仮説:AとBの腕前という母集団の平均値に差がない   →正しいならば、+:3個、-:3個が期待できる。 $$\chi^2 = (4-3)^2/3 + (2-3)^2/3 = 0.67$$ 自由度1の$$\chi^2$$分布の5%点は3.84であり、0.67より大きい。 帰無仮説は捨てられない。→Bの方が腕前が上とは言えない。よってどちらも同じ腕前。 **t検定 符号検定と同じ方法で、符号だけでなく差の値で検定する。 AとBの腕前に差が無い場合、6個の差の平均はゼロになることが期待できる。 「5という平均値$$\bar{x}$$は、平均$$\bar{x}$$がゼロの母集団から抽出したものだと考えるべきか?」 (5-0)/($$\bar{x}$$の標準偏差) →十分に大きければ、5は平均値$$\bar{x}$$がゼロの母集団から抽出されたものではないと言える $$t=\frac{5-0}{4.648/\sqrt{6}}=2.63$$  (自由度5のt分布の5%点は2.57) 「5と言う平均値は、母平均ゼロの母集団から抽出した試料である」という仮説が捨てられる。 →AとBの平均値の差は本物である。よってBの方が腕前が上。 同一のデータに対して異なった検定法を採用するとき、異なった結論を得る場合がある。 符号検定は差の大きさは無視して考えるが、t検定は差の大きさも考慮するため、t検定のほうがデータの情報を多く活かしている。そのため、t検定のほうが平均値の差を見つけやすい。「t検定の方が件出力が大きい」と言う。 どのような検定方法をとるかは実験前に決めておくべきである。 これらの平均値の差の検定方法は、AとBのゴルフ場ごとの2つずつのデータのように、対応のあるデータのみに適用できる。 ----
平均値の差の検定に関する話です。同じように「平均値の差」を検定しても、結果が異なることがある、というようなことが述べられています。 以下レジメ ---- 2人のゴルファーAとBが腕比べをした。 ゴルフ場のコースは様々なので、公平にするために、6箇所のゴルフ場で勝負を決めることにした。 成績は以下の様になった。 |ゴルファー\ゴルフ場|イ|ロ|ハ|ニ|ホ|ヘ|平均| |A|209|205|210|208|207|207|207.7| |B|201|197|211|200|208|199|202.7| |A-B|+8|+8|-1|+8|-1|+8|+5| **符号検定 各ゴルフ場ごとにAのスコアからBのスコアを引き、+と-の符号の数で検定する。 (+:4個、-:2個) 帰無仮説:AとBの腕前という母集団の平均値に差がない   →正しいならば、+:3個、-:3個が期待できる。 $$\chi^2=\frac{(4-3)^2}{3} + \frac{(2-3)^2}{3} =0.67$$ 自由度1の$$\chi^2$$分布の5%点は3.84であり、0.67より大きい。 帰無仮説は捨てられない。→Bの方が腕前が上とは言えない。よってどちらも同じ腕前。 **t検定 符号検定と同じ方法で、符号だけでなく差の値で検定する。 AとBの腕前に差が無い場合、6個の差の平均はゼロになることが期待できる。 「5という平均値$$\bar{x}$$は、平均$$\bar{x}$$がゼロの母集団から抽出したものだと考えるべきか?」 (5-0)/($$\bar{x}$$の標準偏差) →十分に大きければ、5は平均値$$\bar{x}$$がゼロの母集団から抽出されたものではないと言える $$t=\frac{5-0}{\left{\frac{4.648}{\sqrt{6}}\right}}=2.63$$  (自由度5のt分布の5%点は2.57) 「5と言う平均値は、母平均ゼロの母集団から抽出した試料である」という仮説が捨てられる。 →AとBの平均値の差は本物である。よってBの方が腕前が上。 同一のデータに対して異なった検定法を採用するとき、異なった結論を得る場合がある。 符号検定は差の大きさは無視して考えるが、t検定は差の大きさも考慮するため、t検定のほうがデータの情報を多く活かしている。そのため、t検定のほうが平均値の差を見つけやすい。「t検定の方が件出力が大きい」と言う。 どのような検定方法をとるかは実験前に決めておくべきである。 これらの平均値の差の検定方法は、AとBのゴルフ場ごとの2つずつのデータのように、対応のあるデータのみに適用できる。 ----

表示オプション

横に並べて表示:
変化行の前後のみ表示: