「2. 飲んべえ族に耳寄りな話」の編集履歴(バックアップ)一覧はこちら
「2. 飲んべえ族に耳寄りな話」(2008/08/19 (火) 12:52:36) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
**$$m$$と$$\bar{x}$$
正規分布する母集団のんぷの中心を示す母集団$$m$$、および分布のひろがりを示す母標準偏差$$\sigma$$は、通常は直接知ることができない。
→母集団から抽出した資料から求めた資料平均$$\bar{x}$$を$$m$$の推定値。資料の標準偏差$$s$$を$$\sigma$$の推定値とする。
→$$\bar{x}$$&bold(){と}$$s$$&bold(){の精度はどのくらいか?}
(検討ポイント)
平均値$$m$$、標準偏差$$\sigma$$の正規分布する母集団から、資料$$x$$を$$n$$こ抽出して求めた$$x$$の平均値$$\bar{x}$$の分布は?またその分布から何がわかるか?
**ノーマルチップス
シューハートのノーマル・チップス(表27)をグラフ化すると以下のような正規分布になる。
#image(2008y08m19d_120650316.jpg)
図1.シューハートのノーマル・チップス。総枚数998枚。
平均値30、標準偏差10の正規分布。
この中から無作為にチップを抜き出す行為は、$$m$$が30、$$\sigma$$が1の正規分布する母集団から試料を抽出することに値する。このときの$$\bar{x}$$の分布はどのようになるか?
**シミュレーション
よくかきまぜた998枚のチップから無作為に1枚を抽出し、再び箱の中に戻し、さらによくかきまぜて1枚を取り出す行為を5回繰り返す。取り出した5枚を1組として試料平均値$$\bar{x}$$を記録する(正規母集団から無作為に5個の試料をサンプリングして試料平均値を算出)。
→この操作100組のデータが表29(p.74)である。
平均値$$\bar{x}$$の平均値=29.70
平均値$$\bar{x}$$の標準偏差=4.65
**$$\bar{x}$$の分布
表29のデータの度数分布図(図30)からわかること。
+母集団の平均値30日回試料平均値の頻度が多い。しかし、少数ながら、18や40のように離れた数値も存在する。
+$$\bar{x}$$=29.7で$$m$$=30に近い。→試料平均値が母集団の平均値の良い推定値になる。
+$$\bar{x}$$の分布の標準偏差→不偏分散$$s^2$$より求める。$$s$$=4.65となり、母集団の標準偏差10よりも小さい(重要!)
**推定の制度と$$\bar{x}$$の標準偏差
試料平均値の分布の標準偏差とは何を意味するのか?→試料平均値から母集団平均値を推定する精度。
「母平均値$$m$$、母標準偏差$$\sigma$$の正規分布する母集団からn個の試料を抽出して試料平均値$$\bar{x}$$を求めると、$$\bar{x}$$は平均値$$m$$で標準偏差が$$\sigma/\sqrt{n}$$の正規分布となる。」
#image(2008y08m19d_120844025.jpg)
図2.正規母集団分布→試料平均値の分布→t分布への変換
(佐藤信「推計学のすすめ」p.78)
→$$n$$が大きくなればなるほど、$$\bar{x}$$の精度はよくなる(図2の(ロ))。しかし、図32(p.79)に示すように、$$n>$$30になると、制度の向上は小さくなる。(サンプル数の目安になる?)
**$$t$$分布を導く
母平均値$$m$$、母標準偏差$$\sigma$$は、一般的には不明である。→試料平均値$$\bar{x}$$および試料平均値の標準偏差$$s$$から母集団が推定できるか?
以下の操作を行う。
試料平均値と母平均値との差
$$\bar{x}-\mu$$
この差を$$\bar{x}$$の標準偏差の単位ではかると考えると、
$$\bar{x}-\mu$$
―――――――――――
$$\bar{x}$$の標準偏差
ただし、$$\bar{x}$$の標準偏差は$$\sigma/\sqrt{n}$$であるが、$$\sigma$$も未知であるため、$$s$$で代用する。
$$\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$$
この式は、図31(ハ)に示すように、$$\bar{x}$$の分布を平均値0、標準偏差1の分布に基準化したことに相当する。→$$t$$分布(p.56,58の図20,21に示した正規分布の基準化の手続きと比較せよ。$$t$$分布と正規分布の相違点は$$\sigma$$の代わりにその推定値$$s$$を用いている点である)。
**$$t$$分布表(p.82)
#image(2008y08m19d_120904632.jpg)
図33 $$t$$分布表 自由度(n-1)
(佐藤信「推計学のすすめ」p.82)
$$t$$分布表…$$t$$分布の中心0から$$t$$以上はなれた値が出現する確率を分布の面積で表したもの。例えば、自由度3のとき、両裾の斜線部分をあわせた面積が5%となる$$t$$の絶対値は、$$t$$=3.18となる。
$$t$$分布は、母集団から試料を抽出する数$$n$$によって、分布の形が変形する。→標準偏差が1/$$\sqrt{n}$$の割合で変化するため。
**$$m$$と$$\bar{x}$$
正規分布する母集団のんぷの中心を示す母集団$$m$$、および分布のひろがりを示す母標準偏差$$\sigma$$は、通常は直接知ることができない。
→母集団から抽出した資料から求めた資料平均$$\bar{x}$$を$$m$$の推定値。資料の標準偏差$$s$$を$$\sigma$$の推定値とする。
→$$\bar{x}$$&bold(){と}$$s$$&bold(){の精度はどのくらいか?}
(検討ポイント)
平均値$$m$$、標準偏差$$\sigma$$の正規分布する母集団から、資料$$x$$を$$n$$こ抽出して求めた$$x$$の平均値$$\bar{x}$$の分布は?またその分布から何がわかるか?
**ノーマルチップス
シューハートのノーマル・チップス(表27)をグラフ化すると以下のような正規分布になる。
#image(2008y08m19d_120650316.jpg)
図1.シューハートのノーマル・チップス。総枚数998枚。
平均値30、標準偏差10の正規分布。
この中から無作為にチップを抜き出す行為は、$$m$$が30、$$\sigma$$が1の正規分布する母集団から試料を抽出することに値する。このときの$$\bar{x}$$の分布はどのようになるか?
**シミュレーション
よくかきまぜた998枚のチップから無作為に1枚を抽出し、再び箱の中に戻し、さらによくかきまぜて1枚を取り出す行為を5回繰り返す。取り出した5枚を1組として試料平均値$$\bar{x}$$を記録する(正規母集団から無作為に5個の試料をサンプリングして試料平均値を算出)。
→この操作100組のデータが表29(p.74)である。
平均値$$\bar{x}$$の平均値=29.70
平均値$$\bar{x}$$の標準偏差=4.65
**$$\bar{x}$$の分布
表29のデータの度数分布図(図30)からわかること。
+母集団の平均値30日回試料平均値の頻度が多い。しかし、少数ながら、18や40のように離れた数値も存在する。
+$$\bar{x}$$=29.7で$$m$$=30に近い。→試料平均値が母集団の平均値の良い推定値になる。
+$$\bar{x}$$の分布の標準偏差→不偏分散$$s^2$$より求める。$$s$$=4.65となり、母集団の標準偏差10よりも小さい(重要!)
**推定の制度と$$\bar{x}$$の標準偏差
試料平均値の分布の標準偏差とは何を意味するのか?→試料平均値から母集団平均値を推定する精度。
「母平均値$$m$$、母標準偏差$$\sigma$$の正規分布する母集団からn個の試料を抽出して試料平均値$$\bar{x}$$を求めると、$$\bar{x}$$は平均値$$m$$で標準偏差が$$\sigma/\sqrt{n}$$の正規分布となる。」
#image(2008y08m19d_120844025.jpg)
図2.正規母集団分布→試料平均値の分布→t分布への変換
(佐藤信「推計学のすすめ」p.78)
→$$n$$が大きくなればなるほど、$$\bar{x}$$の精度はよくなる(図2の(ロ))。しかし、図32(p.79)に示すように、$$n>$$30になると、制度の向上は小さくなる。(サンプル数の目安になる?)
**$$t$$分布を導く
母平均値$$m$$、母標準偏差$$\sigma$$は、一般的には不明である。→試料平均値$$\bar{x}$$および試料平均値の標準偏差$$s$$から母集団が推定できるか?
以下の操作を行う。
試料平均値と母平均値との差
$$\bar{x}-\mu$$
この差を$$\bar{x}$$の標準偏差の単位ではかると考えると、
$$\bar{x}-\mu$$
―――――――――――
$$\bar{x}$$の標準偏差
ただし、$$\bar{x}$$の標準偏差は$$\sigma/\sqrt{n}$$であるが、$$\sigma$$も未知であるため、$$s$$で代用する。
$$\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$$
この式は、図31(ハ)に示すように、$$\bar{x}$$の分布を平均値0、標準偏差1の分布に基準化したことに相当する。→$$t$$分布(p.56,58の図20,21に示した正規分布の基準化の手続きと比較せよ。$$t$$分布と正規分布の相違点は$$\sigma$$の代わりにその推定値$$s$$を用いている点である)。
**$$t$$分布表(p.82)
#image(2008y08m19d_120904632.jpg)
図33 $$t$$分布表 自由度(n-1)
(佐藤信「推計学のすすめ」p.82)
$$t$$分布表…$$t$$分布の中心0から$$t$$以上はなれた値が出現する確率を分布の面積で表したもの。例えば、自由度3のとき、両裾の斜線部分をあわせた面積が5%となる$$t$$の絶対値は、$$t$$=3.18となる。
$$t$$分布は、母集団から試料を抽出する数$$n$$によって、分布の形が変形する。→標準偏差が1/$$\sqrt{n}$$の割合で変化するため。
**$$t$$分布による検定
p.85では、2杯の試料から「バー・エックスのシングル1杯は30mLである」という仮説が棄却できるか?を問題としている。
$$n$$=2の場合バー・エックスのシングル1杯が30mLであるとはいえないという結論に達した(仮説は捨てられない)が、$$n$$の数を増やすと$$\bar{x}$$の精度が増すため、仮説を捨てられる可能性がある。このように、一度仮説が捨てられない結果が得られ、実験制度に不備の可能性があると考えられる場合は、実験計画の見直し、試料を増やすなどの再実験が必要である。
***自由度(Degree-of-freedom)の定義
一般に、変数のうち独立に選べるものの数、すなわち全変数の数から、それら相互間に成り立つ関係式(束縛条件、拘束条件)の数を引いたもの。自由度1といった具合に表現する。
自由度は、力学・機構学・統計学などで使用され、意味は上記の定義に順ずるが、それぞれの具体的に示唆する処は異なる。
統計学では、各種の統計量に関して自由度が定義される。大きさ$$n$$の標本における観測データ$$(x_1, x_2, ... , x_n)$$の自由度は$$n$$とする。それらから求めた標本平均についても同様である。
不偏分散$$s^2=\frac{\sum_{i=1}^n(\bar{x}-x_i)^2}{n-1}$$については、$$\bar{x}=\frac{1}{n}\sum_{i=1}^nx_i$$という関係式(ここで$$\bar{x}$$は母集団平均$$\mu$$の推定量である)があるから、自由度は1少ない$$n$$-1となる。そのため分母には$$n$$-1を用いる。
----