「2. 飲んべえ族に耳寄りな話」の編集履歴(バックアップ)一覧はこちら

2. 飲んべえ族に耳寄りな話」(2008/08/19 (火) 12:52:36) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

**$$m$$と$$\bar{x}$$ 正規分布する母集団のんぷの中心を示す母集団$$m$$、および分布のひろがりを示す母標準偏差$$\sigma$$は、通常は直接知ることができない。 →母集団から抽出した資料から求めた資料平均$$\bar{x}$$を$$m$$の推定値。資料の標準偏差$$s$$を$$\sigma$$の推定値とする。 →$$\bar{x}$$&bold(){と}$$s$$&bold(){の精度はどのくらいか?} (検討ポイント) 平均値$$m$$、標準偏差$$\sigma$$の正規分布する母集団から、資料$$x$$を$$n$$こ抽出して求めた$$x$$の平均値$$\bar{x}$$の分布は?またその分布から何がわかるか? **ノーマルチップス シューハートのノーマル・チップス(表27)をグラフ化すると以下のような正規分布になる。 #image(2008y08m19d_120650316.jpg) 図1.シューハートのノーマル・チップス。総枚数998枚。 平均値30、標準偏差10の正規分布。 この中から無作為にチップを抜き出す行為は、$$m$$が30、$$\sigma$$が1の正規分布する母集団から試料を抽出することに値する。このときの$$\bar{x}$$の分布はどのようになるか? **シミュレーション よくかきまぜた998枚のチップから無作為に1枚を抽出し、再び箱の中に戻し、さらによくかきまぜて1枚を取り出す行為を5回繰り返す。取り出した5枚を1組として試料平均値$$\bar{x}$$を記録する(正規母集団から無作為に5個の試料をサンプリングして試料平均値を算出)。 →この操作100組のデータが表29(p.74)である。     平均値$$\bar{x}$$の平均値=29.70     平均値$$\bar{x}$$の標準偏差=4.65 **$$\bar{x}$$の分布 表29のデータの度数分布図(図30)からわかること。 +母集団の平均値30日回試料平均値の頻度が多い。しかし、少数ながら、18や40のように離れた数値も存在する。 +$$\bar{x}$$=29.7で$$m$$=30に近い。→試料平均値が母集団の平均値の良い推定値になる。 +$$\bar{x}$$の分布の標準偏差→不偏分散$$s^2$$より求める。$$s$$=4.65となり、母集団の標準偏差10よりも小さい(重要!) **推定の制度と$$\bar{x}$$の標準偏差 試料平均値の分布の標準偏差とは何を意味するのか?→試料平均値から母集団平均値を推定する精度。 「母平均値$$m$$、母標準偏差$$\sigma$$の正規分布する母集団からn個の試料を抽出して試料平均値$$\bar{x}$$を求めると、$$\bar{x}$$は平均値$$m$$で標準偏差が$$\sigma/\sqrt{n}$$の正規分布となる。」 #image(2008y08m19d_120844025.jpg) 図2.正規母集団分布→試料平均値の分布→t分布への変換 (佐藤信「推計学のすすめ」p.78) →$$n$$が大きくなればなるほど、$$\bar{x}$$の精度はよくなる(図2の(ロ))。しかし、図32(p.79)に示すように、$$n>$$30になると、制度の向上は小さくなる。(サンプル数の目安になる?) **$$t$$分布を導く 母平均値$$m$$、母標準偏差$$\sigma$$は、一般的には不明である。→試料平均値$$\bar{x}$$および試料平均値の標準偏差$$s$$から母集団が推定できるか? 以下の操作を行う。 試料平均値と母平均値との差 $$\bar{x}-\mu$$ この差を$$\bar{x}$$の標準偏差の単位ではかると考えると、   $$\bar{x}-\mu$$ ―――――――――――  $$\bar{x}$$の標準偏差 ただし、$$\bar{x}$$の標準偏差は$$\sigma/\sqrt{n}$$であるが、$$\sigma$$も未知であるため、$$s$$で代用する。 $$\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$$ この式は、図31(ハ)に示すように、$$\bar{x}$$の分布を平均値0、標準偏差1の分布に基準化したことに相当する。→$$t$$分布(p.56,58の図20,21に示した正規分布の基準化の手続きと比較せよ。$$t$$分布と正規分布の相違点は$$\sigma$$の代わりにその推定値$$s$$を用いている点である)。 **$$t$$分布表(p.82) #image(2008y08m19d_120904632.jpg) 図33 $$t$$分布表 自由度(n-1) (佐藤信「推計学のすすめ」p.82) $$t$$分布表…$$t$$分布の中心0から$$t$$以上はなれた値が出現する確率を分布の面積で表したもの。例えば、自由度3のとき、両裾の斜線部分をあわせた面積が5%となる$$t$$の絶対値は、$$t$$=3.18となる。 $$t$$分布は、母集団から試料を抽出する数$$n$$によって、分布の形が変形する。→標準偏差が1/$$\sqrt{n}$$の割合で変化するため。
**$$m$$と$$\bar{x}$$ 正規分布する母集団のんぷの中心を示す母集団$$m$$、および分布のひろがりを示す母標準偏差$$\sigma$$は、通常は直接知ることができない。 →母集団から抽出した資料から求めた資料平均$$\bar{x}$$を$$m$$の推定値。資料の標準偏差$$s$$を$$\sigma$$の推定値とする。 →$$\bar{x}$$&bold(){と}$$s$$&bold(){の精度はどのくらいか?} (検討ポイント) 平均値$$m$$、標準偏差$$\sigma$$の正規分布する母集団から、資料$$x$$を$$n$$こ抽出して求めた$$x$$の平均値$$\bar{x}$$の分布は?またその分布から何がわかるか? **ノーマルチップス シューハートのノーマル・チップス(表27)をグラフ化すると以下のような正規分布になる。 #image(2008y08m19d_120650316.jpg) 図1.シューハートのノーマル・チップス。総枚数998枚。 平均値30、標準偏差10の正規分布。 この中から無作為にチップを抜き出す行為は、$$m$$が30、$$\sigma$$が1の正規分布する母集団から試料を抽出することに値する。このときの$$\bar{x}$$の分布はどのようになるか? **シミュレーション よくかきまぜた998枚のチップから無作為に1枚を抽出し、再び箱の中に戻し、さらによくかきまぜて1枚を取り出す行為を5回繰り返す。取り出した5枚を1組として試料平均値$$\bar{x}$$を記録する(正規母集団から無作為に5個の試料をサンプリングして試料平均値を算出)。 →この操作100組のデータが表29(p.74)である。     平均値$$\bar{x}$$の平均値=29.70     平均値$$\bar{x}$$の標準偏差=4.65 **$$\bar{x}$$の分布 表29のデータの度数分布図(図30)からわかること。 +母集団の平均値30日回試料平均値の頻度が多い。しかし、少数ながら、18や40のように離れた数値も存在する。 +$$\bar{x}$$=29.7で$$m$$=30に近い。→試料平均値が母集団の平均値の良い推定値になる。 +$$\bar{x}$$の分布の標準偏差→不偏分散$$s^2$$より求める。$$s$$=4.65となり、母集団の標準偏差10よりも小さい(重要!) **推定の制度と$$\bar{x}$$の標準偏差 試料平均値の分布の標準偏差とは何を意味するのか?→試料平均値から母集団平均値を推定する精度。 「母平均値$$m$$、母標準偏差$$\sigma$$の正規分布する母集団からn個の試料を抽出して試料平均値$$\bar{x}$$を求めると、$$\bar{x}$$は平均値$$m$$で標準偏差が$$\sigma/\sqrt{n}$$の正規分布となる。」 #image(2008y08m19d_120844025.jpg) 図2.正規母集団分布→試料平均値の分布→t分布への変換 (佐藤信「推計学のすすめ」p.78) →$$n$$が大きくなればなるほど、$$\bar{x}$$の精度はよくなる(図2の(ロ))。しかし、図32(p.79)に示すように、$$n>$$30になると、制度の向上は小さくなる。(サンプル数の目安になる?) **$$t$$分布を導く 母平均値$$m$$、母標準偏差$$\sigma$$は、一般的には不明である。→試料平均値$$\bar{x}$$および試料平均値の標準偏差$$s$$から母集団が推定できるか? 以下の操作を行う。 試料平均値と母平均値との差 $$\bar{x}-\mu$$ この差を$$\bar{x}$$の標準偏差の単位ではかると考えると、   $$\bar{x}-\mu$$ ―――――――――――  $$\bar{x}$$の標準偏差 ただし、$$\bar{x}$$の標準偏差は$$\sigma/\sqrt{n}$$であるが、$$\sigma$$も未知であるため、$$s$$で代用する。 $$\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}$$ この式は、図31(ハ)に示すように、$$\bar{x}$$の分布を平均値0、標準偏差1の分布に基準化したことに相当する。→$$t$$分布(p.56,58の図20,21に示した正規分布の基準化の手続きと比較せよ。$$t$$分布と正規分布の相違点は$$\sigma$$の代わりにその推定値$$s$$を用いている点である)。 **$$t$$分布表(p.82) #image(2008y08m19d_120904632.jpg) 図33 $$t$$分布表 自由度(n-1) (佐藤信「推計学のすすめ」p.82) $$t$$分布表…$$t$$分布の中心0から$$t$$以上はなれた値が出現する確率を分布の面積で表したもの。例えば、自由度3のとき、両裾の斜線部分をあわせた面積が5%となる$$t$$の絶対値は、$$t$$=3.18となる。 $$t$$分布は、母集団から試料を抽出する数$$n$$によって、分布の形が変形する。→標準偏差が1/$$\sqrt{n}$$の割合で変化するため。 **$$t$$分布による検定 p.85では、2杯の試料から「バー・エックスのシングル1杯は30mLである」という仮説が棄却できるか?を問題としている。 $$n$$=2の場合バー・エックスのシングル1杯が30mLであるとはいえないという結論に達した(仮説は捨てられない)が、$$n$$の数を増やすと$$\bar{x}$$の精度が増すため、仮説を捨てられる可能性がある。このように、一度仮説が捨てられない結果が得られ、実験制度に不備の可能性があると考えられる場合は、実験計画の見直し、試料を増やすなどの再実験が必要である。 ***自由度(Degree-of-freedom)の定義 一般に、変数のうち独立に選べるものの数、すなわち全変数の数から、それら相互間に成り立つ関係式(束縛条件、拘束条件)の数を引いたもの。自由度1といった具合に表現する。 自由度は、力学・機構学・統計学などで使用され、意味は上記の定義に順ずるが、それぞれの具体的に示唆する処は異なる。 統計学では、各種の統計量に関して自由度が定義される。大きさ$$n$$の標本における観測データ$$(x_1, x_2, ... , x_n)$$の自由度は$$n$$とする。それらから求めた標本平均についても同様である。 不偏分散$$s^2=\frac{\sum_{i=1}^n(\bar{x}-x_i)^2}{n-1}$$については、$$\bar{x}=\frac{1}{n}\sum_{i=1}^nx_i$$という関係式(ここで$$\bar{x}$$は母集団平均$$\mu$$の推定量である)があるから、自由度は1少ない$$n$$-1となる。そのため分母には$$n$$-1を用いる。 ----

表示オプション

横に並べて表示:
変化行の前後のみ表示: