中心極限定理というのは大ざっぱにいって次のような定理のことです。
平均
、分散
である
何らかの分布からサンプリングされたデータの平均値は、平均が
で分散が
/(サンプリング数)の正規分布に従う。
実際にはサンプル数が無限大という制限がありますが、別に無限大じゃなくても十分に大きければ漸近的に正規分布します。
どんな分布をする集団でも半ば強引に正規分布にしてしまえるこの定理は統計学において極めて重要なもので、ノンパラメトリック(分布に関するパラメータを使わない)を称する検定の多くも統計量が漸近的に正規分布することを利用していたりします。
…とだけ言っても何のことやら分からないかもしれませんので、以下で多少丁寧にその中身を確認していきましょう。
母集団の設定
確認していきましょう、とか偉そうなことを言ってはみましたが、別に中身が理解できているわけでも証明ができるわけでもありません。
ただ状況の再現はできます。要するに適当な母集団を設定してそこから何度もサンプリングをし、平均値を何度も計算し、平均値が本当に正規分布に従って分布するのかを確認してみるわけです。
最終更新:2008年08月16日 01:34