Central Limit Theorem; center of the Probability Theory.
The Central Limit Theorem; the cornerstone of Probability Theory.
In this Iwashi Blog post, we’ll talk about the Central Limit Theorem, well-known in probability theory and statistics.
To roughly explain the Central Limit Theorem, when we take samples X_1, ・・・, X_n, ・・・from any probability distribution F )with mean and variance, as n grows larger and larger, the distribution ( F_n ) of the sample mean Y_n from X_1 to X_n approaches approximately a normal distribution.
How powerful and useful this theorem is!
Firstly, let’s consider what would happen if this Central Limit Theorem didn’t exist.
In the realm of physics, various statistics are used, with over 25 different probability distributions being mentioned.
If this Central Limit Theorem didn’t exist, when aggregating various experimental data and conducting statistical tests, setting significance levels would require discussing each time according to the respective probability distribution.
Furthermore, this discussion assumes knowledge of the underlying probability distribution. However, generally, we might not know what distribution the data resulting from physical experiments follows.
With this uncertainty, analyzing experimental data becomes difficult.
However, by utilizing the Central Limit Theorem, regardless of the nature of experimental data, if we take sample means and normalize them, we can assume that they approximately follow a standard normal distribution and proceed with discussions based on that assumption.
This applies not only to physics but to every field using statistics.
Therefore, the Central Limit Theorem is a fundamental theorem in probability theory and statistics.
However, on the other hand, following the mathematical rigorous proof of the Central Limit Theorem can be quite challenging.
In reality, to do so, one needs to study measure theory and acquire fundamental knowledge of probability theory (such as expectations, moments, Fourier transforms).
As for me, I learned the Central Limit Theorem from “Central Limit Theorem / by Yoshikazu Shimizu,” published by educational publishers.
Of course, before learning from this book, I studied measure theory in “Mathematical Analysis” by Bourbaki.
There’s an episode associated with this: while reading this book on the Central Limit Theorem, I encountered a non-trivial point, so I contacted the educational publisher, who arranged for me to directly inquire with the author, Professor Yoshikazu Shimizu.
Upon contacting Professor Shimizu, I received a detailed explanation in a letter, which was deeply moving.
I also received words of gratitude from Professor Shimizu: “Thank you for carefully reading my book.”
At that time, I hadn’t yet obtained my degree, but it’s a beautiful memory.
[日本語訳]
今回のイワシブログでは, 確率論や統計理論でお馴染みの, 中心極限定理についてお話します.
中心極限定理をざっくり説明すると, 平均と分散の存在する任意の確率分布 F から標本 X_1, ・・・, X_n, ・・・を取った時, n をどんどん大きくしていくと, X_1 から X_n までの標本平均 Y_n の分布 F_n が近似的に正規分布に近づく, という定理です.
この定理がどれだけ強力で有用な定理なのか.
まず, もし, この中心極限定理がなかったらどうなるだろうか, ということを考えてください.
物理学の世界でも, 様々な統計を使いますが, 確率分布だけで 25種類以上あると言われています.
もしこの中心極限定理がなかったならば, 様々な実験データを集計し,
統計的検定にかける際に, 有意水準の設定の際に, その都度, その確率分布に応じた議論をしなくてはなりません.
しかも, 対象となる確率分布があらかじめわかっていればの話です. しかし, 一般には, 物理実験の結果得られたデータが, どのような分布に従うのかもわかりません.
こんなことでは実験データの解析などできません.
しかし, 中心極限定理を使うと, 実験データの素性によらず, 標本平均を取って正規化してしまえば, それらのbぷは近似的にではありますが, 標準正規分布に従うと仮定し, その前提で話を進めても良いわけです.
このことは物理学だけではなく, 統計学を使うあらゆる分野に言えることです.
従って, 中心極限定理は, 確率論や統計理論において, 中核を成す定理です.
しかし一方で, 中心極限定理の数学的な厳密な証明をフォローするのは, 結構ハードルが高いです.
実際にそのためには, 測度論を勉強し, 確率論の基礎的な部分 (期待値, モーメント, フーリエ変換など) を知識士として仕入れないといけないからです.
かくいう私は, 教育出版から出ている『中心極限定理 / 清水良一著』で中心極限定理を学びました.
もちろん, この本で学ぶ前には, ブルバキ『数学原論』で測度論を勉強しています.
これにはエピソードがあって, この中心極限定理という本を読んでいて, 一箇所自明でない箇所があったので, 出版社の教育出版に問い合わせたところ, 著者の清水良一先生に直接お尋ねするよう, お取り計らいを受けました.
清水先生に問い合わせたところ, 清水先生からは丁寧な解説のお手紙をいただき, 大変感激した次第です.
清水先生からのお礼のお言葉も賜りました:『私の本を丁寧に読んでくださり, お礼を申し上げます.』
この当時私はまだ学位を取っていなかったのですが, とても美しい思い出です.
コメントを残す