中心極限定理について詳しく解説

中心極限定理(または: 中心極限。フランス語では中心極限定理と呼ばれることが多い) は、確率における一連の確率変数の弱い収束に関する一連の結果です。直観的には、これらの結果によれば、独立した同一分布の確率変数の合計は、特定の確率変数に向かう傾向があります。最もよく知られ、最も重要な結果は単に「中心極限定理」と呼ばれ、その数が無限大になる傾向のある確率変数の合計に関係します。

定理の実証のために以下で考察する最も単純なケースでは、これらの変数は独立しており、同じ平均と同じ分散を持ちます。一般に、項の数が増加すると、合計は無限に増加します。最終的な結果を取得するには、平均を減算してこの合計を中心にし、標準偏差で割って合計を減らす必要があります。かなり広範な条件下では、確率法則は単一正規法則に収束します。正規法則の遍在性は、ランダムと考えられる多くの現象が多数の原因の重ね合わせによるものであるという事実によって説明されます。

この単純なケースでは、次数 3 のモーメントの存在によって収束が保証されます。同一の法則を必要としない一般化がいくつかありますが、どの変数も他の変数よりも著しく大きな影響を及ぼさないことを保証する条件が必要です。これらは、リンデバーグ条件とリアプノフ条件です。他の一般化では、「弱い」依存性も許容します。さらに、Gnedenko と Kolmogorov による一般化では、1/| に従って減少する分布の裾を持つ特定の数の確率変数の合計が求められると述べています。 × | 0 < α < 2 の^α+1 (したがって、無限の分散を持つ) は、変数の数が増加すると、対称で安定したレヴィの法則に向かう傾向があります。この記事では、有限分散の法則に関する中心極限定理に焦点を当てます。

「」中心極限定理

X ₁ 、 X ₂ … を、同じ確率空間上で定義され、同じD法則に従い独立した確率変数のセットとします。 Dの期待値μと標準偏差σ が存在し、有限であると仮定します (

$$ {\sigma \neq 0} $$

）。

合計S _n = X ₁ + … + X _nを考えてみましょう。この場合、 S _nの期待値はn μ で、その標準偏差は σ n ^1/2です。さらに、非公式に言うと、 n が無限大になる傾向がある場合、 S _nの法則は正規法則 N( n μ,σ ² n ) に従う傾向があります。

この収束の考え方を明確にするために、次のような問題を提起します。

$$ {Z_n = \frac{S_n – n \mu}{\sigma \sqrt{n}}.} $$

Z _nの期待値と標準偏差はそれぞれ 0 と 1 になります。

次に、 Z _nの法則は、 n が無限大に近づく傾向がある場合、縮小中心正規法則 N(0,1) に収束します (これが法則の収束です)。これは、Φ が N(0,1) の分布関数である場合、任意の実数zに対して次のことを意味します。

$$ {\lim_{n \to \infty} \mbox{P}(Z_n \le z) = \Phi(z),} $$

または、同等に:

$$ {\lim_{n\to\infty}\mbox{P}\left(\frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}}\leq z\right)=\Phi(z)} $$

または

$$ {\overline{X}_n=S_n/n=(X_1+\cdots+X_n)/n} $$

中心極限定理の証明

統計と応用確率においてこれほど重要な定理については、特性関数を使用した特に簡単な証明があります。この実証は、大数の法則の 1 つに似ています。期待値 0、分散 1 の確率変数Yの場合、 Yの特性関数は限定的な展開を許容します。

$$ {\varphi_Y(t) = 1 – {t^2 \over 2} + o(t^2), \quad t \rightarrow 0.} $$

Y _{i に}価値がある場合

$$ {\frac{X_i – \mu}{\sigma}} $$

とすると、観測値X ₁ 、 X ₂ 、…、 X _nの縮小中心平均が単純に次のようになることが簡単にわかります。

$$ {Z_n = \frac{\overline{X}_n-\mu}{\sigma/\sqrt{n}} = \sum_{i=1}^n {Y_i \over \sqrt{n}}.} $$

特性関数の基本的性質によると、 Z _nの特性関数は次のようになります。

$$ {\left[\varphi_Y\left({t \over \sqrt{n}}\right)\right]^n = \left[ 1 – {t^2 \over 2n} + o\left({t^2 \over n}\right) \right]^n \, \rightarrow \, e^{-t^2/2}} $$

いつ

$$ {n \to +\infty.} $$

しかし、この極限は縮小中心正規法則 N(0,1) の特性関数であり、そこからレヴィの連続定理のおかげで中心極限定理が導き出されます。この定理は、特性関数の収束は法則の収束を意味すると述べています。

限界に向かって収束

次数 3 E[(X – μ) ³ ] のモーメントが存在し、有限である場合、収束は一様であり、収束速度は少なくとも次数 1/ n ^1/2になります (ベリー・エッセンの定理を参照)。

元の分布と 3 つの連続する合計 (畳み込みによって取得) の分布を示す、合計によって平滑化された分布の画像:

実際の応用では、この定理により、特に、かなり大きいが有限数の確率変数の合計を正規近似に置き換えることが可能になり、一般に扱いやすくなります。したがって、合計がどのように制限に近づくのかを見るのは興味深いことです。使用される用語については、「確率変数」で説明されています。

連続変数の合計は、その確率密度が正規限界の確率密度と比較できる連続変数です。

離散変数の合計を使用すると、確率の擬似密度を定義すると便利な場合がありますが、最も効果的なツールは棒グラフで表される確率関数です。 2 つの図の間には一定の一貫性があることが視覚的にわかりますが、解釈するのは困難です。この場合、分布関数を比較する方が効率的です。

一方、正規近似は中心値付近で特に効果を発揮します。正規法則への収束に関しては、無限は 6 から始まることが多いとさえ言う人もいます。

これらの中心値から遠ざかるにつれて、精度は低下します。これは、本質的に正である変数の合計に特に当てはまります。正規法則では、確率は低いがゼロではない負の値が常に明らかになります。たとえそれほど衝撃的ではなかったとしても、それはあらゆる状況において真実であり続けます。物理量は必然的に制限されますが、無限の区間をカバーする正規法則は有用な近似値にすぎません。

最後に、合計の項数が指定されている場合、分布がより対称的になるため、正規近似の方がさらに優れています。

数理統計への応用

この確率定理には、数学統計学における解釈があります。後者は確率法則を母集団に関連付けます。したがって、母集団から抽出された各要素は確率変数とみなされ、これらの独立した変数を n 個まとめることで、サンプルが得られます。これらの確率変数の合計を n で割ると、経験的平均と呼ばれる新しい変数が得られます。これは、一度減少すると、n が無限大に向かう傾向がある場合、正規変数が減少する傾向があります。

定理の他の定式化

確率密度

いくつかの独立変数の合計の確率密度は、それらの密度 (存在する場合) の畳み込みによって取得されます。したがって、中心極限定理は畳み込みの対象となる確率密度の特性の定式化として解釈できます。以前に確立された条件の下では、特定の数の確率密度の畳み込みは、その数が無限に増加すると正規密度に向かう傾向があります。

畳み込みの特性関数は問題の変数の特性関数の積であるため、中心極限定理は別の方法で定式化できます。前述の条件下では、いくつかの確率密度の特性関数の積は、変数の数が無限に増加する場合の正規法則の特性関数。

確率変数の積

中心極限定理は、独立した確率変数の合計に関して何を期待すべきかを教えてくれます。しかし、製品はどうでしょうか？積の対数は因子の対数の合計にすぎないため、確率変数の積の対数は正規分布になる傾向があり、結果として積自体の対数正規分布が均等になります。多くの物理量 (特に質量と長さ、これは次元の問題であり、負になることはできません) はさまざまなランダム係数の積であるため、対数正規の法則に従います。

中心極限定理

リアプノフ状態

X _{n を}同じ確率空間上で定義された変数のシーケンスとする。 X _{n が}有限の期待値 μ _nと有限の標準偏差 σ _{n を}持つと仮定します。定義します

$$ {s_n^2 = \sum_{i = 1}^n \sigma_i^2.} $$

次数 3 の中心モーメントが次のようになると仮定します。

$$ {r_n^3 = \sum_{i = 1}^n \mbox{E}\left({\left| X_i – \mu_i \right|}^3 \right)} $$

すべてのnとそれについて有限です

$$ {\lim_{n \to \infty} \frac{r_n}{s_n} = 0.} $$

(これはリアプノフ条件です)。

もう一度合計S _n = X ₁ +…+X _nを考えてみましょう。 S _nの数学的期待値はm _n = ∑ _{i =1.. n} μ _iとその標準偏差s _nです。 S _{n を}設定して正規化すると

$$ {Z_n = \frac{S_n – m_n}{s_n}} $$

その場合、 Z _nの法則は、上記のように縮小中心正規法則 N(0,1) に収束します。

リンデバーグ状態

以前と同じ定義と同じ表記を使用して、リアプーノフ条件を次のより弱い条件に置き換えることができます (Lindeberg 1920)。すべてのε > 0

$$ {\lim_{n \to \infty} \sum_{i = 1}^{n} \mbox{E}\left( \frac{(X_i – \mu_i)^2}{s_n^2} : \left| X_i – \mu_i \right| width=} $$

\epsilon s_n \right) = 0″ >

ここで、 E( U : V > c ) は条件付き期待値、つまりV > cという条件の下でのUの期待値を表します。次に、 Z _nの法則は縮小中心正規法則 N(0,1) に収束します。

従属変数の場合

従属変数の和の場合を扱う定理がいくつかあります。たとえば、 m 依存の中心極限定理、マルチンゲールの中心極限定理、混合過程の中心極限定理などです。

この定理の興味深い点

一般の報道では、釣鐘曲線が偶然の法則を表していると書かれていることがありますが、これにはほとんど意味がありません。ガウスの法則の比類のない成功は、中心極限定理の直接の結果であり、この法則の使用が比較的容易であることによって強化されています。

それ自体、確率変数の数が無限大に向かう傾向がある場合に、多数の確率変数の合計が正規法則に収束すること自体が、数学者の興味を引くだけです。実践者にとって、限界の少し前で停止するのは興味深いことです。これらの変数の多数の合計はほぼガウス関数であり、多くの場合、正確な法則よりも簡単に使用できる近似値が得られます。

理論からさらに離れると、かなりの数の自然現象は、多かれ少なかれ独立した多数の原因の重ね合わせによるものであると言えます。したがって、通常法則はそれらを合理的に効率的に表すということになります。

逆に、特定の限界 (特に正の値を持つ場合) を超えることができないため、具体的な現象は真にガウス的ではないと言えます。