この記事はシリーズの一部です 小学校数学 |
| 代数 |
| 分析 |
| 算術 |
| ジオメトリ |
| 論理 |
| 確率 |
| 統計的 |
位置基準を探して統計的特徴の値がどこに位置するかを決定した後、これらの値の分散を決定することができます。
物理測定(計測学) では、このばらつきは標準偏差によって推定され、測定誤差の計算に使用されます。より一般的には、値がグループ化されているか、逆に分散しているかを知ることが重要です。これは、テストされた基準に関して母集団が均一であるかどうかを示します。
範囲
範囲は、統計的特性の最大値と最小値の差です。
- 範囲 = x m a x − x m i n

四分位範囲
四分位間範囲は、第 3 四分位数と第 1 四分位数の差です。
- 四分位範囲 = Q3 – Q1
四分位範囲は、最低値の 25% と最高値の 25% を除外した後の統計系列の範囲に対応します。
平均値付近の分散
平均を計算した後、
- $$ {e_i=x_i – \overline{x}} $$
平均偏差
最初の反射は、これらの差の平均を計算することです。しかし、平均の性質により、偏差の平均はゼロであることが保証されます。実際、これらの偏差には負のものもあれば正のものもあり、正の偏差の合計が負の偏差の合計を正確に補償します。したがって、符号から抽象化して、偏差の絶対値の平均を計算する必要があります。これを平均偏差と呼びます。
- 平均偏差 = $$ {\frac{1}{n}\sum_{i=1}^n|x_i-\overline{x}|} $$ソートされていない離散系列の場合。
- 平均偏差 = $$ {\frac{\sum_{i=1}^nn_i|x_i-\overline{x}|}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i|x_i-\overline{x}|} $$グループ化された離散系列の場合。
- 平均偏差 = $$ {\frac{\sum_{i=1}^nn_i|m_i-\overline{x}|}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i|m_i-\overline{x}|} $$連続シリーズの場合。
分散
絶対値を使用すると、数学では行き止まりになることがよくあります (絶対値関数は微分できないため)。差を正にするために、別のツールである2 乗を自由に使用できます。したがって、偏差の平均ではなく、偏差の二乗の平均を計算します。これを分散といいます。
- $$ {V=\frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2} $$ソートされていない離散系列の場合。
- $$ {V=\frac{\sum_{i=1}^nn_i(x_i-\overline{x})^2}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i(x_i-\overline{x})^2} $$グループ化された離散系列の場合。
- $$ {V=\frac{\sum_{i=1}^nn_i(m_i-\overline{x})^2}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i(m_i-\overline{x})^2} $$連続シリーズの場合。
絶対値がなくなることで、より単純な計算が可能になります。次の式で分散をより簡単に計算できることを示します。
- $$ {V=\frac{1}{n}\left(\sum_{i=1}^nx_i^2\right)-\overline{x}^2} $$ソートされていない離散系列の場合。
- $$ {V=\frac{\sum_{i=1}^nn_ix_i^2}{\sum_{i=1}^nn_i}-\overline{x}^2=\left(\sum_{i=1}^nf_ix_i^2\right)-\overline{x}^2} $$グループ化された離散系列の場合。
- $$ {V=\frac{\sum_{i=1}^nn_im_i^2}{\sum_{i=1}^nn_i}-\overline{x}^2=\left(\sum_{i=1}^nf_im_i^2\right)-\overline{x}^2} $$連続シリーズの場合。
これらの式は、手動計算に特に役立ちました。コンピューターを使用すると、コンピューターは少し時代遅れになります…

標準偏差
偏差を 2 乗すると、分散の単位は文字の 2 乗になります (文字がk gの場合、平均はkg gですが、分散はk g 2になります)。したがって、平均と分散を加算することは不可能です。分散。したがって、 σで示される標準偏差を定義しました。標準偏差は分散の根です (したがって、その単位は平均の単位と同じです。これは逸話のように思えますが、平均と標準偏差を加算する可能性は、特に信頼区間の計算では基本的です (以下を参照) )。
- $$ {\sigma=\sqrt{\frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2}} $$ソートされていない離散系列の場合。
- $$ {\sigma=\sqrt{\frac{\sum_{i=1}^nn_i(x_i-\overline{x})^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(x_i-\overline{x})^2}} $$グループ化された離散系列の場合。
- $$ {\sigma=\sqrt{\frac{\sum_{i=1}^nn_i(m_i-\overline{x})^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(m_i-\overline{x})^2}} $$連続シリーズの場合。
標準偏差の性質
- 翻訳による不変性。統計系列に定数を加算または減算しても、標準偏差は変更されません。 y i = x i + Cの場合、 σ y = σ xとなります。
- 定数を掛けることで安定します。系列に正の定数を乗算すると、標準偏差にも同じ定数が乗算されます。 y i = K x iの場合、 σ y = K σ xとなります。
- 標準偏差は常に正であり、統計系列が一定の場合はゼロになります。
- 極端な値に対する敏感さ。平均値と同様、標準偏差も極端な値や外れ値の影響を受けやすいため、標準偏差を計算する前にこれらの値を除去する必要がある場合があります。

相対標準偏差
同じ桁数を持たない 2 つの統計系列を比較するには、商を取得して標準偏差と平均を比較し、相対標準偏差を取得するとよい場合があります。
相対標準偏差は変動係数とも呼ばれることに注意してください
信頼区間または正規範囲
統計的特徴がほぼ釣鐘型のガウス正規分布を持つ場合、標準偏差はその完全な意味を持ちます。
- その間に$$ {[\overline{x}-\sigma;\overline{x}+\sigma]} $$、人口の68%であることがわかります。
- その間に$$ {[\overline{x}-2\sigma;\overline{x}+2\sigma]} $$、人口の95%が見つかりました。
- その間に$$ {[\overline{x}-3\sigma;\overline{x}+3\sigma]} $$、人口の 99.7% が見つかります。
これらの区間を、信頼水準 68%、95%、99.7% の正規範囲と呼びます。
最低限の質問
中央値は関数 f を次のように定義する値です。
- $$ {f(X)=\frac{1}{n}\sum_{i=1}^n|x_i-X|} $$グループ化されていないソートされた離散系列の場合。
平均値は関数 g を次のように定義する値です。
- $$ {g(X)=\sqrt{\frac{1}{n}\sum_{i=1}^n(x_i-X)^2}} $$ソートされていない離散系列の場合。
- $$ {g(X)=\sqrt{\frac{\sum_{i=1}^nn_i(x_i-X)^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(x_i-X)^2}} $$グループ化された離散系列の場合。
- $$ {g(X)=\sqrt{\frac{\sum_{i=1}^nn_i(m_i-X)^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(m_i-X)^2}} $$連続シリーズの場合。

