位置基準 – 定義

導入


代数
論理
算術
確率
統計

(特定の統計的特徴の数値の)セット位置基準は、このセットの位置をグローバルに特徴付ける計算値です。たとえば、平均、最頻値、中央値、分位数 (四分位数、十分位数) です。 ) ベルギーの数学用語では、中心値とも呼ばれます。

統計では、通常、多数の値に直面します。ただし、これらすべての値が情報を構成する場合、数百、さらには数千の数字を操作したり、そこから結論を導き出すのは簡単ではありません。したがって、データを分析できるようにするためにいくつかの値を計算する必要があります。

物理的な測定(計測学) では、通常、測定の「値」を表す平均と、測定誤差を推定する標準偏差の 2 つの値を計算します。他の領域では、値の分布をより詳細に記述する必要があるため、他の位置を計算します。

位置基準 - 定義

最大値と最小値

最大値は、統計的特徴によってとられる最大値です。

最小値は、統計的性質によってとられる最小値です。

平均

ソートされているがグループ化されていない離散統計系列のケース

$$ {\overline{x}=\dfrac{1}{n}\sum_{i=1}^{n}x_i} $$

この公式については、 「離散初等統計」の記事で説明されています。

位置基準 - 定義

グループ化された離散統計系列の場合

$$ {\overline{x}=\dfrac{\sum_{i=1}^{N}n_ix_i}{\sum_{i=1}^Nn_i}=\sum_{i=1}^Nf_ix_i} $$

この公式については、「離散初等統計」の記事で説明されています。

継続シリーズの場合

$$ {*\overline{x}=\dfrac{\sum_{i=1}^{N}n_im_i}{\sum_{i=1}^Nn_i}=\sum_{i=1}^Nf_im_i} $$

この公式については、 「連続初等統計」の記事で説明されています。

アフィン変換による安定性

平均はアフィン変換によって安定します。つまり、 if y i = a x i + b 、if

$$ {\overline{x}} $$
が系列 x の平均である場合、系列 y の平均は次のようになります。
$$ {\overline{y} = a\overline{x}+b} $$

このプロパティ単位を変更するのに役立ちます。平均気温華氏でわかっている場合、平均を摂氏で計算するためにすべての値を摂氏に変換する必要はなく、平均のみを変換するだけで十分です。

数値のサイズを制限して、推定平均から開始してd i = x iM e s t i mの平均を計算することも興味深いです。 。それで

$$ {\overline{x} = M_{estim.} + \overline{d}} $$

部分母集団の分割

母集団がサイズn 1およびn 2の 2 つの部分母集団P 1およびP 2に分割される場合、母集団P 1の統計的特徴の平均は次のようになります。

$$ {\overline{x_1}} $$
そして母集団P 2の平均は次のようになります。
$$ {\overline{x_2}} $$
この場合、母集団 P の平均は次のようになります。
$$ {\overline{x} = \dfrac{n_1\overline{x_1}+n_2\overline{x_2}}{n_1+n_2}} $$

極端な値に対する敏感さ

平均は、極端な値または外れ値の影響を受けやすくなります。

: ある会社では、従業員 9 名に月給 2000 ユーロが支払われています。上司は月々 22,000 ユーロを自分自身に支払っています。

これらの条件下で平均を実行すると、代表的ではない値が得られます。

$$ {\overline{x}=\dfrac{9\times2000+22000}{10}=4000} $$
ユーロ。

このタイプの罠を回避するために、母集団を意図的に切り捨てて、最低値の 10% と最高値の 10% を削除することがあります。

中央値

中央値は、母集団を同じサイズの 2 つの母集団に分割する傾向があります。 m が中央値の場合、統計的性質が m より小さい個人の数は、統計的性質が m より大きい個人の数に対応する必要があります。この定義が連続変数の場合に適合しない場合は、この定義は適用されません。別の定義が与えられた離散変数の場合 統計的特徴の値がすべて異なる場合、離散の場合に定義されているように、中央値は母集団を 2 つに分割しますが、これは必ずしも 2 つに分割されるわけではありません。統計的特徴の特定の値が複数回取得された場合。

位置基準 - 定義

離散変数の場合

値を昇順に並べ替えます。

  • 母集団に n 人の個人が含まれており、n が奇数の場合、n = 2p+1 となり、中央値は統計的特徴の (p+1)番目の値になります。
: 一連の 13音符4、5、7、8、8、9、10、10、10、11、12、13、16。
中央値 = M = 10
  • 母集団に n 人の個人が含まれており、n が偶数の場合、n = 2p となり、中央値は統計的特徴の p e値と (p+1) e値の間の平均になります。
例: 一連12 音符: 4、5、7、8、8、9、10、10、10、11、13、16
中央値 = M = 9.5

連続変数の場合

増加する累積頻度の多角形と対応するテーブルを使用し、グラフまたは線形補間によって、間隔 [最小値、M] の頻度が 50% となる値 M を決定します。

増加する累積頻度ポリゴンの使用

連続初等統計で開発された例では、累積頻度の多角形は次のとおりです。

方程式y = 50 の直線は​​、ほぼ横座標 21 ので多角形と交差します。M

$$ {\approx} $$
21.

注: 増加する累積頻度の多角形と減少する累積頻度の多角形は、横座標が中央値である点で正確に交差します。

累積増加頻度テーブルの使用

前の例では、増加する累積頻度のテーブルは次のとおりです。

x i 0 8 12 16 20 30 40 60
累積頻度の増加0 7 12.3 21.1 48.1 81.7 94.7 100

50% は 20 ~ 30 の間で達成されます。したがって、値 M は次のように推定されます。

$$ {20+10\dfrac{50-48,1}{81,7-48,1}= 20,56} $$
線形補間による。

  1. Критерий – bulgare
  2. Criteri – catalan
  3. Criterion – cebuano
  4. Kritérium – tchèque
  5. Kriterium – danois
  6. Criterion – allemand

位置基準 – 定義・関連動画

サイエンス・ハブ

知識の扉を開け、世界を変える。