統計データのグラフ表現 – 定義


この記事はシリーズの一部です
小学校数学
代数
分析
算術
ジオメトリ
論理
確率
統計的

統計調査の結果は、多数のグラフ表現を生み出す可能性があります。

数値と周波数の表現。

一般的な規則として、厚みのない表現 (棒グラフ) と厚みのある表現が区別されます。

  • 厚さのない表現では、周波数 (または周波数) は高さに比例します。
  • サーフェスが存在するとすぐに、有効 (または周波数) は面積に比例します。

離散変数の場合

離散的な量的変数の場合、

私たちは棒グラフを好みます。

画像:diagram_in_batons.png

記事「離散初等統計」の棒グラフ

しかし、時々厚い表現が現れるのを見かけます。

  • 模式図。数値は、調査対象の人口を思い出させる画像 (シルエット、建物など) によって表されます。これらの画像のサイズは、サイズに比例します。そうすると、誤った表現や誤解が生じる危険性があります。数値の 2 倍が単一方向の画像の 2 倍の伸びにのみ対応する場合は、面積の法則が尊重されます。しかし、数値の 2 倍が画像サイズの 2 倍に相当する場合、人間の目は実際には 4 倍 (が 2 倍、高さが 2 倍) であると認識します。その場合、グラフィック表現の解釈は歪められます。
  • 長方形の図。長方形の底辺が同じ場合、高さは面積の法則に従って数値に比例します。
  • 棒グラフの頂点を結ぶ多角形を追加します。グラフィック表現を滑らかにするこの試みは、面積の法則を完全に尊重しているわけではありません(多角形の下の面積が数や頻度に完全に対応しているわけではありません)が、確率密度曲線に近づく曲線を提示するという利点があります。

質的変数の場合、

私たちは、円グラフ(離散初等統計の記事を参照)、半円形、または長方形と呼ばれる円形の図を頻繁に使用します。上記の危険性をイメージした図もあります。

連続変数の場合

面積の法則を尊重したヒストグラムを使用します。危険を回避するには、振幅が一定のクラスを使用することが望ましいです。この場合、長方形の高さは数値 (または頻度) に比例します。可変振幅のクラスの場合は、より複雑であることが判明し、連続初等統計で扱われます。また、連続変数についても、エリア ルールで同じ予約を使用して平滑化を試みることがわかります。

累積数値の表現。

連続変数の場合、累積数 (または頻度)の多角形を描画できます。プロットの原理については、「初歩的な連続統計」の記事で説明されています。この多角形を使用すると、[ x 1 , x ]の形式の区間の数と、その違いによって任意の区間の数を非常に迅速に読み取ることができます。また、四分位数と十分位数をすばやく読み取ることもできます。この表現は、確率分布関数のプロットを事前に示します。

離散変数に対して累積数値の多角形が表示されることがあります。厳密に言えば、階段図を描く必要があるでしょう。

この表現は主に 2 つの変数を含む統計系列で発生します。

また、地理地図や気象地図でも識別しにくくなります (落雷の影響、人口密度、産業の存在など)。この数値は、ポイントサイズまたは背景に関連付けられます。




箱ひげ図

この図は、調査対象の文字の位置特性の一部 (中央値、四分位数、最小値/最大値、または十分位数) のみを要約したものです。これは主に、サイズの異なる 2 つの集団の同じ形質を比較するために使用されます。これには、第 1四分位から第 3 四分位まで、中央値交差する長方形を描画することが含まれます。最小/最大値、または最初と 9番目の十分位までの端にセグメントを追加することがあります。これは、箱ひげ図またはレッグ図と呼ばれます。



D 1 / D 9箱ひげ図との比較
Q1 = 3、M = 7、Q3 = 12、 D 1 = 1D 9 = 16
Q1 = 7、M = 9、Q3 = 12、 D 1 = 1D 9 = 16

スパークライン

スパークラインは、ページ上のテキストに挿入できるミニグラフィック用に Edward Tufte によって開発された形式です。

Tufte 氏は、スパークラインを「データ集約型、シンプルなデザイン、ワードサイズのグラフィックス」と表現しています。一般的なグラフはできるだけ多くのデータを表示するように設計されており、テキストの流れからは除外されています。スパークラインは簡潔で記憶に残り、適切な場所に正確に配置されます。

スパークライン
米国株式市場の動き (2006 年 2 月 7 日)
索引価値交換
画像:スパークライン dowjones.svg
ダウ・ジョーンズ10765.45 −32.82 (−0.30%)
画像:スパークライン sp500.svg
S&P500 1256.92 −8.10 (−0.64%)
ナスダック2244.83 −13.97 (−0.62%)
  1. تصوير بيانات – arabe
  2. Визуализация на данни – bulgare
  3. উপাত্ত ও তথ্য প্রত্যক্ষীকরণ – bengali
  4. Visualització de dades – catalan
  5. Vizualizace dat – tchèque
  6. Datavisualisering – danois

統計データのグラフ表現 – 定義・関連動画

サイエンス・ハブ

知識の扉を開け、世界を変える。