記述統計学とは? descriptive statistics 【図解】
英語: descriptive statistics 中国語:描述统计学
記述統計学の目的
要約統計量を計算したり、図的表示を行うことにより、データーの持ち情報を把握すること。
簡単に言うとデータを分かりやすい形に変換して、特徴を理解するための手法のことです。データから平均値を導いたり、分散を出したりするのが、記述統計の内容です。
関連記事:推測統計学
記述統計学のやり方&例題
例として、学校で 5 教科のテストの結果の評価です。
5 つのテスト全てにおいて、80 点以上をとる事ができましたが自慢できるでしょうか?
こんなときよく使うのが、平均値をだす方法です。すべてのデータの数値を足して、データの数で割ったら完了です。たったこれだけの計算で、平均値という 1 つの便利な数値が計算できます。
この 1 つの数値をもって、全員のテストの評価を定量的に測る事ができます。このようにたくさんのデータを、分かりやすい形に変換することを、記述統計と呼びます。 今回の事例では、全体の特徴を理解するために、平均値を使いました。平均値は記述統計の 1 つです。
又、グラフに変換するという行為も、記述統計にあたります。 分かりにくいデータを変換して、特徴を掴みやすい形に直しているものは、全て記述統計にあたります。
記述統計は、平均値を出したり、グラフで可視化したりする他にも、たくさんあります。中央値、最頻値、分散、標準偏差、共分散、相関係数、など、データの特徴を掴むための数値はたくさんあります。
記述統計とは、「データを元に分かりやすい指標や基準を生み出す手法」です。
記述統計量の種類
数量データの分布をあらわす記述統計量として、最小値と最大値もあります。 これらはその名の如く、出現したデータ中における、最も小さい値と、最も大きい値のことです。 最小値と最大値がわかれば、その変数がどれだけの範囲に散らばっているかを理解できます。
また、平均値や中央値を始めとする代表値を求めることも、データを分かりやすく表現する手段として有力です。
記述統計と推測統計 違い
記述統計学では母集団と標本の区別がなく、ほぼ標本≒母集団とみなします。
そのため統計できる範囲が標本そのものに留まりデーターがない場合は統計ができません。
例えば日本人の平均身長を知りたい場合、全ての日本人の身長を測定することは不可能なので記述統計学では分析できません。
一方推測統計では、一部のデータから母集団を見極めるので、標本<母集団となり、わずかな標本から元の大きなデータを統計できることになります。
例えば日本人の平均身長を知りたい場合、日本人全体の人口から、必要な最低限必要な標本数を求めます。必要な標本数以上のデータを集めたら、”推定”と呼ばれる手法で標本から母集団を推測します。
これが記述統計と推測統計の大きな違いです。
推測統計は、記述統計の内容をもとにしています。記述統計の内容は、あくまで推測統計をやるための土台です。
関連記事:統計学
ブックマーク