ホワイト企業と就職活動

ホワイト企業は労働法を遵守する

尺度と基本統計量についての話

スポンサーリンク

尺度と基本統計量についての話

データを取り扱うときには、間隔尺度、順序尺度、名義尺度などの間に大きな違いがあることを知っておく必要がある。

スケール(間隔尺度・比例尺度)とは

連続した数量のデータのこと。

最もレベルの高い尺度で、年齢、金額、距離、重さなどのデータが該当する。

スケールの特徴は等間隔を仮定することができることであり、あらゆる統計手法を適用することができる。

間隔尺度(距離尺度)とは

間隔尺度とは、任意の2点を定義して、一方をゼロとして定められた量。
表される量のゼロが物理的・化学的な無を意味しない。

間隔尺度の例

工業的に使われる多くの量が間隔尺度に当てはまる。たとえばセルシウス温度(摂氏温度)がその例である。

摂氏温度の0℃は便宜的なゼロであって、物理的な無には対応していない。
よって摂氏温度は間隔尺度である。


比例尺度とは

比例尺度とは、物理法則や科学法則に基づいた量。
その量がゼロであるということに科学的な「無」である意味が付加されているもののこと。

要するに、ゼロの意味が明確なものが比例尺度に相当する。

比例尺度の例は、私たちの日常に非常に多く存在する。
たとえば長さ〔m〕、質量〔kg〕、エネルギー〔J〕などがそれである。


順序尺度(序数尺度、順位尺度)とは

順序尺度とは、カテゴリ間に順位や順番に関する情報があるデータのこと。
計測される量の「順序のみに」意味を持つ。

例えば大きさを表す「大」「中」「小」には大きさの順番がある。

また、「1位」「2位」「3位」なども順序尺度のデータである。

順序尺度は観察される変数と数値を対応させる基準である。
例えば大きさを表す大、中、小には大きさの順番がある。

なお、順序尺度は質的なデータである。

順序尺度は、1:良い 2:普通 3:悪いのように順序に意味はある。

しかし、その間隔には意味がない尺度であり、対象に割り振られた数字は測定する性質の順序のみを表す。

順序尺度の例:モース硬度
鉱物の傷のつきにくさの尺度であるモース硬度(Mohs hardness)は滑石を1、ダイヤモンドを10としてこの間に8個の物質を定めている。
しかし、数値の差に物理的意味があるわけではない。


名義尺度とは

名義尺度は単に名前の代わりに数字を用いたもの.

名義尺度は野球選手の背番号のように数字の大小や順序に特別の意味のないもののことである。
名義尺度とは、尺度の中では最も単純なもので、事物を区別してそれに数字または符号を割り当てている。

名義尺度はカテゴリとも呼ばれるデータのことであり、区別するための情報であるともいえる。

名義尺度は量的な意味を持たず、質的なデータである。
仮に名義尺度に数値を用いても、数に量的な意味をもたせないで、単にほかと区別する標識としてのみ使用する。

名義尺度のカテゴリ間には順位や順番に関する情報はない。
例えば、性別には「男」と「女」の2種類があるが、これらに順番はない。


基本統計量(要約統計量)

基本統計量は、分布の特徴を代表的に(要約して)表す統計学上の値である。
それぞれの要約のためのモノサシを代表値と呼ぶ。

代表値の種類としては、平均値、中央値、最頻値、分散、標準偏差が挙げられる。

平均値や標準偏差を求めることによって、そのデータが属する母集団の特徴を明らかにすることができる。

平均値とは

平均値(mean value)とは、ばらつきのあるデータを平らにならしたもののこと。

平均値はデータの分布の中心的傾向を知るための代表値の一つである。

平均値は下式で表される。

Av = Sum / n

平均値 = 数量の合計 / 個数

数量の合計 = 平均 × 個数

中点値

中点値(ミドルレンジ、ミッドレンジ:midrange)とは、データ全体の最大値と最小値の平均のこと。

中央値とは

中央値(median:メジアン)はデータや分布の中央にある値のこと。
データが奇数個のときはそれらを大きさの順に並べたときの中央の値であり、
偶数個のときは中央二つの値の平均値となる。

中央値は平均値よりも外れ値の影響を受けにくいので、分布が左右非対称の時には中心的傾向の代表値として平均値よりも重宝されることがある。

最頻値とは

最頻値(mode:モード)データや分布の中で最も頻繁に出現する値のこと。

トリムドミーンとは

トリムドミーン(trimmed mean:刈り込まれた平均値)とは、データや分布の値を大きさ順に並べて、大きいほうと小さいほうを一定の割合で捨てて、残りの値から求めた平均値のこと。

トリム(trim:刈り込む)+ミーン(mean:平均)

トリムドミーンも中心的傾向の代表値であり、平均値よりも外れ値の影響を受けにくい。