ホワイト企業と就職活動

ホワイト企業は労働法を遵守する

偏差値で模試の点数を比較する方法

スポンサーリンク

偏差値で模試の点数を比較する方法


正規分布

正規分布は不思議な分布で、データの数が多いと、たいていのものがこの分布になる。

ただし、正規分布といってもその形は様々。

正規分布の山の特徴を決めているパラメーターが平均値と標準偏差。

平均値が同じでも標準偏差が違う場合は、山の形が変わる。

標準偏差が同じでも平均値が違う場合は山の出現する位置が変わる。


データが正規分布するとき

( 平均値±. 標準偏差 ) の範囲に
約68.3%(0.6826)のデータが含まれる。

( 平均値±2標準偏差 ) の範囲に
約95.4%(0.9544)のデータが含まれる。

( 平均値±3標準偏差 ) の範囲に
約99.7%(0.9974)のデータが含まれる。


データの標準化(規準化)

データの標準化とは、もとの正規分布曲線の横軸を標準偏差の1倍、2倍、3倍・・・のような単位に変換し、データを比較しやすくする方法。

たくさん正規分布の山があったとき、それぞれの山の形や山の出現する位置が違うと、そのまま単純に比較することはできない。

そこで測定データから平均値を引き、標準偏差で割るという作業を行う。

この作業を標準化といい、データを標準化して得られた新しい変数Zは単位を持たず、その平均値は0で、標準偏差が1となる。


測定データ - 平均値
――――――――――― = Z
.   標準偏差

Z :標準化したデータ


データの標準化は、平均値を0に、標準偏差を1にすることである。

標準化したデータを使えば、どんな正規分布でも平均値0、標準偏差1の標準正規分布となる。

そうすると比較するのが楽になる。

標準正規分布

正規分布は記号でN(平均μ、分散σ2)と書かれ、特にN(0、1)は標準正規分布と呼ばれる。

N(μ、σ2)の正規分布は連続関数であるため、連続分布に含まれる。

平均値μ、分散σ2の任意の分布関数に従う互いに独立な確率変数Xi があるとき、Xiの平均値Σxi/nは、nが十分に大きければ、近似的に正規分布N(μ、σ2)に近づく。

つまり、母集団が正規分布に従わない場合でも、そこから多数サンプリングして平均すると、その平均値は正規分布に近づく。

測定値xが正規分布に従うときに、
z=(測定値-平均値)÷標準偏差
z= (x-μ)÷σ
と変換すると、
zはN(平均0、分散12)に従う標準正規分布となる。


偏差値

標準化を応用したのが「偏差値」である。

テストの平均点や標準偏差はテストを行うたびに違うため、普通だったら駿台模試や代ゼミ模試の点数をそのまま比較することはできない。

でも、偏差値を使えばテスト同士の比較ができる。


偏差値 = ( 10 × Z ) + 50

Zは平均値0、標準偏差1になるよう標準化したテストの点数。
偏差値はテストの点数を標準化した後で、 Zを10倍し、50を加えた数値。


偏差値は平均値50、標準偏差10の正規分布に従うよう、テストの点数を加工した数値を意味する。
平均点を取った生徒の偏差値は50になる。


偏差値は正規分布するので、

平均値±標準偏差(50±10)の範囲にデータの約68%が含まれる。
⇒ 残り32%は偏差値60以上の人と、
偏差値40以下の人に二分される。


平均値±2標準偏差(50±20)の範囲にデータの約95%が含まれる。
⇒ 残り5%は偏差値70以上の人と、
偏差値30以下の人に二分される。


平均値±3標準偏差(50±30)の範囲にデータの約99.7%が含まれる。
⇒ 残り0.3%は偏差値80以上の人と、
偏差値20以下の人に二分される。


正規確率紙

正規確率紙とは、ヨコ軸に測定値、タテ軸に累積相対度数の関係をプロットすると、この関係の直線性によって正規分布に従うかどうかを確認できるものである。

一般に、データが正規分布しているかを判断するときは、度数分布図を描いて対称性を判断する。