ホワイト企業と就職活動

ホワイト企業は労働法を遵守する

連続分布と離散分布を理解する

スポンサーリンク

連続分布と離散分布を理解する

確率分布は連続分布と離散分布の2種類に分けられる。

分布
 ├1. 連続分布
 └2. 離散分布

1.連続分布

連続分布は計量値を取り扱う
連続分布には 正規分布、t分布、F分布、カイ2乗分布などがある。

1-1. 正規分布

左右対称な分布。
正規分布は不思議な分布で、データの数が多いと、たいていのものがこの分布になる。

正規分布は、平均値の信頼区間の推定や平均値の差の検定において、母集団の標準偏差が未知のときに用いられる。

1-2. t分布

左右対称な分布。
標準偏差が未知のとき適用。

データの数が多いと、たいていのものは正規分布になる。

しかし、データ数が少ない場合は正規分布ではなく、t分布と呼ばれる分布になる。

t分布は母集団からn個の標本をサンプリングし、その平均値の分布を考えたものであり、nが大きくなると正規分布に従う。

t分布は0を中心とした左右対称な分布で、データの数と関連する指標である自由度によって分布の形が異なる。

自由度が少ない時はt分布は正規分布よりも裾野が広い形をする。

自由度が大きいほどt分布は正規分布に近づき、自由度が30を超えると正規分布とほとんど同じと考えることができる。

t分布は、平均値の信頼区間の推定や平均値の差の検定において、母集団の標準偏差が未知のときに用いられる。


1-3. F分布

左右非対称の分布。
2組の母集団の分散の相違を検定するために用いられる。

F検定は、正規分布に従う母集団において両方の母分散が不明の場合、二つの標本の分散が等しいかどうかを判断する検定手法のこと。
等分散性の検定や分散分析で用いられる。


1-4. Χ2分布

左右非対称の分布。
標準偏差が分かっている場合に、母分散と標本分散の違いの検定に用いられる。


2. 離散分布:計数値を取り扱う


2-1. 2項分布

2項分布は、ある出来事が「起きるか、起きないか」という2通りの状況が繰り返された時、ある出来事が起こる回数とその確率の対応を表す確率分布。

2項分布は正規分布ではないが、標本数が多い場合に標本分布が正規分布に近似することを利用すれば、母集団の比率の推測を行うことができる。


2-2. ポアソン分布

事故発生件数の確率、故障率
ポアソン分布は左にかたよった山が一つあるのが特徴。

ポアソン分布は非常に発生する頻度の少ない現象について成り立つ離散値の分布であり、一定期間における交通事故の発生件数や機械の故障件数、さらに地震の回数などがポアソン分布になる。

2項分布において、ポアソン分布は起こる確率が小さい出来事が何度も何度も繰り返されたとき、その出来事が起こる確率を表した分布である。

ポアソン分布によれば、事件や事故は短期間に連続して発生する傾向がある。