ホワイト企業と就職活動

ホワイト企業は労働法を遵守する

回帰分析と相関分析が分からない

スポンサーリンク

回帰分析と相関分析が分からない

2変数の直線的な関係を定量的に表すときに回帰分析や相関分析が行われます。

この記事は回帰分析と相関分析について記述しています。

回帰分析と相関分析の区分


回帰分析:2変数x、yの因果関係がわかっている場合。


相関分析:2変数が独立に変化すると考えられる場合、あるいは因果関係が不明の場合。


相関分析は確率変数x、yの分布が2次元正規分布に従うという仮定に基づいて行われる。

たとえば二つの変数xとyについて、n組のデータ(xi,yi:i=1~n)があったとする。

この場合、グラフのヨコ軸にx、タテ軸にyをとり、点(xi,yi)をプロットすれば、xとyの関係を見ることができる。

また、回帰分析によりxに対するyの回帰直線y=f(x)を求めることができ、その回帰直線y=f(x)から任意のx=xiのときのyの値が推定できる。

点(xi,yi)の組から回帰式y=a+bxの係数を求めるためには、偏差の二乗和を最小にするようにa、bを定める最小二乗法を用いる。

yとxの間の検定を行う場合には、それぞれが独立に正規分布していることを前提として行う。

回帰係数の検定および相関係数の検定には、いずれもt分析表を利用することができる。


回帰分析法とは

回帰分析は、原因と考えられる変数(独立変数)によって、結果と考えられる変数(従属変数)の変化がどのような関係式で表され、その程度説明できるかという寄与率を定量的に求める分析法のこと。

回帰分析は2変数の因果関係が分かっている場合に用いられる。

回帰分析により2変数のうちの一方の変数から他方の変数を推定することができる。

変数の関係を明らかにするために、データから散布図を描き、2変数の関係をパッと見で分かるようにすることもできる。

また、2変数の関係が直線的なことを直線回帰といい、回帰分析として回帰直線を求めることができる。

回帰直線は点(x、y)から回帰直線y=a+bxまでのy方向の距離の2乗の和が最小になるようにも求めた回帰線で、これをxに対するyの回帰線という。


相関分析法とは

相関分析法とは、2種の変数間の直線的な関係の有無を統計的に検討する分析法のこと。

相関分析は2変数が独立に変化すると考えられる場合か、因果関係が不明の場合に使用される。

相関分析では2変数の間に関係があるかないかということは、相関係数rの大きさによって判断される。

しかし、相関があったという結果になったとしても、それが何に起因しているかはそのデータだけからは決めきれない場合も多い。


相関係数とは

相関係数は二つの変数間の直線的関係(一次式関係)の強弱を表し、その絶対値が1に近いほど相関関係は強いとされる。

相関係数の値が0から+1に値が近づく
⇒正の直線的な関連性が強いと解釈される。

相関係数の値が0に近いほど直線的な関連性は弱いと解釈される。

相関係数の値が0から-1に値が近づく
⇒負の直線的な関連性が強いと解釈される。

相関係数の値が+1あるいは-1をとるときは、完全に一次式が成り立つ。


相関係数の特徴

仮に2変数間の単位が異なっていたとしても、相関関係の強弱を示すことは可能。

ただし、2変数間に直線的関係(一次式関係)がないときは相関係数はほぼ0となる。

なお、相関係数は曲線的関係を直接示すことはできない。

相関係数と尺度

相関係数は「2変量とも量的データ(間隔尺度、比例尺度)のときに」用いられる。

名義尺度は量的な意味を持たないので、そのままでは変量間の関係を判定できない。
連関表などを用いて連関係数を求めて判別する。

一方、「間隔尺度の変数」や「比例尺度の変数」は相関係数を適用することができる。

標本サイズ(データ数)に関係なく、相関係数rは-1≦r≦+1の範囲にあり、絶対値1を超えることは無い。
ただし、相関係数の有意性は標本サイズの大小に依存する。


相関係数の注意事項

相関係数は外れ値の影響を受けやすい。
少数の外れ値が含まれている場合には相関の強さを正しく示さない場合がある。

仮に多くのデータ間には相関関係が無い場合でも、一個の飛び離れた値があれば、相関係数の絶対値が1に近い値になることもある。

相関係数は変数xと変数yのいずれか一方のデータが全て同じである場合、変数値と平均値が同じになるので相関係数を求めることができなくなる。

これは相関係数を求める計算式の分母が0となるため、定義式を用いて相関係数を計算することが不可能になるためである。