相関分析とは?

マーケティング用語

相関分析とは?

相関分析とは

相関分析とは、2つの変数、あるいはそれ以上の変数間の関連性を調べることです。相関分析は、エクセルなどの表計算ソフトを用いて簡単に行うことができます。

例えば、エクセルの場合なら図作成で散布図を用います。簡単な例であれば、ある2地点間の気温の相関(関連性)を調べる場合に、X軸にA地点の気温、Y軸にB地点の気温をとり、散布図を作成します。

散布図が作成できたなら、次にA地点の気温XとB地点の気温Yの関係性を、近似曲線を使用して単純な回帰式である Y=aX+b の式として求めます。なお、近似曲線の式を求めるときは「R-2の決定係数」も得られるようにしておきます。

求めた決定係数の値を1/2乗(Rを求める)すれば、それが「相関係数」となり、XとYの関連性がどの程度あるかの指標となります。

Rの値が1.0であれば、B地点の気温YはA地点の気温Yが分かれば完全に求めることができます。Rの値が0.0であれば、A地点とB地点の気温は全く関係がないと言うことができます。

ちなみに、気温のような自然条件の場合だと、距離が近い場合は両地点の関連性が強く、相関係数Rの値は1.0に近くなりますが、離れている場合はそうはいきません。両地点の気温を決める気象状況が大きく異なる場合があるからです。

相関分析は回帰分析と似ていますが、回帰分析との違いは、回帰分析ではXからYを求める回帰式を得ることが主であるのに対し、相関分析ではお互い変数間の関連性を相関係数などで調べる点で異なります。

上の例では、2つの変数XとYの関係ですが、二つ以上の変数がある場合では重相関関係を調べる必要があります。

例えば、海の潮位(Y)において、月との位置関係による潮位変化(X1)は計算で正確に求めることができますが、それ以外に潮位は風(X2)、波(X3)及び気圧(X4)によっても変化します。これは前に述べた散布図を作成することによって単純な相関分析をすることはできません。

例えば、エクセルで重相関分析を行うには「関数LINEST」を用います。LINEST は Y=aX1+bX2+cX3+dX4+e の形で求めることができ、相関係数Rの値も得ることができます。a、b、c、d は係数ですが、係数の大小はYを決める際の影響の大小すなわち貢献度だと考えると良いでしょう。