単回帰分析とは
回帰分析とも呼ばれる単回帰分析とは、ある変量とある変量との間の相関関係を求めるために使用される統計学で発見された手法の1つです。
ちなみに変量とは数学でいう変数のようなもので、相関関係とは変数間にどの程度の関連性があるのかということです。
では、単回帰分析について具体的に見てみることにしましょう。
例えば、アイスクリームと気温の間には相関関係がある(つまり、暑い日ほどアイスクリームはよく売れる)ことが知られています。
アイスクリームと気温というそ変量について単回帰分析をする場合、まずそれぞれの日で気温とアイスクリームの売り上げについてデータを収集し、それらに基づいて散布図を作成します。X軸に気温を取り、右に行くほど気温が高いとし、Y軸にはアイスクリームの売り上げを取り、上に行くほどよく売れていることを表すとすると、右肩上がりの模様が浮かび上がってきます。
相関関係では一直線にデータが並ぶことはなく、多少のバラつきが見られます。これらのデータの中心に直線を引く(回帰方程式と呼びます)と、その直線は Y=aX+b という一次方程式で表現されます。
この数学的にバラつきの真ん中を計算し求められる方程式が回帰方程式です。この回帰方程式を見ることで、傾きが判明し、各々の変量がどの程度関連し合っているのかを捉えることが可能です。また、アイスクリームの売り上げに対する気温の影響度も知ることができます。直線の傾きが急であるほど、気温の影響度は高いということになります。
しかし、回帰方程式が求められたからといって、必ず変量間に関連があることにはならない点には注意が必要です。
例えば、アイスクリームとガムの売り上げの間に相関関係はないでしょう。ところが、回帰方程式を求めることはできてしまいます。そこで重要になるのが、相関係数です。相関係数は-1から1までの数値を取り、相関係数が 0.7以上であれば、両者の間に強い相関があることが分かります。
また、単回帰分析を行う際は、実際に散布図を作成して視覚的に見てみることも大切です。データのバラつき具合によっては、高い相関が偶然あることになってしまっているケースもありえるからです。
若干の注意点はありますが、単回帰分析は表計算ソフトなどを使えば簡単に行うことが可能ですので、中小企業でも積極的に活用してみると良いでしょう。