相関 correlation とは: 回帰 regression との違いを中心に

statistics/correlation/correlation_regression
4-5-2015 updated




概要: 相関とは

2 つの変数がどれくらい散らばっているかを表すのが相関であり,相関係数 ρ の値が大きければ高い相関がある (1)。一方,片方の変数から他方の変数を予測するために直線を引くのが回帰 regression である。相関分析と回帰分析の目的は根本的に異なっており,同時に行うことはありえないとされている (1)。

相関 correlation

相関とは 2 つの変数がどれぐらい散らばっているか を示す概念であり,その程度が 相関係数 ρ や決定係数 r2 を指標に表現される。言い換えると,2 つの変数がどの程度関係して変化しているかを r2 の大きさで与える概念である。

  • 2 つの変数の間に因果関係が想定できない場合に用いられる。
  • 左の図で,青い円の大きさが相関の程度を示すことになる。
  • Excel で図を書くと r2 値と回帰式が同時に与えられるが,これは相関分析と回帰分析を両方行っていることになる。

回帰 regression

回帰とは 片方の変数 (x) から他方 (y) を予測する方法を探る という分析手法であり,通常は両変数の関係性が y = ax + b などの式で与えられる。

  • 通常は,x が自由に変化する独立変数 dependent variable,y が x に伴って変化する従属変数 independent variable である。
  • 左の図で,青い直線を示す式が x と y の関係性を表すことになる。

References

  1. 統計解析 Q & A -相関と回帰分析- Link/広告付きリンク.
  2. Shannon lab 統計データ処理/分析. Link.


コメント欄

全ページ共通なので,コメントにはページのタイトルもつけて下さい。書き込みのあったページには,専用のコメント欄を割り当てます。詳細は こちら のページに。

inserted by FC2 system