データが複数個の群から構成されている場合には,全体をまとめた相関係数の値は個々の群における相関係数とは異なったものになることがある。
図 1.正の相関が負の相関に化ける例 |
図 2.正の相関が誇張される例 |
図 3.3 変数間の相関関係 |
t = 1 のデータ(■で表示されたデータ)で,x,y の間の相関係数は 0.000350603 である。
データ全体(t = 1 〜 5)としては,以下のような相関係数行列になる。
データ全体で,x,y の正しい相関関係を捉えるには,t を制御した x,y の偏相関係数を計算する。
偏相関係数 = (0.957876545 - 0.979684729 * 0.977724535) / √(1 - 0.979684729 ^2)/ √(1 - 0.977724535 ^2)=0.000350386
となり,これはまるめの誤差の範囲で 0.000350603 と等しい。
x | y | t | |
---|---|---|---|
x | 1.000000000 | ||
y | 0.957876545 | 1.000000000 | |
t | 0.979684729 | 0.977724535 | 1.000000000 |
図 4.切り取られたデータにおける相関 |
演習問題:
応用問題: