No.16351 ロジスティック回帰分析において説明変数同士に相関がある場合について  【理系学生F】 2012/02/05(Sun) 11:25

いつもお世話になってます。

現在ロジスティック回帰分析を用いて,疾患のリスクとなるような説明要因(要因の暴露の有無で評価(0or1として))の検討を行っています。

そこで複数の説明要因がχ2検定を行ったところ,χ2に対応するp値が0.05以下となり,相関があることがわかりました。(多重共線性?)

このため,これらの相関があった説明要因については同時に説明変数として,ロジスティック回帰分析に組み込めないので,ある説明要因の暴露の有無で群分けを行って行なったり,別々に組み込んで複数回ロジスティック回帰分析を行うことを考えています。

しかし,説明要因の数が多く,相関しているものがとても多いため,このように手作業ですべて,群分けや複数回ロジスティック回帰分析を行うことが困難なものとなっています。

ま た,今回の研究の目的としては,これらの説明要因について,重要な説明要因の解明ではなく,これらすべての説明要因の疾患のリスクへの関与の解明なため, 説明変数の相関を無視して,変数選択法などを用いて,重要な説明変数のみが組み込まれるロジスティック回帰分析を行うということもできません。

このような場合においては,どのようにして,全ての説明要因についてロジスティック回帰分析で疾患のリスクへの関与について検討を行っていったらよいのでしょうか?

No.16354 Re: ロジスティック回帰分析において説明変数同士に相関がある場合について  【青木繁伸】 2012/02/05(Sun) 18:44

> そこで複数の説明要因がχ2検定を行ったところ,χ2に対応するp値が0.05以下となり,相関があることがわかりました。(多重共線性?)

2変数間の相関係数の大小だけで多重共線性は判定できません(多変量で判定しないといけないので)。

> このような場合においては,どのようにして,全ての説明要因についてロジスティック回帰分析で疾患のリスクへの関与について検討を行っていったらよいのでしょうか?

現象的には多重共線性と見られるようなものが実はそうではない(抑制効果とかなんとか)ということもあるので,分析をしてみて何とも解釈のしようがない変な結果が得られたら,多重共線性の仕業だろうと解釈するのだろうか???

No.16359 Re: ロジスティック回帰分析において説明変数同士に相関がある場合について  【理系学生F】 2012/02/06(Mon) 09:17

ご回答ありがとうございます。

今回,多重共線性の意味について理解が不十分で用いてしまいました。

複数の説明変数同士の相関の検討する際には,二つの説明変数だけで検討しても不十分となるのでしょうか?

何度も質問してしまい申し訳ないですが,回答よろしくお願いします。

No.16360 Re: ロジスティック回帰分析において説明変数同士に相関がある場合について  【青木繁伸】 2012/02/06(Mon) 10:03

> 複数の説明変数同士の相関の検討する際には,二つの説明変数だけで検討しても不十分となるのでしょうか?

不十分です。

実例を示しましょう。
互いに相関が高い3変数
X1 X2 X3
A 53 49 52
B 68 62 52
C 29 37 31
D 56 63 60
E 58 55 60
F 40 31 33
G 50 50 53
H 51 44 58
I 52 59 55
J 44 50 46
計算された相関係数
X1 X2 X3
X1 1.000 0.806 0.798 # 互いに強い相関を示す
X2 0.806 1.000 0.786
X3 0.798 0.786 1.000
計算されたトレランス(VIF)# トレランスは問題ない
tolerance VIF
X1 0.2792846 3.580577
X2 0.2950242 3.389553
X3 0.3048815 3.279963

1つだけ,そんなに高くはない相関係数になるデータ
X1 X2 X3
A 44 39 40
B 66 57 62
C 47 50 49
D 26 42 29
E 55 60 60
F 53 30 40
G 45 60 53
H 55 55 55
I 52 61 59
J 57 46 52
計算された相関係数
X1 X2 X3
X1 1.000 0.327 0.813
X2 0.327 1.000 0.808 # X1:X2 の相関はそんなに高くない
X3 0.813 0.808 1.000
計算されたトレランス(VIF) 3変数ともトレランスは低い
tolerance VIF
X1 0.02626482 38.07374
X2 0.02697894 37.06595
X3 0.01022883 97.76294

No.16362 Re: ロジスティック回帰分析において説明変数同士に相関がある場合について  【理系学生F】 2012/02/06(Mon) 16:34

ご回答ありがとうございます。

つまり,多変量解析において,同時に説明変数に組み込むために相関 を検討する際には,2つの説明変数の相関について検討するのではなく,全ての説明変数の間で,このトレランスという指標から相関が高いか判断して,このト レランスという指標が高い場合には,2つの説明変数の間で相関が高いため,これらを同時に説明変数に組み込めないということなのでしょうか?

度々質問してしまい申し訳ないですが,回答よろしくお願いします。

No.16364 Re: ロジスティック回帰分析において説明変数同士に相関がある場合について  【青木繁伸】 2012/02/06(Mon) 19:12

トレランスは低い(おおむね0.1以下)場合に問題なんですよ。
最初の場合は,相関係数はどれもかなり高いのだけど,トレランスでは問題ない。
二番目の場合は,一つ低い相関係数があるだけだけど,トレランスでは問題あり。
(上に書いたのと同じだ...)

> 度々質問してしまい申し訳ないですが

聞くばかりじゃなく,自分でも調べましょう。

No.16386 Re: ロジスティック回帰分析において説明変数同士に相関がある場合について  【理系学生F】 2012/02/09(Thu) 04:01

回答ありがとうございます。

自分でも調べてみます!

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る