No.21327 ロジスティック回帰分析強制投入法の結果解釈  【りんご】 2014/09/15(Mon) 18:17

縦断研究である事象の予測因子を調べたいと考えています。

ロジスティック回帰分析を行うために,まず,予測因子の候補になる因子と事象のある・なしについてΧ2乗検定でP<0.05を満たす因子のみを選定しました。

それらの因子と先行研究で関係するといわれている因子を独立変数として,事象のある・なしを従属変数に,強制投入法による二項ロジスティック回帰分析を行いました。その結果でp<0.05になった因子を予測因子として考察しようと考えていました。

ところが,複数の先行研究で「予測因子となる」と言われている因子が,ロジスティック回帰分析の結果p<0.05になりませんでした。この結果からは,本来「予測因子となる」と言われていた因子は,今回の研究で重要でないということになってしまいそうなのですが,その因子についてどのように解釈すればよいのでしょうか。

(ロジスティック回帰分析でステップワイズを行わず,強制投入法を用いることにしたのは,ステップワイズでは,予測についての陽性的中率が10%くらいと非常に悪かったためです。)

ご教示をどうぞよろしくお願い致します。

No.21328 Re: ロジスティック回帰分析強制投入法の結果解釈  【青木繁伸】 2014/09/15(Mon) 19:57

> ところが,複数の先行研究で「予測因子となる」と言われている因子が,ロジスティック回帰分析の結果p<0.05になりませんでした。
> この結果からは,本来「予測因子となる」と言われていた因子は,今回の研究で重要でないということになってしまいそうなのですが,その因子についてどのように解釈すればよいのでしょうか。

つまるところ,あなたのデータは,ちょっと独自色が強かったということでしょう。どういう点でユニークだったかについて考察する必要があるでしょう。

> ロジスティック回帰分析でステップワイズを行わず,強制投入法を用いることにしたのは,ステップワイズでは,予測についての陽性的中率が10%くらいと非常に悪かったためです。

これも,あなたのデータがユニークだったためでしょう。

「ユニーク」というのは褒め言葉でもあるかも知れないし,「ちょっとねえ?」ということかも知れませんが。

No.21330 Re: ロジスティック回帰分析強制投入法の結果解釈  【りんご】 2014/09/15(Mon) 21:54

青木先生,ご教示どうもありがとうございます。

>つまるところ,あなたのデータは,ちょっと独自色が強かったということでしょう。どういう点でユニークだったかについて考察する必要があるでしょう。

原因の一つとして考えられるのが,従属変数と独立変数に強い多重共線性があることです。
これら従属変数と独立変数はあきらかに関係が深そうです。
そのような場合に,先行研究から明らかに重要な予測因子であるにもかかわらず,ロジスティック回帰分析の結果でその因子がp>0.05になりうることはありますでしょうか。

また,今回ロジスティック回帰分析を行うために,まず,予測因子の候補になる因子と事象のある・なしについてΧ2乗検定でP<0.05を満たす因子のみを選定して独立変数に使いました。強制投入法をする場合p<0.25以下の因子と先行研究で重要な因子を独立変数として,ある事象を従属変数に回帰分析をするというやり方にはしない方がよろしいでしょうか。

たびたびすみませんが,コメントをいただけましたら幸いです。
どうぞよろしくお願い致します。

No.21331 Re: ロジスティック回帰分析強制投入法の結果解釈  【青木繁伸】 2014/09/15(Mon) 22:26

> 従属変数と独立変数に強い多重共線性

多重共線性は,「独立変数間に相関のあること」です。
従属変数といくつかの独立変数の間に相関のあることは,必然です。

> 従属変数と独立変数はあきらかに関係が深そうです。そのような場合に,先行研究から明らかに重要な予測因子であるにもかかわらず,ロジスティック回帰分析の結果でその因子がp>0.05になりうることはありますでしょうか

本当にそのようなことでした,本来の多重共線性があるのかもしれませんね。

> まず,予測因子の候補になる因子と事象のある・なしについてΧ2乗検定でP<0.05を満たす因子のみを選定して独立変数に使いました。強制投入法をする場合p<0.25以下の因子と先行研究で重要な因子を独立変数として,ある事象を従属変数に回帰分析をするというやり方にはしない方がよろしいでしょうか。

この掲示版では何回もそのようなことが質問・報告され,そのたびに「そのようなことはしないように」と示唆してきたところです。二変量解析の結果をまとめても,多変量解析にはなりません。単純なシミュレーションをすれば分かるし,全ての変数を使って変数選択をやらせれば,あなたが最終的に得た解とは異なる解が得られることがわかるでしょう。

最初から,変数選択を行い,その結果に対して,先行研究の結果などを参考にして変数の追加,削除を行うのがよいでしょうということです。(先行研究を尊重するということなら,先行研究で使われた変数だけを使って論文を書けばよいわけです。それが,馬鹿馬鹿しいことなのかどうかは,それぞれの分野次第)。

その前に,先ほど行ったように,「あなたのデータに何らかの特殊性はありませんか??」ということをよく考えるべきではないですか??母集団の特性も,調査手順も,何もかも含めて。それらに何の問題もなければ,あなたの結果は新発見です。

No.21332 Re: ロジスティック回帰分析強制投入法の結果解釈  【りんご】 2014/09/15(Mon) 22:41

青木先生,ご回答どうもありがとうございます。

過去の掲示板のご回答を把握しておらず,無意味な質問をしてしまい,大変申し訳ありませんでした。

データの特殊性・母集団の特性・調査手順などいろいろ考えてみたいと存じます。

暗礁に乗り上げていたような感じでしたので,大変助かりました。
おかげさまで一つ前進できそうです。
重ねてお礼申し上げます。
誠にありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る