No.20114 多重ロジスティック回帰分析オッズ比が高すぎる理由  【ネオナトロジスト】 2013/08/02(Fri) 13:10

お世話になります.
ある目的変数に対して, 説明変数Aの有無が影響するかを調べるために,
JMPソフトを使用して, 多重ロジスティック回帰分析を行ったのですが,

        オッズ比 95%信頼区間  P値  
説明変数A(名義)   53.3   6.6-1524.4 <0.0001
説明変数B(連続)   0.9    0.9-2.1   0.18
説明変数C(名義)   16.1   3.4−129.7  0.0002
説明変数D(名義)    21 1.8-298.7 0.02

モデルχ2検定 P<0.0001
となりました. 説明変数Aに対するオッズ比が53というのが高値過ぎるため, 何か統計学的手法が誤っているのではないかと考えました.

ちなみに,
       説明変数Aあり 説明変数Aなし
目的変数あり   13       1
目的変数なし   48       81
で, 単変量解析でのオッズ比は21です.

説明変数の選択は, ステップワイズ法を用いて追加p値0.2, 除去0.2で行いました.

オッズ比が高値すぎる理由として考えうることを教えてください.
よろしくお願いします.

No.20115 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【後医は名医】 2013/08/02(Fri) 20:53

>説明変数Aに対するオッズ比が53というのが高値過ぎるため
変数Dも充分21(1.8-298.7)と高く,95%信頼区間も大きいと思います。恐らく,データに「1」があるためではないでしょうか。

No.20117 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【青木繁伸】 2013/08/02(Fri) 22:30

> 恐らく,データに「1」があるためではないでしょうか。

もう少し説明をお願いします。

> 何か統計学的手法が誤っているのではないかと考えました.

よく分からない(分かりたくもない)のですが,JMP のオッズ比の定義にはちょっと変わったところがあるようなことが書かれているようなのですけど,そこは大丈夫でしょうか?

JMP 以外の統計ソフトで分析して(R なら無料だし),同じ答えになるかどうかも検討するというのはどうでしょうか?

No.20118 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【後医は名医】 2013/08/02(Fri) 23:42

> 恐らく,データに「1」があるためではないでしょうか。
もう少し説明をお願いします。

多 少説明不足で失礼しました。他のセルに比べて,極端に小さい数字があるという意味です。例をみますと,「目的変数あり」かつ「説明変数Aなし」は「1」の 様ですので。質問者が医療関係なのかどうかは不明ですが,極端に少ない症例または条件を変数にいれると,私も時々経験しますので。

No.20119 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【ネオナトロジスト】 2013/08/03(Sat) 11:19

青木 繁伸 先生, 後医は名医 様

返信まことにありがとうございます.
私は, 統計初心者の新生児科医です.
勉強不足で, 各種資料を調べながらのため, レスポンスが遅くなって申し訳ありません.

【JMPのオッズ比について】
まず, JMPソフトのオッズ比についてですが, 単位オッズ比(いわゆるオッズ比)と範囲オッズ比(説明変数Xが最小値から最大値まで変化したとき, オッズが何倍になるかを示す数値)の二つが表示されることが特徴のようです.
しかし, 今回のケースでは説明変数Aは名義変数ですので範囲オッズ比は表示されず, これは関係ないようです.

ま た, 一点, 私にはよく理解できないのが, 「JMPでは名義尺度の説明変数を0−1ではなく, -1と1というダミー変数を導入して数値化している. そのために, 算出されるオッズ比は回帰係数を2倍にした値の指数をとっていることに注意する必要がある」との記載があった点です. これは関係があるのかがわかりません.

【「目的変数あり」かつ「説明変数Aなし」は「1」が問題ではないか?】
これは, 極端に少ない数値を入れることがJMPソフトでのみ問題ということでしょうか? それとも普遍的に問題なのでしょうか?

【Rでの解析ではどうか?】
申し訳ありません. 私はRを使ったことがなく, これから勉強いたしますので, 少し時間がかかりそうです.

不十分な返答で申し訳ありません.

No.20120 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【後医は名医】 2013/08/03(Sat) 20:23

>-1と1というダミー変数を導入して数値化している.
恐らく,関係ないと思います。
>極端に少ない数値を入れることがJMPソフトでのみ問題ということでしょうか? それとも普遍的に問題なのでしょうか?
普 遍的な問題だと思います。よって,JMPに問題があるのではなく,データ上のばらつきに問題があるのだと思います。現に,例のデータの「1」を「2」にす るだけで,粗オッズ比は半分になります。新生児のイベントですので,症例数を増やすのも困難でしょうから,データ通りの解釈でよいのではないでしょうか。

No.20122 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【taipapa】 2013/08/03(Sat) 20:50

> 何か統計学的手法が誤っているのではないかと考えました.

>        説明変数Aあり 説明変数Aなし
目的変数あり   13       1
目的変数なし   48       81

もう見てないかもしれないけど,老婆心ながら,
上 記の表を見ると,全体数は143症例で,イベント数は14件のようですね.events per variable > 10の原則からすると,1つか,せいぜい2つのpredictorを調べるのが関の山のイベント数だと思いますが,少なくとも,A, B, C, Dの4つの変数をみてますよね.統計学的には,これが一番問題となるポイントだと思います.変数をもっと絞ったほうが良いのでは...
まぁ,分野によっては変数が多すぎても許されてますが...
あ,これはオッズ比が高いこととは関係ないですよ,

No.20123 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【ネオナトロジスト】 2013/08/04(Sun) 11:18

taipapa様

ご指摘ありがとうございます.

サンプル数が n≧10×説明変数というAltmanの基準に加えて,
本掲示板11155で青木先生が記されている説明変数あたりのイベント数が10以上である必要があるという点ですね.
http://www.ncbi.nlm.nih.gov/pubmed/8970487?dopt=Abstract&holding=f1000
A simulation study by Peduzzi and colleagues (1996) showed that sample sizes of 5 to 10 events per variable included in a regression equation

確かに説明変数4つで多変量解析を行う上では必要なイベント数が足りないのでしょう.
私がこの研究で調べたかったのは,
「説明変数A(介入)が目的変数A(イベント)を増加させるか?」ということです.
これを統計学的手法で調べるためにはχ二乗検定を行いますが, この必要なサンプル数はG-powerで88例以上とのことで, 問題ないかと思います.
その後, 説明変数B,C,Dの要素を除外したくて多重ロジスティック回帰分析を行いました. ここでは, イベント数(14例)が説明変数4つに対して少ないということですね.

臨床研究ですので, イベント数を増やすことは困難です. 変数を減らすことで, 私の当初の研究目的を解析できるかはよくわかりません.
できればイベント数が2-3倍あれば, より妥当な統計学的解析になるのでしょうね.

ありがとうございます.

No.20124 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【ネオナトロジスト】 2013/08/04(Sun) 11:28

後医は名医様 

アドバイスまことにありがとうございます.

ということは, 発表や論文では「多重ロジスティック回帰分析にて説明変数Aはオッズ比53で目的変数Aの頻度を増加させる. 」と記載してよいのでしょうか?

「オッズ比については, 目的変数Aの頻度(イベント数)が少ないため注意を要する. 」のような注釈をつける必要があるでしょうか?

しつこいようですが, 教えていただければと思います.

No.20125 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【後医は名医】 2013/08/04(Sun) 13:14

>発表や論文では「多重ロジスティック回帰分析にて説明変数Aはオッズ比53で目的変数Aの頻度を増加させる. 」と記載してよいのでしょうか?
私ならそうして発表します。
>「オッズ比については, 目的変数Aの頻度(イベント数)が少ないため注意を要する. 」のような注釈をつける必要があるでしょうか?
そして,上記の注釈もつけた方がよいと思います。特に臨床研究では症例数不足がよくネックになりますが,新生児という特殊性も考慮すれば,大丈夫だと思います。
余談ですが,HNを考えれば,新生児の専門家だと推察できますが,英語でなくカタカナでしたので気づくのが遅れてしまいました。

No.20126 Re: 多重ロジスティック回帰分析オッズ比が高すぎる理由  【ネオナトロジスト】 2013/08/04(Sun) 20:34

後医は名医様

丁寧なアドバイスありがとうございました。

新生児の臨床研究は基礎研究や成人と比較して曖昧なものになりがちですが,少しでも科学的事実を明らかにできるようにして,海外に負けないようにしていきたいと思っています。

ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 046 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る