No.17013 目的変数への影響度の評価について  【tsumitsumi】 2012/06/07(Thu) 12:01

初めて投稿させていただきます。
不適切な文章,説明不足等ございましたら申し訳ありません。

目的変数を0,1の二値データ
説明変数を0,1の二値の質的データが5つと量的データが2つでロジスティック回帰分析を行い
結果から説明変数が目的変数へ与える影響を分析しようとしています。

参考にしている本には,「オッズ比から説明変数x1の方が説明変数x2よりも目的変数yへの影響が大きいと判断してはいけない。影響を見るのであればWald値かP値,あるいは,標準回帰係数を見るべきである。」とありました。

(1)目的変数への影響の強さを説明変数どうしで比較する為にWald値かP値で評価する場合,単にP>0.05である説明変数のWald値の大きさで影響の強さの大小を比較すればよいのでしょうか?

(2)その(1)で順序付けをした上で説明変数1つが目的変数へ与える影響の大きさをオッズ比で評価してもよいのでしょうか?

ご教授いただけたらと思います。

No.17018 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/07(Thu) 17:31

> P>0.05である説明変数の

「P < 0.05 の」 かな?

exp(β)がオッズ比になるのだけど,それは,従属変数が1単位増えたときのもの。単位が違う説明変数は相互比較できませんよということ。
P値は説明変数の係数が0かどうかという検定結果を示すもの。
Wald値(そんな風に呼ぶのは何か変な気がするが)はP値を計算するもとになるもの。
ということを考えれば,標準回帰係数を見るべきではないかな(exp(標準回帰係数)ならば,標準化オッズ比になる)。

No.17020 Re: 目的変数への影響度の評価について  【tsumitsumi】 2012/06/07(Thu) 18:42

青木先生
早速のご教授ありがとうございます。
かなり緊張しての投稿でした。

>「P < 0.05 の」 かな?

そのとおりです。

>Wald値(そんな風に呼ぶのは何か変な気がするが)

参考にしていた本からそのまま引用してしまったのですがwald値,waldの係数,wald統計量・・・呼び方が様々出てきています。この場合には,なんと呼ぶのが適切なのでしょうか?

標準回帰係数を見るべきとのご教授。これは,説明変数が0,1の二値の質的データであってもみちびきだすことができるのでしょうか?

再度,ご教授をお願いいたします。

No.17021 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/07(Thu) 20:26

> なんと呼ぶのが適切

Wald統計量でよいでしょう

>みちびきだすことができるのでしょうか

出力されていませんか?ところで,お使いのソフトはなんですか?

No.17024 Re: 目的変数への影響度の評価について  【tsumitsumi】 2012/06/07(Thu) 21:01

過去の先生のご注意を拝見いたしました。
使用しているソフトを示すのは最低限のマナーでした。
使用しているのは,SPSSを使用しております。

回帰係数やwald統計量,exp(β)などは出力されていますが私の不備かもしれませんが,標準回帰係数は,出力されていないようです。

標準回帰係数は,どのようにすべきでしょうか?

No.17025 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/08(Fri) 11:46

PDFファイルにまとめたので,そちらも参照のこと。

結論だけ言えば,「標準化偏回帰係数を出力しない統計解析ソフトで,標準化偏回帰係数を計算するには,表示された偏回帰係数に独立変数の標準偏差を掛ければよい」ということです。

No.17026 Re: 目的変数への影響度の評価について  【後医は名医】 2012/06/08(Fri) 13:33

>参考にしている本には,「オッズ比から説明変数x1の方が説明変数x2よりも目的変数yへの影響が大きいと判断してはいけない。影響を見るのであればWald値かP値,あるいは,標準回帰係数を見るべきである。」とありました。

この文章からすると,内田治「SPSSによるロジスティック回帰分析」(オーム社)p200の抜粋だと思いますが,p201とp202にこの問題を解決する方法が書かれていると思います。

No.17027 Re: 目的変数への影響度の評価について  【ひろ】 2012/06/08(Fri) 15:37

いつも参考にしています。

 さて,No.17025の青木先生のご回答について,試したところ,確かにその通りでした。が,http://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/mreg2.htmlにある式とは異なるようにも見えます。

 どのように理解すればいいでしょうか?どうぞよろしくお願いします。

No.17028 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/08(Fri) 16:58

ロジスティック回帰分析の場合は,従属変数は0/1のままだからです。

No.17029 Re: 目的変数への影響度の評価について  【ひろ】 2012/06/08(Fri) 17:32

0/1の場合,syyが計算できないことでした。いつも勉強になります。

No.17030 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/08(Fri) 18:54

0/1 の場合だって syy は計算できますよ。
そういうことが理由ではない。

No.17031 Re: 目的変数への影響度の評価について  【tsumitsumi】 2012/06/08(Fri) 19:40

後医は名医様

ご指摘ありがとうございました。ご指摘の解決策も拝見したのですが,まだまだ不勉強なため0.1の質的データなのに標準偏差等を求めて計算をすすめていいものかわからなくなってしまったのです。申し訳ないです。
今後も地道に学んでいけたらと思っております。

青木先生

ご指導ありがとうございます。
標準回帰係数の出し方について勉強させていただきました。ありがとうございます。

さらに質問なのですが,仮にすべての目的変数と説明変数を標準化しロジスティック回帰分析を行って結果を出力すると標準回帰係数と標準オッズ比の出力と標準オッズ比の信頼区間が出力されるという考え方で正しいのでしょうか
不勉強が露呈されるようで恐縮してしまいますがご教授いただけたらと思います。

No.17032 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/08(Fri) 21:32

> この文章からすると,内田治「SPSSによるロジスティック回帰分析」(オーム社)p200の抜粋だと思いますが,p201とp202にこの問題を解決する方法が書かれていると思います。

の内容がどういう事か分かりませんので,なんともコメントのしようがありません。。

> さらに質問なのですが,仮にすべての目的変数と説明変数を標準化しロジスティック回帰分析を行って結果を出力すると標準回帰係数と標準オッズ比の出力と標準オッズ比の信頼区間が出力されるという考え方で正しいのでしょうか

基本的に,どのような分析であろうと,変数の測定単位には依存しないと言うことです。
具体的に言えば,ある変数がcmで測定されていようが,mmで測定されていようが,km!で測定されていようが,結果が変わるわけがないと言うことです。
その次には,測定単位が違うと比較できないなら,全部同じ測定単位に統一すると言うことです。mもgも点数も同じ単位にすることはできないのだから,「無名数」にするのが一番一般的。標準化というのがその条件を満たす変数変換ということです。

全変数を標準化しても結果は変わらない。
ちなみに,従属変数だって,0/1データでなくて標準化してもよいのですよ。ただ,分析プログラムは,従属変数を0/1データだと解釈して分析するだけです(プログラムにょっては,従属変数が0/1以外の値を取ると警告を発するかも知れませんが)。

> 仮にすべての目的変数と説明変数を標準化しロジスティック回帰分析を行って結果を出力すると標準回帰係数と標準オッズ比の出力と標準オッズ比の信頼区間が出力されるという考え方で正しいのでしょうか

当 然ながら,分析の結果表示されるのは,標準化されたデータについてのしんらいくかんであったりするのはは当たり前でしょう。そのほかの結果については同じ になるのか,ある自明の係数を掛けたり割ったりした値になるのかは,それぞれの統計量の定義によるでしょう。実際にやってみて,結果を比較するとよいで しょう。(理論的に関係があることが明らかなものがほとんどでしょうが,それを証明するのがめんどくさいだけ)。

No.17033 Re: 目的変数への影響度の評価について  【校医は名医】 2012/06/08(Fri) 22:30

>> この文章からすると,内田治「SPSSによるロジスティック回帰分析」(オーム社)p200の抜粋だと思いますが,p201とp202にこの問題を解決する方法が書かれていると思います。
>の内容がどういう事か分かりませんので,なんともコメントのしようがありません。

こ の点について補足いたします。この本では「回帰係数もオッズ比も単位がかわれば,変わってしまうので,大小を比較する事は無意味である」となっています が,「すべてが2値データならオッズ比を比較する事に意味がでてくるであろう」とも記載されています。ただ,問者の場合は
>説明変数を0,1の二値の質的データが5つと量的データが2つでロジスティック回帰分析を行い
で すので,これにはあてはまりませんね。また,「ロジスティック解析の標準偏回帰係数は重回帰分析の様に一つの公式があるわけでなく数種類の方法が提案され ており,結果も異なる。」とされています。そしてp201-202でMenardの方法を紹介しています。tsumitsumiさん,Menardの方法 と比較してどうでしたか,教えていただけたら幸いです。

No.17034 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/08(Fri) 22:36

> この本では「回帰係数もオッズ比も単位がかわれば,変わってしまうので,大小を比較する事は無意味である」となっていますが,「すべてが2値データならオッズ比を比較する事に意味がでてくるであろう」とも記載されています。

全てが2値データであっても,それぞれの変数の平均値・標準偏差は異なります(!!)ので,標準化されていない偏回帰係数は比較可能ではありません。

> Menardの方法を紹介しています

どんな方法でしょうね?その方法は,測定単位(はっきり言えば,平均値・標準偏差)の異なる変数の回帰係数の比較を保証するものなのでしょうか?

No.17036 Re: 目的変数への影響度の評価について  【校医は名医】 2012/06/09(Sat) 00:49

青木先生,コメントありがとうございます。これまで,私は標準偏回帰係数に関連する統計処理および考察は経験がありませんので,よくわかりませんが,Menardの方法の例題を抜粋します。
x1<-c(54,55,63,58,62,61,78,77,67,55)
x2<-c(1.58,1.56,1.54,1.62,1.76,1.51,1.53,1.71,1.77,1.81)
y<-c(0,0,0,0,0,1,1,1,1,1)
これでロジスティック回帰を行うと,b1=0.202,b2=6.152,定数=-22.637となり,ここからそれぞれの予測確率とLogit値 を求めます。
1)yと予測確率との相関係数を求め(r=0.5886),r^2を計算(r^2=0.3465)
2)Logit値の分散Vを求める(V=3.5197)
3)Vをr^2で割り,平方根をとる。これをyの標準偏差とする(Sy=3.1873)
4)x1,x2の標準偏差を求める(Sx1=8.6667,Sx2=0.1128)
5)x1の標準偏回帰係数はb1*Sx1/Sy=0.5493,x2の標準偏回帰係数はb2*Sx2/Sy=0.2177
というものです。いかがでしょうか。ちなみに,元本ではx2のデータが100倍(1.58->158)になっていますが,ミスだと思います。

No.17037 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/09(Sat) 19:14

原論文を見ないと,Syの意味,それで割る意味は分からないのでしょうね。
まあ,割ろうがどうしようが,相対比較には何の違いもないのだが...

No.17038 Re: 目的変数への影響度の評価について  【ひろ】 2012/06/09(Sat) 20:59

>0/1 の場合だって syy は計算できますよ。
>そういうことが理由ではない

 どんな理由でしょうか。教えて頂きたいですが。

>原論文を見ないと,Syの意味,それで割る意味は分からないのでしょうね。
>まあ,割ろうがどうしようが,相対比較には何の違いもないのだが...

 そうですね。確かに相対比較に関係ありませんが,やはり理由を知りたい。

No.17039 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/09(Sat) 21:25

従属変数の標準偏差には関係しないということですけど

Menardの方法では,従属変数の「何らかの」標準偏差(標準誤差?)に関連するということなのかなああ?

No.17041 Re: 目的変数への影響度の評価について  【tsumitsumi】 2012/06/09(Sat) 22:49

>Menardの方法の例題を抜粋します。

この例題のデータをもとにSPSSでロジスティック回帰分析を行い偏回帰係数を求め
青木先生のご指導どおり独立変数の標準偏差をかけて標準偏回帰係数をもとめました。
次に全てのデータを標準化したのちにロジスティック回帰分析を行い標準偏回帰係数を
求めました。
しかしながら,この例題に記載されている標準偏回帰係数だけ違う値となっており
例題中の式でyの標準偏差Syで割っているところで違いが生じていると思います。
なぜ,最後に標準偏差Syで割らなければならないのでしょうか?
これがなければ,すべて青木先生のご指導いただいた値と同じとなるのですが

No.17042 Re: 目的変数への影響度の評価について  【校医は名医】 2012/06/10(Sun) 00:31

皆様,考察および検算していただきありがとうございます。

>原論文を見ないと,Syの意味,それで割る意味は分からないのでしょうね。
内田治「SPSSによるロジスティック回帰分析」(オーム社)を読み返してみましたが,残念ながらこの本には参考文献の記載がありませんでした。よって,Menardの方法はどの雑誌に掲載されていたのかは不明でした。

No.17050 Re: 目的変数への影響度の評価について  【青木繁伸】 2012/06/10(Sun) 18:30

Menard の書いた本じゃないでしょうかね?
http://www.amazon.com/Logistic-Regression-Analysis-Quantitative-Applications/dp/0761922083

No.17053 Re: 目的変数への影響度の評価について  【ひろ】 2012/06/11(Mon) 15:23

下記のようなページを見つけました。青木先生の方法は,論文を書く時,何と表現すればいいでしょうか?

http://d.hatena.ne.jp/SHOFUJIHARA/searchdiary?word=Menard

No.17054 Re: 目的変数への影響度の評価について  【tsumitsumi】 2012/06/11(Mon) 18:52

みなさん,いろいろとご指導いただきありがとうございます。

わたしにとってはとても勉強になることばかりです。

重ねて質問をしてしまい申し訳ないのですが
論文を書く際もそうですが,青木先生の方法で
一度,偏回帰係数を求めたのちに標準偏回帰係数を求めた場合
発表する際などでは,これの他に結果として何を示すのが
望ましいのでしょうか?
初歩的な質問で恐縮ですがご指導いただけたらと思います。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る