No.21755 質的変数と量的変数について  【ぱす】 2015/09/03(Thu) 08:12

お世話になります。

Rのlm()で重回帰分析を行いたいのですが,説明変数に質的変数(0 or 1)と量的変数が混在しても問題ないでしょうか。たとえば目的変数が死亡率,説明変数に性別・喫煙の有無,量的変数に体重・血圧などを用いた場合です。質的変数と量的変数に数値として大きな差があるので,量的変数の影響が大きくなるのではないかと懸念しています。

お手数ですが,ご回答宜しくお願いいたします。

No.21756 Re: 質的変数と量的変数について  【青木繁伸】 2015/09/03(Thu) 10:31

全く問題ないです
example(lm) で表示される例 lm.D9 <- lm(weight ~ group) の group は factor です

「質的変数(0 or 1)」のような 2 値データは,平均値,分散,相関係数を計算でき,重回帰分析を始めとする多変量解析に用いるのになんの不都合もありません

No.21757 Re: 質的変数と量的変数について  【ぱす】 2015/09/03(Thu) 11:55

青木先生

ご回答ありがとうございました。早速解析したのですが,結果の解釈についてご教示頂けないでしょうか。

lm()とstep()で重回帰分析を行った結果,Interceptのp-value=0.01,
質的変数Aの係数のp-value=0.007,Adjusted R-squared=0.18という結果になりました。

危険率を5%とするとInterceptと質的変数Aの係数は有意であるにも関わらず,
Adjusted R-squaredが小さいことから回帰式は実データにフィットしていないことになります。

危険率5%は閾値として不十分であり,回帰式が実データにフィットするためにはより小さなp-valueが示す回帰係数が必要ということになるのでしょうか。

No.21759 Re: 質的変数と量的変数について  【青木繁伸】 2015/09/04(Fri) 08:44

あなたのデータのサンプルサイズがかなり大きいのではないでしょうか?
偏回帰係数の有意性検定では,偏回帰係数の大きさの他にサンプルサイズも関係します。偏回帰係数が小さくてもサンプルサイズが大きければ有意ということになりやすいのです。
重回帰式の有用性を,回帰の分散分析で検定する場合にも,サンプルサイズが関係することはおなじです。
分析の有用性の判定は,検定結果だけではなく,決定係数や自由度調整済みの決定係数の大きさで実質的な有用性として判断すべきなのです。

No.21767 Re: 質的変数と量的変数について  【ぱす】 2015/09/07(Mon) 11:44

青木先生

返信が遅れて申しわけありません。

サンプルサイズは数十程度なので偏回帰係数が有意になりやすいわけではなさそうです。私なりに調べてみましたが,先生のおっしゃるように決定係数の大きさで評価すれば問題なさそうでした。

ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る