No.16931 ダミー変数が冗長なため0に設定されてしまう件  【統計勉強中】 2012/05/19(Sat) 11:14

いつも勉強させてもらっております。

早速質問なのですが,ダミー変数を複数いれると,出力時に「冗長なため0に設定されている」となり結果が表示されません。どうしても,コントロールしたい変数(固定効果として考えたい要因)なのでモデルに入れたいのですが,この場合どう対応すればよいのでしょうか。

よろしくお願いします。

No.16934 Re: ダミー変数が冗長なため0に設定されてしまう件  【青木繁伸】 2012/05/19(Sat) 21:20

どのようなソフトウエアを使っているのか,また,具体的にどのようにしているのかはっきりしないので,回答するのが困難でしょう。
自分でダミー変数を作っているのなら,k個のカテゴリーを持つ変数は(k−1)個のダミー変数に展開すると言うことは了解されているのですね?

No.16935 Re: ダミー変数が冗長なため0に設定されてしまう件  【統計勉強中】 2012/05/20(Sun) 09:54

説明が足らず失礼いたしました。ソフトウェアはSPSSを使っており,投入するダミー変数はk−1個にしておりま す。社会調査の個票調査を用いた分析をしており,都道府県ダミーを入れたいのですが,出力すると一部が落ちてしまいます。予想しておりますので,ダミー同 士の相関が強く,一部は不要と判断され,落ちているのではないかと考えておりますが,明確な理由が分からず質問させていただきました。

No.16936 Re: ダミー変数が冗長なため0に設定されてしまう件  【青木繁伸】 2012/05/20(Sun) 10:59

都道府県ダミー...まさか,47-1 個作りました?もしそうでしたら,サンプルサイズは幾つですか?
重回帰分析なら,「サンプルサイズ−1個」の説明変数しか使えませんよ。

No.16937 Re: ダミー変数が冗長なため0に設定されてしまう件  【統計勉強中】 2012/05/20(Sun) 11:30

個票データのサンプル数は約3000ほどあり,十分だと判断したのですが・・。やはり都道府県ダミーということはできないのでしょうか。

No.16938 Re: ダミー変数が冗長なため0に設定されてしまう件  【青木繁伸】 2012/05/20(Sun) 18:55

「個票データのサンプル数は約3000ほどあり」なら,十分でしょうね。
ただ,実際的に,特定の県のデータが少なくて,結果的に従属になってしまっているということはありうるかな?

> spssの重回帰では
> 回帰分析 分析→回帰→線形
> 統計→共線性の診断
> によってVIFと許容度を出力します。

ということのようなので(香川大学堀先生),一度チェックしてみればいかが?

ただ,「どうしても,コントロールしたい」とはいえ,都道府県を説明変数として,それで何か有用と思われる結果が得られても,それは,「都道府県ごとの特定要因」を説明変数に加えただけで,あまり一般的な知見ではないような気もしますが?

No.16939 Re: ダミー変数が冗長なため0に設定されてしまう件  【統計勉強中】 2012/05/21(Mon) 17:45

なるほど,各都道府県内のサンプル数にも配慮しないといけないのですね。早速確認してみます。

また,多重共線性を起こしている可能性は大いにありそうですので,VIFをチェックしてみることにいたします。

SPSSの操作ステップまで書いていただき,ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る