No.21700 スケール化の必要性について 【袋井】 2015/06/14(Sun) 14:01
青木先生,袋井と申します。
昨日は,1名義変数の扱いについてご教示を頂戴し,誠にありがとうございました。
改めて御礼を申し上げます。
--------------------------------------------
アンケート分析のデータ前処理(スケール化)で,判断がつかないことがございます。
アンケート分析では,質的データと量的データが混在しています。
昨日に投稿しましたように,欠損値も混入しています。
更に,量的データの個数は数十と多く,以下のようにオーダーが不揃いです。
・整数で2桁(1〜99)
・整数で5桁(1〜99999)
・少数
量的データはオーダーが不揃いであることから,スケール化についても考えていますが,その判断がつきません。
R言語のscale関数を適用することで,スケール化は容易にできますが,
実務で,どのような場合にスケール化を適用すればよいのか,その判断がつきません。
スケール化は,分析手法との兼ね合いで考えるということでしょうか?
例えば,
クラスタリング分析
→距離計算のために,スケール化が必要と思われる
回帰
→偏回帰係数があるから,スケール化は不必要であると思われる
決定木分析
→目的変数に対する説明変数の重要度計算では,スケール化は不必要であると思われる
など
※例示も,私の勝手な判断ですので,間違いかもしれません,自信はまったくございません
投稿する前に,統計解析の図書やWebで調べましたが,所望する情報を得ることができませんでした。
ご教示をいただけましたら,大変に助かります。
どうぞ,よろしくお願いします。
No.21701 Re: スケール化の必要性について 【青木繁伸】 2015/06/14(Sun) 18:09
> クラスタリング分析
> →距離計算のために,スケール化が必要と思われる
全ての変数の単位が同じならば,標準化は必要ないでしょう。
それでもなお,標準化解と非標準化解に差が有るかどうかは吟味が必要でしょう。
> 回帰
> →偏回帰係数があるから,スケール化は不必要であると思われる
偏回帰係数ではなく,標準化偏回帰係数を見るのならば標準化は不要でしょう。
> 決定木分析
> →目的変数に対する説明変数の重要度計算では,スケール化は不必要であると思われる
標準化した場合とそうでない場合の結果を比較して,違いがある場合にはその原因をあなたが説明できるのなら,標準化は必要ないでしょう。
No.21704 Re: スケール化の必要性について 【袋井】 2015/06/15(Mon) 22:03
青木先生,袋井と申します。
ご教示を頂戴し,誠にありがとうございました。
データを眺めただけで,スケール化の有無による違いを明確に説明できる自信は
とてもありませんので,大きな間違いをしないように,
スケールのあり/なしの2種類を行い,考察をしたいと思います。
つまらない質問で,お手を煩わせてしまい,大変に申しわけございませんでした。
● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る