No.21700 スケール化の必要性について  【袋井】 2015/06/14(Sun) 14:01

青木先生,袋井と申します。

昨日は,1名義変数の扱いについてご教示を頂戴し,誠にありがとうございました。
改めて御礼を申し上げます。

--------------------------------------------
アンケート分析のデータ前処理(スケール化)で,判断がつかないことがございます。

アンケート分析では,質的データと量的データが混在しています。
昨日に投稿しましたように,欠損値も混入しています。

更に,量的データの個数は数十と多く,以下のようにオーダーが不揃いです。
・整数で2桁(1〜99)
・整数で5桁(1〜99999)
・少数

量的データはオーダーが不揃いであることから,スケール化についても考えていますが,その判断がつきません。

R言語のscale関数を適用することで,スケール化は容易にできますが,
実務で,どのような場合にスケール化を適用すればよいのか,その判断がつきません。

スケール化は,分析手法との兼ね合いで考えるということでしょうか?

例えば,
クラスタリング分析
 →距離計算のために,スケール化が必要と思われる

回帰   
 →偏回帰係数があるから,スケール化は不必要であると思われる

決定木分析
 →目的変数に対する説明変数の重要度計算では,スケール化は不必要であると思われる

など

※例示も,私の勝手な判断ですので,間違いかもしれません,自信はまったくございません

投稿する前に,統計解析の図書やWebで調べましたが,所望する情報を得ることができませんでした。

ご教示をいただけましたら,大変に助かります。
どうぞ,よろしくお願いします。

No.21701 Re: スケール化の必要性について  【青木繁伸】 2015/06/14(Sun) 18:09

> クラスタリング分析
>  →距離計算のために,スケール化が必要と思われる

全ての変数の単位が同じならば,標準化は必要ないでしょう。
それでもなお,標準化解と非標準化解に差が有るかどうかは吟味が必要でしょう。

> 回帰   
>  →偏回帰係数があるから,スケール化は不必要であると思われる

偏回帰係数ではなく,標準化偏回帰係数を見るのならば標準化は不要でしょう。

> 決定木分析
>  →目的変数に対する説明変数の重要度計算では,スケール化は不必要であると思われる

標準化した場合とそうでない場合の結果を比較して,違いがある場合にはその原因をあなたが説明できるのなら,標準化は必要ないでしょう。

No.21704 Re: スケール化の必要性について  【袋井】 2015/06/15(Mon) 22:03

青木先生,袋井と申します。

ご教示を頂戴し,誠にありがとうございました。

データを眺めただけで,スケール化の有無による違いを明確に説明できる自信は
とてもありませんので,大きな間違いをしないように,
スケールのあり/なしの2種類を行い,考察をしたいと思います。

つまらない質問で,お手を煩わせてしまい,大変に申しわけございませんでした。

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る