No.21388 データの前処理に関して  【Kai】 2014/10/17(Fri) 13:42

こんにちは。
いつもお世話になっております。

データの前処理について質問させてください。
私のデータは「色彩」「形容詞対(変量)」「時間(実験回数)」の3相です。
このデータの前処理なのですが同質でないものはセンタリングしなくてもよい,単位が違う場合はnormalizationしなくてはいけないとかかれていました。基準化においては単位をそろえる意味で変量にしなくてはいけないなぁということが分かるのですがセンタリングをどれにすればいいのかいまいち分かりません。
今回の場合「時間」に関してセンタリングしなくてはいけないのかなぁと自分の中では考えているのですが他にしなくてはいけない,もしくはしてはいけないということはありますでしょうか。

よろしくお願いいたします。

No.21389 Re: データの前処理に関して  【Kai】 2014/10/17(Fri) 13:46

連投申し訳ございません。
センタリングを行わないという手も今回の場合ですといいのでしょうか。

No.21390 Re: データの前処理に関して  【青木繁伸】 2014/10/17(Fri) 21:59

あなたの質問の本当のところがよく分かりませんが,データのセンタリングということならば,scale 関数を使うのかも知れませんし,そうであるならば center 引数が関与するのでしょう。引数の説明は以下のようになっていますが...

自助努力が望まれます。

center
either a logical value or a numeric vector of length equal to the number of columns of x.

ついでに,scale についても,

scale
either a logical value or a numeric vector of length equal to the number of columns of x.

No.21391 Re: データの前処理に関して  【Kai】 2014/10/19(Sun) 19:57

青木先生

ご返答ありがとうございます。
もう少し自分で調べてみたいと思います!

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る