No.21251 クラスター分析の使用変数  【波音】 2014/08/07(Thu) 22:12

経験的にでも,数値解析上の観点でもよいのですが,クラスター分析の際に使用しない方が良い変数というものはありますか?

質問の意図はいくつかあるのですが,例えば,重回帰ではVIFの高い変数は除くとか,あるいは説明力の低い変数は除く,変数が多いと過学習を起こす,etc.といった理由で除くべき理由がありますよね。

 →同じような理由(恐らく数値解析上の問題)で,クラスター分析で除くべきものは?

別の観点で重回帰でモデルの内容妥当性(解釈のしやすさ)を重視するために,説明力が同じ程度の変数であればより解釈しやすい方を残す,といったモデル選択を行うことがあるかと思います(良いかどうかは別として)。

 →実質的な解釈の観点で,クラスター分析で除くべきものは?

特に後者は
 ・分類には使う(クラスター分析の変数として採用する)
 ・分類後,クラスターごとのグループ集計をして確認するための変数
  (分類には使わない,解釈のために後から集計する)
という使い分けとか,あるのでしょうか?

回答というより,意見レベルでお伺いしたくて質問をいたしました。

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る