No.17060 外れ値の検出  【こびと】 2012/06/12(Tue) 11:51

初めて書き込み&ご相談させて頂きます。

正規分布が仮定できないデータセットに対して,外れ値を検出するような方法はあるでしょうか。

具体的には,下記のような数値データ(単位なし)があった際に,一番下の「2.0」の値が他の値よりも外れた値である,ということをなんらかの統計手法を用いて,P値とともに示したいのです。
1.0
1.3
0.9
0.9
1.1
2.0

正規分布を仮定するならば,スミルノフの棄却検定やマハラノビス距離を用いた検定が使えるようですが・・・。

もしご存知でしたら教えて頂ければ幸いです。
宜しくお願い致します。

No.17151 Re: 外れ値の検出  【西村】 2012/07/06(Fri) 14:23

どんな分布を持つ母集団が対象であっても,無作為抽出であれば標本平均の分布は正規分布になるのでは?

自 分だったら,例えばjackknife resamplingとかでサンプルしたデータをリサンプリングして,まずは平均値のばらつきがどうなっているのか見てみますね。上の例で言えば,2.0 が含まれる場合の平均2.0が含まれない場合の平均群に対して幾分大きな値になっているはずです。

ただ,たった6サンプルしかないなら, どれぐらい外れているかという確率は出てこないような。(2.0が本当に突出した値なのかを判断するには不十分,という意味)Pは出てこないにしても, ○○という方法で例外的な値は除外して以後の統計学的解析を行った,という記述は可能です。その記述を同じ分野の人たちが受け入れてくれるかどうかは,分 野次第ですが。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る