「統計学関連なんでもあり」の過去ログ--- 045

No.16298　正規性の当てはまり　　【スペ】　2012/01/30(Mon) 12:11

ご教授お願いいたします。
現在，2つのサンプル数が同値であるデータ群についてどちらが正規分布に近いか（正規分布への当てはまり）を比較しようと思っているのですが，shapiro-wilk検定あるいはanderson-darling検定の統計量を用いて，shapiro-wilk統計量Wの値が1に近い(正規分布だと1?)あるいはanderson-darling統計量が小さいほど正規分布に近いとみなすことは可能でしょうか？
また，正規分布への当てはまりを検証及び比較する方法があれば御教えいただけないでしょうか。

宜しくお願いいたします。

No.16299　Re: 正規性の当てはまり　　【青木繁伸】　2012/01/30(Mon) 14:17

検定統計量は，対象としている統計量とサンプルサイズによって変わります。
サンプルサイズが同じ場合には，検定統計量の大小は対象としている統計量の大小と比例します。
サンプルサイズが同じなら，Wが1に近いほど対象としている統計量は小さくなる（正規分布に近い）
> example(shapiro.test)

shpr.t> shapiro.test(rnorm(100, mean = 5, sd = 3))　# 100 個の正規乱数

	Shapiro-Wilk normality test

data:  rnorm(100, mean = 5, sd = 3) 
W = 0.9683, p-value = 0.01634 # W が 1 に近い→正規分布に近い

shpr.t> shapiro.test(runif(100, min = 2, max = 4)) # 100 個の一様乱数

	Shapiro-Wilk normality test

data:  runif(100, min = 2, max = 4) 
W = 0.9348, p-value = 9.457e-05 # W が 1 から遠い→正規分布に近くはない

No.16300　Re: 正規性の当てはまり　　【スペ】　2012/01/30(Mon) 20:49

回答ありがとうございます。再度質問なのですが，
やはりサンプルサイズが違う場合は検定統計量の比較では
正規分布への近さを比較できないと考えてよいのでしょうか？
あと，
shpr.t> shapiro.test(rnorm(100, mean = 5, sd = 3))　# 100 個の正規乱数 Shapiro-Wilk normality
testdata: rnorm(100, mean = 5, sd = 3)
W = 0.9683, p-value = 0.01634 # W が 1 に近い→正規分布に近い
これはRで100個の正規乱数に対してshapiro-Wilk検定を行った結果だと思うのですが，
p値が0.01634と小さいのは偶然でしょうか？

ご教授お願致します。

No.16302　Re: 正規性の当てはまり　　【青木繁伸】　2012/01/30(Mon) 22:51

サンプルサイズが異なる場合は，検定統計量の違いがサンプルサイズの違いによるのか統計量の違いによるものか区別できないでしょう？ということです。

検定結果の例はたまたまということでしょう。
サンプルサイズが大きいと，ほんのちょっとの違いも検知してしまい有意になってしまうこともあるということでしょう。

No.16305　Re: 正規性の当てはまり　　【スペ】　2012/01/31(Tue) 05:31

青木先生，ご返答ありがとうございました。