No.15933 正規分布とそうでないデータの検定  【統計ははじめてです】 2011/12/12(Mon) 02:36

  統計が初心者です。本を読んだりネットで読みましたが,解決できないので書き込みます。データの分析中でわからなくなりました。
ご教授下さい。

 n=26とn=11の比較と,また別な群分けでn=17とn=19で分析を始めました。
こ れらの群のときに,どのくらい質問ができたか?など連続尺度と統計しているのですが,正規分布のデータと正規分布でないデータが混在しています。データに ばらつきがあるものが多いので中央値を代表値として扱っています。データに正規性があるものもいくつかあるのですが,それだけは平均値で表記したほうがよ いでしょうか?

 その場合は等分散性があるデータはU検定,等分散性がないデータはwelchの検定でよいのでしょうか。
 そういう場合は,群の代表値がU検定の場合は中央値,welchの検定の場合は平均値になるのでしょうか?一覧にした時に中央値と平均値が入り混じり見づらいし,そもそも同じ土俵に乗せるのもおかしいと感じてきました。
 
 正規分布と正規分布でないデータが群の中に入り混じっていて,そのデータはわけて書けないときには,どのような検定で,どんなふうに表にするのか,ヒントを教えて下さい。

No.15937 Re: 正規分布とそうでないデータの検定  【青木繁伸】 2011/12/12(Mon) 08:10

> 等分散性があるデータはU検定,等分散性がないデータはwelchの検定

変な指針ですね。書き間違いですか。

> 群の代表値がU検定の場合は中央値

最近,別のスレッドでも答えましたが,U検定(クラスカル・ウォリス検定検定)は中央値の差を検定するものではありません。全体として,一方の群が他方より大きい傾向があるかどうかを検定するということです。

> そのデータはわけて書けないときには,どのような検定で,どんなふうに表にするのか,ヒントを教えて下さい。

見やすいように工夫して表にするしかないでしょう。

No.15938 Re: 正規分布とそうでないデータの検定  【統計ははじめてです】 2011/12/12(Mon) 09:41

青木先生。早々のアドバイスありがとうございます。
もう,一人では検定が本を読んでも,ネットでたくさんの方の質問と回答を参考にしても,わからなくなりました。U検定の最近のスレッドを確認いたしました。
  n=11とn=26の群,n=17とn=19の群で小さい標本ですが,小さい標本はt検定を使うべきではないというような情報を読みました。連続尺度で (最高値29,最低値2)など散らばりがあります。そのような時は・・・・正規性が仮定できないデータはクラスカル・ウォリス検定でと考えていました。
 今,論文作成の表には分散が等しいものはt検定,分散が等しくないものはwelchのt検定,中央値を併記していましたが,これはおかしい…と気付きました。でも,どうしたらいいか,ヒントを教えて下さい。

 ほんとにすみません何度もレベルの低すぎる質問に回答いただいて。これを機会に統計を知って使えるようになりたい。
 

No.15940 Re: 正規分布とそうでないデータの検定  【青木繁伸】 2011/12/12(Mon) 10:04

> 小さい標本はt検定を使うべきではないというような情報を読みました。

程度問題でしょ う。サンプルサイズが小さいと,標本平均や,標本分散が不安定(誤差が大きい)となりがちということはあります。例えば,母分布について,理論的に正規 性,等分散性が確保されているということが分かっていれば,サンプルサイズが小さくても何の問題もないでしょう。本来,統計学は「与えられた標本に基づけ ば」ということを前提にしているわけですから。

> 論文作成の表には分散が等しいものはt検定,分散が等しくないものはwelchのt検定,中央値を併記していましたが,これはおかしい…と気付きました

おかしくはないでしょう。
ただ,分散が等しかろうが等しくなかろうが Welch の方法による t 検定を使えば良いでしょう。また,検定の頑健性からいえば,正規分布に従っているかどうかは,そんなに重要に考える必要はないでしょう。

No.15943 ありがとうございます!!  【統計ははじめてです】 2011/12/12(Mon) 11:18

 青木先生。ありがとうございます。
本当にすっきりしました。確かに頑健性についてwelchの方法によ るt検定はしっかりしているというデータを見て,welchでいきたいと思ったのですが,私は正規分布でないデータもありそうだが本当にこのままでいいだ ろうか…と悩み始めたら,どんどん不安になりました。
 来週,論文提出で,土日に悩み悩んでいたので,ここの相談コーナーですぐに青木先生にアドバイスいただけたことに本当に感謝いたします。

 また,皆さまの今までの質問と回答も,私にとっては難しいものもたくさんですが,大変参考になりました。

青木先生,ありがとうございました。一生忘れないです!

No.15945 welch方法による検定値をかくなら  【統計ははじめてです】 2011/12/12(Mon) 11:34

 代表値として表にするのは平均値+標準偏差がよいでしょうか?

 先生のアドバイスを受けて,等 分散である検定値はt検定の値にしていたのを直すのですが,中央値のままでもおかしくないという先生のアドバイスの中には,本当はwelchの方法による t検定の場合は平均値が代表値であるが・・・というのもあるのか,教えていただけると嬉しいです。今後もwelchの方法によるt検定にはお世話になりそ うなので,教えて下さい。

No.15947 Re: 正規分布とそうでないデータの検定  【青木繁伸】 2011/12/12(Mon) 14:23

> 中央値を併記していましたが

平均値の差の検定(t検定,Welchの方法)のときに,中央値を併記しても平均値と中央値を併記するのは間違いではありません。

No.15960 ありがとうございます  【統計初心者】 2011/12/13(Tue) 06:58

 間違いではないのですね。わかりました。ありがとうございます。
青木先生が「それもあり」と背中を押してくれるので前に進めました。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る