No.16285 分布の差の検定を二要因で..  【林】 2012/01/27(Fri) 22:25

いつも大変参考にさせていただいています.統計初心者です.

さっそく質問ですが
データは下記リンクURLにありますような,生物の色彩型(5型)の出現度数分布を,地域別(3地域),雌雄別に調べたもの(仮想データ)です.

「北海道・雄,北海道・雌,本州・雄,本州・雌,九州・雄,九州・雌」
の6カテゴリーに対してなら,単純な分布の差の検定となるのですが,
できれば「地域・雌雄の二要因に対する分布の差の検定」のようなもの(交互作用にも配慮した)ができないかと思案しております.

統計学的には全くナンセンスかもしれませんが,ご助言いただければ幸甚に存じます.

https://www.sugarsync.com/pf/D627105_9_7468560331

No.16286 Re: 分布の差の検定を二要因で..  【青木繁伸】 2012/01/27(Fri) 22:53

> の6カテゴリーに対してなら,単純な分布の差の検定となるのですが,

そもそも,そうはならないでしょう。
どのようにサンプルをとったのかによって,結果は大違いになるでしょうから。
たまたま?北海道,本州,九州のサンプルサイズが,346,350,359 と近い値になっているが,なぜ近い値になっているのか,近い値にならないこともあるのではないか,近い値にならなければ,たとえば均一であるというような仮説が成り立つわけがないと言うこと。
また,逆に本来同じくらいのサンプルサイズになるはずがないのに同じになっているのがおかしいと言うこともあるわけで。
ようするに,どうして,そのようなサンプルサイズになったのかというのが,大問題。


No.16287 Re: 分布の差の検定を二要因で..  【林】 2012/01/27(Fri) 23:13

>青木先生
早々にご回答ありがとうございました.
サンプルサイズがそろっているのは,記述いたしましたとおり,データ型をご説明するための仮想データであるため,度数は適当にいれたのですが,結果として.サンプルサイズが均一になってしましました.大変失礼致しました.

No.16288 Re: 分布の差の検定を二要因で..  【青木繁伸】 2012/01/27(Fri) 23:30

なぜそのような例を入れたのかが疑問です。
例を挙げるのは分かりやすいようにと思ってのことでしょうが,過去ここの掲示版で,適切な例が挙げられたなあというのは数えるほどしかありません。不適切な例が挙げられ,その後の議論を誤った方向に導いてしまうと言う不幸な事例が数多くありました。
そもそも,サンプルサイズが均等になっているか,いないかが問題ではなく,サンプルサイズがどのように決められたか(結果的に決まったか)ということが問題なのです。
不適切な例では,そのような背景事情が一切分かりませんというか,誤った背景事情が述べられると言うことになります。そのような状況で,適切な議論は出来ません。

No.16291 Re: 分布の差の検定を二要因で..  【ひの】 2012/01/28(Sat) 03:07

2×3×5の3次元分割表にして検定すればよいでしょう。
カイ二乗検定では全体としての検定しかできないので,要因ごとの解析をするなら対数線形モデルですね。

No.16292 Re: 分布の差の検定を二要因で..  【林】 2012/01/28(Sat) 16:58

>青木先生
サンプルサイズや検定力について,これまで無頓着でした.あらためて修行しなおします.ご丁寧にコメントいただき,誠にありがとうございました.

>ひのせんせい
3次元分割表と対数線形モデル,再度確認してみましたら,ちょっと詳しい教科書を紐解けばでてきますね.初歩的な質問にご対応いただき,誠にありがとうございました.

以上,厚く御礼申し上げます.

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る