No.17282 どの検定を用いるべきか  【岩崎】 2012/08/10(Fri) 19:52

はじめて投稿致します。
8つの小学校で,同じ学年の子どもを対象に,同じ指導をしました。
指導前後で,行動面に変化(よくなった)があったかどうか,つまり指導効果を検証したいのです。
小学校       A B C D E F G H 
指導前 食べた   13 6 11 9 6 11 10 8
食べない  20 25 2 12 1 5 5 5
指導後 食べた 27 21 13 21 7 16 10 13
    食べない 6 10 0 0 0 0 5 0
上のデータは,指導前後の人数です。
全体の平均では,前後で差があるように読み取れるので検定をしたいですが,どの検定なのか分かりません。ご教示いただけるとありがたいです。統計は全くの素人です。
よろしくお願いします。

No.17283 Re: どの検定を用いるべきか  【青木繁伸】 2012/08/10(Fri) 22:42

8つの小学校の差は調べなくてよいということでよいのでしょうね。
このようなデータは対応のあるデータということになるので,小学生ごとに指導の前後で食べた,食べないの状態を記録しないといけません。つまり,

     指導前 指導後
小学生1 食べた 食べない
小学生2 食べた 食べた
  :   :   :

このようなデータを集計すると,以下のような集計表が得られます。
             指導後
        食べた  食べない 合計
指導前 食べた   a b a+b
    食べない  c     d c+d
    合計    a+c b+d a+b+c+d
そして,指導前と指導後で食べたものの割合が変化したかどうかは,マクネマー検定で検定します。以下のページを参照。
http://aoki2.si.gunma-u.ac.jp/lecture/Hiritu/McNemar-test.html

No.17284 Re: どの検定を用いるべきか  【岩崎】 2012/08/10(Fri) 23:12

青木先生,早速有り難うございます。
指導前に食べたと答えた児童が,指導後に食べたまたは食べなかったと答えた・・・・。というように,個人単位では把握できていません。
この場合,どのような検定が可能でしょうか?
カイ二乗検定になりますか?

No.17285 Re: どの検定を用いるべきか  【岩崎】 2012/08/10(Fri) 23:19

	食べた	食べなかった
指導前 74 75
指導後 128 21
度々すみません。
先ほどのデータからは,上記の集計しかできない状態です。
これを,意味のある変容といいたい場合,どんな検定が可能でしょうか?

No.17286 Re: どの検定を用いるべきか  【青木繁伸】 2012/08/10(Fri) 23:43

残念ながら,意味のある検定はできません
データさえあれば何とかなるというものではないです
どのようなデータがあるかが問題なのです

No.17290 Re: どの検定を用いるべきか  【岩崎】 2012/08/11(Sat) 10:35

お世話になります。
何回も申し訳ありません。

指導の前後で食べている児童は41.7%→85.9%に,食べない児童は50.3%→14.1%になっているので,どうしても何かしら言いたいのですが,今あるデータだけで処理できる方法はないのでしょうか?再度ご教示ください。よろしくお願い致します。

No.17291 Re: どの検定を用いるべきか  【青木繁伸】 2012/08/11(Sat) 19:44

この記事を最後まで読んでくださいね。

> 指導の前後で食べている児童は41.7%→85.9%に,食べない児童は50.3%→14.1%になっているので

41.7% ではなくて,49.7%ですね。

あなたが書いた表,
    食べた 食べなかった
指導前 74   75
指導後 128   21

は,間違っています。対応のある表は,以下のように書かないといけないのです。
                指導後
           食べた 食べなかった 合計
指導前 食べた     a b     74
    食べなかった  c    d     75
    合計      128 21     149
しかし,この表は,完成することができません。合計欄がこの通りになる表は,いくらでもあるのです。
たとえば,2つの極端な集計表
                指導後
           食べた 食べなかった 合計
指導前 食べた     53 21     74
    食べなかった  75   0     75
    合計      128 21     149
                指導後
           食べた 食べなかった 合計
指導前 食べた     74 0     74
    食べなかった  54   21     75
    合計      128 21     149
の間に20種類の表が考えられます。
あなたの実際のデータがそれらのうちのどれであるかがわからないので,検定を行う事ができないのです。
    食べた 食べなかった 合計
指導前 74   75      149
指導後 128   21      149
とすれば,「2群の比率の差の検定が行えるじゃないか」と思うかも知れませんが,その検定は正確に言えば「独立2標本の比率の差の検定」なのです。対応のある二標本の比率の差の検定(マクネマー検定)ではありません。

本来は対応のあるデータを対応のあるデータとして採らなかったために,使い物にならないデータが得られたということです。

で すが,今回の場合は考え得るどの表(データ)であっても,対応のある2標本の比率の差の検定(マクネマー検定)は高度に有意です(より正確な,二項検定で も同じ)。以下に示す22通りの表において,χ二乗値が3.84より大きければ,有意水準5%で有意(p 値は大変小さい)
  a  b  c  d χ二乗値
53 21 75 0 30.375
54 20 74 1 31.021
55 19 73 2 31.696
56 18 72 3 32.400
57 17 71 4 33.136
58 16 70 5 33.907
59 15 69 6 34.714
60 14 68 7 35.561
61 13 67 8 36.450
62 12 66 9 37.385
63 11 65 10 38.368
64 10 64 11 39.405
65 9 63 12 40.500
66 8 62 13 41.657
67 7 61 14 42.882
68 6 60 15 44.182
69 5 59 16 45.562
70 4 58 17 47.032
71 3 57 18 48.600
72 2 56 19 50.276
73 1 55 20 52.071
74 0 54 21 54.000
つ まり,「食べた生徒の割合が有意に高くなった」といえますが,その経過を単純に「応のある2標本の比率の差の検定(マクネマー検定)は高度に有意だった」 とは言えない。データ採取のミスを打ち明け,それでもなお,可能な全ての集計表のどれであっても有意だからという,言い訳を付さないといけない(まあ,書 かなくても良いけど,質問があったら「実は...」というしかない)ということです。

いつも,このようにハッピーエンドになるとは限りません。

No.17292 Re: どの検定を用いるべきか  【岩崎】 2012/08/11(Sat) 20:10

青木先生

今回のデータの取り方では検定できない,ということがよく理解できました。
かみ砕いて分かりやすくご説明いただき,本当に有り難うございました。
実は,このような指導をいくつも行っており,単純に処理できると考えていました。
統計って本当に奥が深いです!対応があるのに,独立2標本の比率の差の検定を行うよりは,いいわけ付きマクネマー検定のほうが良いということですよね?
他の方の質問に比べ,低レベルで申し訳ありませんでしたが,丁寧にご指導いただき感激です。

No.17294 Re: どの検定を用いるべきか  【青木繁伸】 2012/08/11(Sat) 21:06

> 統計って本当に奥が深いです!対応があるのに,独立2標本の比率の差の検定を行うよりは,いいわけ付きマクネマー検定のほうが良いということですよね?

独立2標本の比率の差の検定は,適用できないのです!!

No.17296 Re: どの検定を用いるべきか  【岩崎】 2012/08/14(Tue) 09:58

青木先生

丁寧にご説明いただいたのに,チンプンカンプンな返答をしてしまい申し訳ありません。有り難うございました。
データの取り方について,ご指摘いただいたように不備を示し,可能なすべての組み合わせでマクネマー検定したことを述べて,食べた児童が増えたことを言いたいと思います。
同様に実施した,他の指導についても,ご教示いただいたように検定してみました。
どの指導も,可能なすべての組み合わせで有意になっていました。
参考URLに先生のHPを記載させていただきます。お手数をおかけしました。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る