No.21519 2つの質的データ(名義尺度)の相関係数についてです  【BOZ】 2015/01/30(Fri) 09:25

2つの質的データ(名義尺度)の相関係数を出したいと思っています。
クラメールの連関係数を使えばよいという事まではわかったのですが,各セルの期待値が 5 未満の割合が 20 % 以上存在するため,カイ二乗検定が適用できません。
このような場合はクラメールの連関係数は使えないのでしょうか?
また使えないのであれば,関連の強さを調べる方法は何かありませんでしょうか?

ちなみに具合的なデータは以下の3×3の集計表です。

14, 0, 0
0, 12, 0
0, 1, 2

No.21520 Re: 2つの質的データ(名義尺度)の相関係数についてです  【青木繁伸】 2015/01/30(Fri) 10:31

クラメールの連関係数はカイ二乗検定統計量を使うだけ(検定はしない)なので,「各セルの期待値が 5 未満の割合が 20 % 以上存在する」などの場合にも問題なく使えるでしょう。

なお,対数尤度比検定(G2検定)ならば,「各セルの期待値が 5 未満の割合が 20 % 以下であること」などの条件はありません。

R の vcd パッケージの assocstats 関数を使うとよいでしょう。
> x <- matrix(c(14,0,0,0,12,0,0,1,2), byrow=TRUE, ncol=3)
> assocstats(x)
X^2 df P(> X^2)
Likelihood Ratio 48.129 4 8.8703e-10 <<-- G2検定
Pearson 46.846 4 1.6417e-09

Phi-Coefficient : 1.271
Contingency Coeff.: 0.786
Cramer's V : 0.899

No.21521 Re: 2つの質的データ(名義尺度)の相関係数についてです  【BOZ】 2015/01/30(Fri) 10:40

青木先生

さっそくのお返事大変ありがとうございました。
また,Rで計算までしていただきまして,大変感謝しております。
今後ともどうかよろしくお願いいたします。

● 「統計学関連なんでもあり」の過去ログ--- 047 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る