No.15987 【数量化I類】偏回帰係数のt値について  【ゆーだい】 2011/12/14(Wed) 20:41

SPSSで数量化I類を行った結果,R2乗の値が低く,回帰式が良くないという結果を得ました。
このような結果を得たうえで,偏回帰係数のt値を用いて,各説明変数の目的変数への影響度を評価してよいのでしょうか?
もしくは,あまりよくない回帰式の上でのt値のため,そのような評価は行うべきではないのでしょうか?

No.15988 Re: 【数量化I類】偏回帰係数のt値について  【青木繁伸】 2011/12/14(Wed) 20:57

最終的な予測式があまり有用でないと言うことなので,係数の有意性を云々することも意味がないでしょう。R2 と同じく,サンプルサイズが大きいために統計学的には有意と言うことになっているに過ぎないのでしょう。

No.15989 Re: 【数量化I類】偏回帰係数のt値について  【ゆーだい】 2011/12/14(Wed) 21:27

ご指導頂き,誠にありがとうございます。
承知しました。今回数量化I類で得られたt値から,目的変数への影響度を評価しないようにします。
では,目的変数Aへの,説明変数B,C,D各々の影響度を見るためには,どのような検定方法を用いればよいのでしょうか?
たとえば,以下のようなときどのような検定方法がベストでしょうか?
歩行速度(A)を捉えるために実験を行いました。
被験者の属性には,男女(B),年齢(C)があり,実験は昼夜(D)に行いました。
歩行速度(A)に何(B,C,D)が大きく影響し,何があまり影響していないのか捉えたいと考えている。
この場合は,やはりそれぞれ単独(歩行速度Aと男女Bの関係を見てみる…)での検定しかないのでしょうか?
できたら,3つ(B,C,D)とも組み合わせた状態で検定したいと思っているのですが。
(たとえ3つとも組み合わせて検定できたところで,単独で検定した結果と変わらないのでしょうか?)
長々と申し訳ございません。更なるご指導の程,よろしくお願い致します。

No.15990 Re: 【数量化I類】偏回帰係数のt値について  【青木繁伸】 2011/12/14(Wed) 21:39

> では,目的変数Aへの,説明変数B,C,D各々の影響度を見るためには,どのような検定方法を用いればよいのでしょうか?

予測式が有用でないということだったので,ならば,その構成要素についての評価は余り意味がないだろうと申し上げただけ。

予 測の意図がなくて,単にどの説明変数が有意かということが目的なら,偏回帰係数の検定を行っても構わないでしょう。しかし,結果としてその係数(説明変 数)では被説明変数をよく予測できないということがわかっているのですから,説得力は弱いでしょう(やはり,サンプルサイズが大きいから有意な偏回帰係数 となっているのだろうと言われかねない)。

> たとえ3つとも組み合わせて検定できたところで,単独で検定した結果と変わらないのでしょうか?

い いえ,あなたの考え方が正しい。単独というのは個々の説明変数と被説明変数の相関(あるいは単回帰分析)のことを意味しているのでしょう。単変量解析を繰 り返して結果をまとめるのは間違っています。必要な説明変数を全部使った多変量解析の結果を解釈しなければいけませんから。

No.15991 Re: 【数量化I類】偏回帰係数のt値について  【ゆーだい】 2011/12/15(Thu) 00:04

ご指導頂き,誠にありがとうございます。
ご助言の通り,この場合だと偏回帰係数を評価したところで,それは説得力が弱く,あまり良い結果を示していないことになります。
では,この場合の対処法としては,どのような方法が考えられるのでしょうか?
※この場合とは,「目的変数(量的データ)への各説明変数(すべて質的データ)の影響度を単独ではなく組み合わせた状態で知りたい。しかし,数量化I類の分析では,予測式が有用ではない結果を得た。」
たとえば,小生が考えられるところでは以下のことぐらいです。
・数量化I類ではない分析手法を用いる
 →この場合にとって,より良い分析手法がありましたら,お教えください。
・説明変数を減らす
 →しかし,この場合だとR2乗の値がより低くなるかとは思いますが。
更なるご指導の程何卒よろしくお願い申し上げます。

No.15992 Re: 【数量化I類】偏回帰係数のt値について  【青木繁伸】 2011/12/15(Thu) 00:15

回帰分析ということで考えるならば,目的変数と説明変数は線形なのか,曲線関係にある説明変数があるか?くらいでしょう。
根 本的なところから言えば,そもそも歩行速度が性別や年齢や実験時刻で説明できるとなぜ考えたか。もっと関係のある変数があるのではないか(あるはず)とい うこと(身長,体重,下肢長,脚筋力,服装,履き物の種別などなど)。性別や年齢や実験時刻以外のことは考えないで,この3つのうちのどれがもっとも目的 変数に関係するかということならば,「予測精度は良くないが,実験条件下では○○がもっとも関係が強かった」などと言うしかないでしょう。

No.15993 Re: 【数量化I類】偏回帰係数のt値について  【ゆーだい】 2011/12/15(Thu) 00:25

ご指導頂き,誠にありがとうございます。
ご指導の通り,まず目的変数と説明変数の線形性を考察してみます。この度は具体的な例として,歩行速度,性別…の要素を使わせて頂きました。誤解を招くようで申し訳ございません。しかし,ご教授を参考にさせて頂き,もう一度説明変数の選定を考えてみます。
以上のことをやったとしても,あまり良い結果が得られないようでしたら,おっしゃるように,「予測精度は良くないが,実験条件下では○○がもっとも関係が強かった」と結論づけようと思います。

No.16021 Re: 【数量化I類】偏回帰係数のt値について  【青木繁伸】 2011/12/18(Sun) 19:53

数量化理論において,一とか二とかはローマ数字で書くのが慣例
つまり,数量化I類とか,数量化II類とか。
更に,I とか II は全角文字ではなく,I, II, III, IV のように,半角文字を組み合わせて表記する。それが常識。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る