No.17575 重回帰について  【川島】 2012/10/26(Fri) 11:53

始めて相談させていただきます。
よろしくお願いいたします。

現在化合物の構造から得られたパラメータ(全部で133個)からその化合物の体内での消失半減期を予測するという研究をしています。

各項目は原子の数を数えたものなど様々なものが含まれています。

統計ソフトRを用いて全てのパラメータを用いて線形回帰を行うのではなく,半減期と相関のあるパラメータのみを用いて線形回帰を行ったほうがよいのでしょうか?

また相関のあるパラメータのみを用いる場合はどの程度までパラメータを絞るべきなのでしょうか?

よろしくお願いいたします。

No.17576 Re: 重回帰について  【青木繁伸】 2012/10/26(Fri) 12:29

ステップワイズ変数選択という手もあるでしょう。
パラメータの中に必然的に相関の高いものがあるならば,PCR 回帰などを行う方がよいでしょう。

> 半減期と相関のあるパラメータのみを用いて線形回帰を行ったほうがよいのでしょうか?

その方法は間違っています(すくなくとも適切ではありません)。

No.17577 Re: 重回帰について  【川島】 2012/10/26(Fri) 12:46

お返事ありがとうございます。

ステップワイズ法について勉強したいと思います。

Rを用いて全てのパラメータを用いて線形回帰を行ったのですが,いくつかのパラメータの回帰係数がNAとなってしまいました。
これはパラメータの数が多すぎるのが原因なのでしょうか?

No.17579 Re: 重回帰について  【青木繁伸】 2012/10/26(Fri) 13:07

そういうことです。使用できる独立変数の個数は「データ数-1」です(理論的に決まっています)。
一次従属が明らかな変数はモデルから外されます(NA になります)。

No.17580 Re: 重回帰について  【川島】 2012/10/26(Fri) 13:28

なんどもお返事ありがとうございます

パラメータと半減期で相関係数をとったのですがもっとも高いもので0.5程度でした。
(それ以外は大体が0.2以下)
このような場合でも線形回帰によりモデルの作成はできるのでしょうか?

たびたび質問申し訳ありません

No.17581 Re: 重回帰について  【青木繁伸】 2012/10/26(Fri) 13:45

やってみれば結果はわかります

No.17582 Re: 重回帰について  【川島】 2012/10/26(Fri) 14:07

返信ありがとうございます

また質問させていただくかもしれません。
何度もありがとうございました

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る