No.15681 SVMの元データに統計情報を積むには  【SVM勉強中です】 2011/11/19(Sat) 15:08

非線形SVMの精度向上のため,対象データの統計情報(同じクラスの,時系列データの各年の分散,SD値,平均値など)を追加するにはどうすればいいでしょうか。
カーネルの内積に情報を追加するのでは,と予想していますが,正確にわからず困っています。

例えばみかん,りんご,いちごの3クラスの画像が含まれた,
2000〜2005年の5年分のデータがあるとして,
2000年と2005年の「みかん」クラスのSD値は3,平均は5,
2000年と2002年の「みかん」クラスのSD値は5,平均は5.5
2000年と2005年の「りんご」クラスのSD値は・・・
といった統計情報をデータに反映させてから,分類器にかけたいのです。

もしヒントでもご存知でしたらぜひ教えてください。
ズバリではなくても,参考情報でも教えていただけると嬉しいです。
よろしくお願い致します。

No.15684 Re: SVMの元データに統計情報を積むには  【青木繁伸】 2011/11/19(Sat) 19:47

よく分からないので,回答するなと言われるかも知れませんが,「分散,SD値,平均値などを追加する」って,単 に,元データを使用するというだけのことではないですか?逆にそれらの情報を削除して,それぞれのデータを均等に扱うときに標準化データを使用すると言う ことの逆ではないのですか?

No.15747 Re: SVMの元データに統計情報を積むには  【SVM勉強中です】 2011/11/24(Thu) 05:02

青木様

お礼が遅くなってすみません。書きこみをありがとうございました。
おっしゃるとおり,元データにそれらの統計情報はもともと潜在しています。
説明不足で申し訳ありません。
データは年度順に並べて使用していますが,「03年を基準とした各年とのSD値の差」などの,年度の飛び火?した比較を,どうやって入れられるのかな,と疑問でした。恣意的に,それらの情報を明示しないとダメなのではないか,と思いました。
もう少し考えてみます。ありがとうございました。

● 「統計学関連なんでもあり」の過去ログ--- 045 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る