2014年9月5日金曜日

Kobe.R #8 最尤推定法について

URL: http://kobexr.doorkeeper.jp/events/13962
日時: 2014/8/30 Sat. 10:00-12:00
場所: 三ノ宮駅周辺

発表3. 最尤推定法



観測データに確率分布をあてはめて、現象をモデル化したいということがあるのですが、こんな時に登場するのが最尤推定法です。非負の統計量、例えば発生回数や待ち行列への到着間隔のような現象のモデリングには、ポアソン分布がよく使われます。
URL: http://www.slideshare.net/florets1/mle-kober8




発表後の議論


例えば身長のデータに確率分布をあてはめる場合、有力な説明変数である、男女や年齢を考慮せずに分布をあてはめてもよいものだろうか。層分けすることで従う分布が変わってしまうこともあるだろう。あてはめる前の段階で考慮すべきではないだろうか。

一方、説明変数をあらかじめ見つけるのは難しいのも確かだ。業務で故障率の分析をしているが、用途、場所、使用条件などでデータを分けて分析すべきだろう。しかし、前提知識がないと、データだけを見ていても説明変数を拾い出すのは難しい。

実際のデータは男女、年齢のように単純な説明変数ばかりではない。データだけを見るのではなく、ドメイン知識を持つ人の助けが必要だ。データの背景を説明できる人といっしょにデータを分析できることが、Kobe.Rのねらいでもある。

ところで、観測データに対して混合正規分布のような複雑な形状の分布を直接あてはめてしまう機械学習の手法もある。あてはめた混合分布からそれぞれの分布のパラメーターを求めたら、それが説明変数といえるのではないか。

というような話で盛り上がりました。

(つづく)

0 件のコメント:

コメントを投稿