HDPがわかんないと騒いでいたら、実はLDAがわかってなかった!? でござるの巻
.@issei_sato @shuyo 確率変数はランダムさのところ写像がなってて,確率過程だと複数の測度のまとまりにばっとまとめて写されるとかいうところは,プログラム的に手続きのイメージがあれば実用的に困らない気がするのですが(難しいところは数学者さんにまかせて)
2011-01-14 00:25:20あーやっとおっしゃってることの意味がわかってきました。なるほど。 RT @issei_sato: Hがtopic の事前分布ということですが、ここでいうtopicというのは特定の単語分布を表していませんか? つまり、単語シンプレックス上のある点をトピックと呼んでいるということです
2011-01-14 00:31:31@issei_sato Hierarchical Dirichlet Process(Teh+ 2006) です。 http://www.gatsby.ucl.ac.uk/~ywteh/
2011-01-14 00:33:41@suzuvie_re @issei_sato Hがφ上の分布なのはわかってて(Teh+ 2006 には H=prior over φ dist とあって、これはさすがにまずいと思いますが)、それでなんで H がディリクレ分布なのかがわからなかったんです。
2011-01-14 00:40:14@shuyo φ~Hで、φは単語分布。 つまり単語シンプレックス空間上の点なので、Hは単語シンプレックス空間上の分布になりDirichlet分布になります
2011-01-14 00:42:36@issei_sato 了解&ありがとうございます。primitive な LDA から HDP への切り替え時に肝心なところがすっぽり抜けてしまっていたようです。おかげでいろいろ理解できました。ありがとうございます~。
2011-01-14 00:51:55@shima__shima もう測度論を使わなくても DP まわりの理解や議論ができる道具立てが揃ってきているので、用語だけ抑えていればいいかと。って、今理解してなかったことがバレた人間が言っても説得力ないですがw
2011-01-14 00:54:48.@shuyo そんな感じですよね… 点を集合に含めるのに四角の領域の無限連鎖を考えるとか,うぅ気持ち悪い〜とか思ってたのですが… だったら,点をもう公理にいれちゃえばいいのにとか思ってたもので…
2011-01-14 00:59:47