HDPがわかんないと騒いでいたら、実はLDAがわかってなかった!? でござるの巻

HDP-LDAを理解する上で大いなる助けになると思い、@shuyo さんの許可を得てとげったしました。
4
しましま @shima__shima

.@issei_sato @shuyo 確率変数はランダムさのところ写像がなってて,確率過程だと複数の測度のまとまりにばっとまとめて写されるとかいうところは,プログラム的に手続きのイメージがあれば実用的に困らない気がするのですが(難しいところは数学者さんにまかせて)

2011-01-14 00:25:20
enjoy my life @issei_sato

@shuyo Teh+ 2006の実際のタイトル教えていただけますか?

2011-01-14 00:30:45
shuyo @shuyo

あーやっとおっしゃってることの意味がわかってきました。なるほど。 RT @issei_sato: Hがtopic の事前分布ということですが、ここでいうtopicというのは特定の単語分布を表していませんか? つまり、単語シンプレックス上のある点をトピックと呼んでいるということです

2011-01-14 00:31:31
enjoy my life @issei_sato

@shuyo あぁ、それならHは、やはりφ上の分布ですね。

2011-01-14 00:35:40
shuyo @shuyo

@suzuvie_re @issei_sato Hがφ上の分布なのはわかってて(Teh+ 2006 には H=prior over φ dist とあって、これはさすがにまずいと思いますが)、それでなんで H がディリクレ分布なのかがわからなかったんです。

2011-01-14 00:40:14
enjoy my life @issei_sato

@shuyo φ~Hで、φは単語分布。 つまり単語シンプレックス空間上の点なので、Hは単語シンプレックス空間上の分布になりDirichlet分布になります

2011-01-14 00:42:36
shuyo @shuyo

@suzuvie_re わかってしまえばポカに近い単純な話でしたね。お恥ずかしい。ありがとうございました。

2011-01-14 00:47:47
shuyo @shuyo

@issei_sato 了解&ありがとうございます。primitive な LDA から HDP への切り替え時に肝心なところがすっぽり抜けてしまっていたようです。おかげでいろいろ理解できました。ありがとうございます~。

2011-01-14 00:51:55
shuyo @shuyo

@shima__shima もう測度論を使わなくても DP まわりの理解や議論ができる道具立てが揃ってきているので、用語だけ抑えていればいいかと。って、今理解してなかったことがバレた人間が言っても説得力ないですがw

2011-01-14 00:54:48
しましま @shima__shima

.@shuyo そんな感じですよね… 点を集合に含めるのに四角の領域の無限連鎖を考えるとか,うぅ気持ち悪い〜とか思ってたのですが… だったら,点をもう公理にいれちゃえばいいのにとか思ってたもので…

2011-01-14 00:59:47