- hidetomasuoka
- 1745
- 4
- 1
- 0
トラブルシューティングのドキュメントが一番大切なのに、まとめスライドに載っていない悲しみ #Chainer_meetup
2017-06-10 14:56:2415時以降遅れて来る方は、2Fエントランスを入ったところにいる警備員さんにchainerですと言って僕の電話番号を聞いて、電話して下さい。下りて入館証を渡します。 #Chainer_meetup
2017-06-10 15:03:32代表的な強化学習アルゴリズム ・Q学習(Watking '89, Mnih+ '13 for Deep Learning) ・方策勾配法(Williams '92, Sutton+ '99, Lilicrap+ '15 for Deep) #Chainer_meetup
2017-06-10 15:22:18Chainer3兄弟です!! #chainer_meetup pic.twitter.com/bqFs5ohAo6
2017-06-10 15:22:22Open AI Gymさわったことないから適当に作ってたんだけど、ちゃんとインターフェイスとか作法とかそろえたenvを作った方がよいかなって思った #Chainer_meetup
2017-06-10 15:29:11・Replay Buffer ミニバッチ内のデータが偏らないようにするテクニック 過去の経験からサンプリングして学習する 何通りか実装済みでRL内にて選べるとのこと #Chainer_meetup
2017-06-10 15:31:00RLは環境実行の足並みが揃わないので、非同期マルチプロセスで実行する。 一方のMNは同期なのでくっつけるのは難しそう #Chainer_meetup
2017-06-10 15:34:14強化学習ではasync updateが主流、train_agent_asyncを呼ぶとマルチプロセス実行。なるほど #Chainer_meetup
2017-06-10 15:34:15ChainerMNインストールドキュメント chainermn.readthedocs.io/en/latest/inst… #Chainer_meetup
2017-06-10 15:36:53ChainerRLで三目並べを深層強化学習(Double DQN)してみた by qiita.com/uezo/items/87b… ChainerもPythonも初心者でもサクッと三目並べ作れるからChainerRLはすてき #chainer_meetup
2017-06-10 15:37:10