2月4日 第44回 コンピュータビジョン勉強会@関東 まとめ

今回のコンピュータビジョン勉強会@関東では、DQN以降ビジョンの研究でもあちこちで見かけるようになった強化学習や逆強化学習縛りの論文読み会を実施したいと思います。 強化学習に絡んだ論文であれば、特に発表された年や学会/論文誌問いません。ビジョンに絡めば尚可ですが、そこの縛りはありません。 尚、今回は午前中にPFN前田新一先生による招待講演を予定しております。奮ってご参加ください。 続きを読む
0
前へ 1 2 ・・ 11 次へ
ymats @ymats_

「これからの強化学習」自分の手元にもあります。(まだ読んだのは冒頭数ページまで) #cvsaisentan twitter.com/takmin/status/…

2018-02-04 10:15:25
Minagawa Takuya @takmin

「これからの強化学習」買いました!(読んだとは言ってない。)#cvsaisentan

2018-02-04 10:12:44
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 報酬の予測、美味しい果実がなる、みたいな正の報酬以外にも、肥料がかかる、雑草取りの手間がかかるなど、負の報酬も加味する。 そして将来の予想なので、不確実な部分がある

2018-02-04 10:16:56
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 強化学習では、あらかじめ正解を与えられない場合がある。それで試行錯誤で正解を求めるアプローチになる。 エージェントが行動を取り、外界から観測される状態sと、観測される報酬rがフィードバックされる

2018-02-04 10:19:06
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 強化学習で解ける問題として、「部分観測問題」(Partially Observable MDP)を含めれば、意思決定問題をたいてい記述できる。 環境を知らなくても、学習すれば良い

2018-02-04 10:23:51
あるふ @alfredplpl

ハードモードダンジョンも慣れてしまった #cvsaisentan

2018-02-04 10:24:48
坂本寛 @KanSAKAMOTO

@kantocv 配信有難いです。Ustの画質はアレなので資料必須ですね。#cvsaisentan

2018-02-04 10:26:33
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan バンディット問題。どのスロットマシーンを引くか、という問題。報酬はスロットマシーンのあたり、はずれ

2018-02-04 10:29:18
コンピュータビジョン勉強会@関東 @kantocv

公開されている資料がある場合は、こちらのアカウントでお知らせします。#cvsaisentan twitter.com/KanSAKAMOTO/st…

2018-02-04 10:30:31
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 人生の探索も似ている。子供の頃は好奇心旺盛でいろんなことを試すが、そのうち自分の経験に基づいて行動するようになる。

2018-02-04 10:30:57
おさかなさん @sakanazensen

前田先生のアナロジーわかりやすい #cvsaisentan

2018-02-04 10:31:17
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan ガリガリ君コーンポタージュ味のことかあああぁぁぁぁぁぁぁぁぁぁ!!!!!

2018-02-04 10:31:46
Minagawa Takuya @takmin

そう思えば子どもの理不尽な行動も我慢でき、、、る? #cvsaisentan twitter.com/tomoaki_teshim…

2018-02-04 10:32:16
あるふ @alfredplpl

人間はオペランド条件付けという方針で学習しているという研究が行動主義心理学から発見されています。これをモチーフに開発したのが強化学習です。豆知識。 #cvsaisentan

2018-02-04 10:33:01
あるふ @alfredplpl

あぁ、前田先生のおかげでだいぶ前提知識説明しなくてもよさそう #cvsaisentan

2018-02-04 10:33:50
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 価値ベースのアルゴリズム(DQN、Double DQN、Dueling Networks)など。もう一方は方策ベースのアルゴリズム

2018-02-04 10:33:55
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 探索、学習に時間がかかるし、それでいて、汎化性能があるかどうかは別問題。

2018-02-04 10:35:59
たけうま @_takeuma_

七千万回エポックも回すのか #cvsaisentan

2018-02-04 10:38:21
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 最初は累積報酬が0で、70 millions回は常に0。昔はここで諦めちゃってただろうに、今は計算機のパワーが高くなっただけあって、力技でもっと探索する。

2018-02-04 10:39:04
Aki Teshima 「OpenCVデバッグ探偵記」BOOTHで販売中 @tomoaki_teshima

@kantocv #cvsaisentan 結果がばらつく。表示されてるグラフはゲームごとの結果。結構ばらついている

2018-02-04 10:43:02
あるふ @alfredplpl

q学習は収束を保証しているけど、実際やってみると、ほとんど強化学習は収束しない。あくまで理論的に保証されているだけ。 #cvsaisentan

2018-02-04 10:43:18
おさかなさん @sakanazensen

メタヒューリスティックなアルゴリズムとかでも聞いたことあるような難しさ #cvsaisentan

2018-02-04 10:43:30
前へ 1 2 ・・ 11 次へ