セーブポイントからランダム探索をするって、AlphaGoのモンテカルロ法と似てる??(いまいち追い付けていない #neurips18yomi
2019-01-26 18:35:25Data-Efficient Hierarchical Reinforcement Learning 比較的現実的な階層型強化学習。上位方策から下位方策を選択する。(どういう行動を選択するか/ex. 物を運ぶ->物をつかむ) 既存研究FuNでは上位方策から下位方策までend-to-endで学習。 #neurips18yomi
2019-01-26 18:40:06ポリシーの階層化,複雑な表現を要素ごとに分割してそれぞれ考えようという意味で今日最初の方にあったdisrectangleの話に似てますね(本当にただの感想) #neurips18yomi
2019-01-26 18:40:14に対して、現状態 + 相対的なゴール = 絶対的なゴール座標に対する下位方策の学習。 #neurips18yomi
2019-01-26 18:40:18DeNA TechCon2018 ゲーム体験を支えるための強化学習 #denatechcon slideshare.net/juneokumura/de… @SlideShareさんから #neurips18yomi
2019-01-26 18:42:35比戸将平(PFN)さんによるテーマ発表 "Modeling the Physical World @ NeurIPS2018" #neurips18yomi
2019-01-26 18:47:46機械学習によって大量のデータから何でもかんでも学習さすのか、人間が持つ知恵をモデリングして導入するのか、いわゆるAIの本質を問うような話ですね #neurips18yomi
2019-01-26 18:55:31今日のまとめ 「NeurIPS2018読み会@PFNに登壇してきました」 拾えた範囲ですが各資料やリンクをメモしておきました r2d.info/2019/01/26/neu… #neurips18yomi
2019-01-26 19:12:56NeurIPS2018読み会@PFNを聴講してきました。 約6時間と長丁場で、頭が疲れたのよく眠れそう。近年のトレンドとそれに対して自分の不勉強な部分が如実に分かってとてもよかった。 #neurips18yomi
2019-01-26 19:18:50皆さん良い発表でしたが個人的には下の2つ良かったです。 @cruelturtle さんのテーマ発表「Neural Networks for Graph Data」 slideshare.net/emakryo/neural… グラフ生成の実験を個人的にやってみたくなった。発表の中でGNNをどう応用するかが次の焦点的なこと言ってたし。 #neurips18yomi
2019-01-26 19:20:32ドワンゴ大元さん論文紹介「CatBoost: unbiased boosting with categorical features」 niconare.nicovideo.jp/watch/kn3831 新規点の解説がとても分かりやすかった。 #neurips18yomi
2019-01-26 19:21:01Go-exploreは強化学習というより、擬似全探索アルゴリズムとして理解する方が自然。探索の過程で学習しないし、得られるのは探索の結果見つかった最良の軌跡だけだから。#neurips18yomi
2019-01-26 20:37:11強化学習勉強するためにオセロニア始めた。#neurips18yomi pic.twitter.com/Poqpjh1ez7
2019-01-26 21:01:51#neurips18yomi ですこし紹介されてた pytorch_geometric github.com/rusty1s/pytorc… を読んでいる 👀 Graph conv-net 面白そう
2019-01-26 23:54:44