- kasajimajima
- 163677
- 566
- 577
- 402
AIにかくれんぼをさせたら、徐々に高度な戦略を編み出していって、あるとき、隠れる側が鬼を隠すゲームになってるの、何度見ても笑う twitter.com/OpenAI/status/…
2019-09-20 15:01:16Wondering why the hiders did not cage in the seekers instead of building their own fort? In one environment variant where hiders have to protect glowing orbs, that's exactly what they learned to do! pic.twitter.com/yifS7rI4eR
2019-09-20 07:39:00詳細
凄い。OpenAIの成果。単純なかくれんぼを行なうなかで、次第に道具の複雑な使い方を獲得。人間が想定していなかった使い方まで発見した(道具を使って箱の上に乗りサーフォンをして移動し、最後には壁を乗り越える) Emergent Tool Use from Multi-Agent Interaction openai.com/blog/emergent-…
2019-09-18 05:04:22箱の上に乗って移動する様子 twitter.com/OpenAI/status/…
2019-09-18 05:07:16Unexpected and surprising behaviors included box surfing, where seekers learn to bring a box to a locked ramp in order to jump on top of the box and then “surf” it to the hider’s shelter. pic.twitter.com/v0kGfCYZna
2019-09-18 04:14:42道具を利用して超ジャンプする様子 twitter.com/OpenAI/status/…
2019-09-18 05:09:54And seekers learn that if they run at a wall with a ramp at the right angle, they can launch themselves upward. pic.twitter.com/SJv9SzctEp
2019-09-18 04:17:08“We want people to imagine what would happen if you induced this kind of competition in a much more complex environment,” Baker says. “The behaviors they learn might actually be able to eventually solve some problems that we maybe don’t know how to solve already.”
2019-09-18 05:32:16AI learned to use tools after nearly 500 million games of hide and seek technologyreview.com/s/614325/open-… “In a way, this study reaffirms the value of testing the limits of existing technologies at scale. The team also plans to continue with this strategy.”
2019-09-18 05:37:29第1段階:エージェントはランダムに移動する 第2段階:探す側が隠れる側を追いかける 第3段階:隠れる側が箱を移動して入り口を塞ぐ 第4段階:探す側が道具を利用して壁を乗り越える 第5段階:探す側に道具を使われないようにするために、隠れる側は道具を部屋の中に持ってきてから入り口を箱で塞ぐ
2019-09-18 05:54:20さらに、隠れる側は仲間同士で連携。遠くにある道具を1人が回収しに行き、そいつが帰って来る前にもう1人は箱を仲間のためにいい感じの場所に移動させておく。仲間が帰ってきたら箱を渡し、二つの入り口を2人でブロック。
2019-09-18 06:06:08さらに複雑な環境では 第1段階:エージェントはランダムに動く 第2段階:探す側が追いかけるようになる 第3段階:隠れる側がシェルターを作るようになる 第4段階:探す側が道具を使って壁を登りだす 第5段階:探す側に道具を使わせないようにする 第6段階:探す側がボックスサーフォンをやりだす
2019-09-18 06:16:25第7段階:探す側にボックスサーフィンをさせないようにするために、隠れる側があらかじめすべての道具をロックしてから隠れるようになる
2019-09-18 06:18:13強化学習はDQN、アルファ碁、アルファ碁ゼロ、アルファゼロ、マルチタスク深層強化学習、AutoML、Dota2のAI、スタクラ2のAI、 一人称視点AI、多人数ポーカーAI、麻雀AIなど、適用範囲が広がり続けた。この現状でさらにOpenAIは汎用AIを作るために1000億円を5年以内に使う予定 twitter.com/jaguring1/stat…
2019-09-18 06:47:47汎用人工知能(汎用AI)の開発を目標に、マイクロソフトは組織「OpenAI」に1000億円規模の投資を決めた。Greg Brockmanいわく、5年以内に使うとのこと。ますます開発競争が加速する。 Microsoft invests in and partners with OpenAI to support us building beneficial AGI openai.com/blog/microsoft/
2019-07-23 04:31:30AIにシンプルな「かくれんぼ」を繰り返し実行させることで複雑な戦略とその対抗策を生み出す試み gigazine.net/amp/20190918-h… 「AIが独自にこれほど複雑な協調適応をみせたことは、将来的により複雑で知的な動作を生み出す可能性があることを示唆している」
2019-09-18 19:24:15「今回の結果はより自由で多様な環境において、複数エージェントを用いた方法は、非常に複雑で人間に関連した行動を導き出す可能性があるという自信を抱かせます」
2019-09-18 19:25:12