編集部イチオシ
2017年12月6日

AlphaZero

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm https://arxiv.org/abs/1712.01815
8
Hiroharu Kato @hiroharu_kato

永世七冠のニュースの翌日にこれは… - Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (Google DeepMind) arxiv.org/abs/1712.01815

2017-12-06 10:53:28
GouKoutaki @gou_koutaki

BonanzaやYaneuraOuが引用されている。

2017-12-06 11:45:51
GouKoutaki @gou_koutaki

図1見ると、AlphaZeroはElmoより強くてレーティングが4500くらいあるように見える。

2017-12-06 11:52:19
Tomoyuki Kaneko @tkaneko

エイプリルフールかと思った

2017-12-06 11:54:49
瀧澤 誠@elmo @mktakizawa

おーDeepMindの論文にelmoデビューしとる。でもElmoって書いてあるから個人的にリジェクトで。しかし強い。DeepMind凄いね。arxiv.org/abs/1712.01815

2017-12-06 12:10:48
瀧澤 誠@elmo @mktakizawa

ponanza引退してる場合じゃないですよ

2017-12-06 12:13:21
Denny Britz @dennybritz

The generalization of AlphaGo Zero, called AlphaZero, achieves superhuman performance in all of Chess, Shogi, and Go. Starting from random play, and given no domain knowledge. New paper from DeepMind: arxiv.org/abs/1712.01815

2017-12-06 12:15:07
やねうら王 @yaneuraou

RT> DeepMindの論文にやねうら王の文字があるんだけどw 何か知らないけど、やねうら王、世界的にデビューしてた!! pic.twitter.com/HVb1CZKue6

2017-12-06 12:23:10
拡大
math26 @math26

(ぬお、読まないと・・・) Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/pdf/1712.01815…

2017-12-06 12:32:04
math26 @math26

(そういえばAlphaGoってまるで井山七冠のニュースにかぶせるようにいろいろ発表してませんでしたっけ)

2017-12-06 12:34:23
Denny Britz @dennybritz

To be fair, “no domain knowledge” is not accurate. The input features and network architecture are domain knowledge. Unclear how to generalize to domains that look very different, but at least the MCTS part is general purpose. Authors acknowledge this. twitter.com/dennybritz/sta… pic.twitter.com/USpkLOdxec

2017-12-06 12:34:41
拡大
いもす @imos

最強囲碁AIを作っていたDeepMindが将棋AIとチェスAIも作ったらしい(今年の世界コンピュータ将棋選手権で優勝したelmoに対して90勝8敗2引き分けできる強さらしい) Browsing: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/abs/1712.01815

2017-12-06 12:37:44
Ryoto_Sawada🌥️Qhapaq @Qhapaq_49

あらら。思ったより早く来てしまいましたね。困りましたなぁ......

2017-12-06 12:43:40
uuunuuun @uuunuuun1

elmoは一手35Mnodeでやっているようですね。alphaは40Knode。

2017-12-06 12:44:37
Ryoto_Sawada🌥️Qhapaq @Qhapaq_49

elmoのeは小文字であることを英語表記するべきだったか......

2017-12-06 12:45:43
瀧澤 誠@elmo @mktakizawa

じーん。これって世界一って言ってますよね…ネタ勢なのに…DeepMind「a world-champion program」

2017-12-06 12:47:34
瀧澤 誠@elmo @mktakizawa

実は次の大会は定跡生成、その次は探索でネタ出品しようと思ってたんですが、DeepMindがネタバレしてるので、これキャッチアップしないと駄目だよね

2017-12-06 12:49:39
平岡 拓也 @HiraokaTakuya

@DeepMindAI Hey! I develop Shogi AI Apery! Let's play shogi with Apery in floodgate! wdoor.c.u-tokyo.ac.jp/shogi/floodgat…

2017-12-06 12:50:34
t @tokumini_ss

MTCSだと思考時間増やしたときのレートの伸びも良いってのは普通のことなんですかね

2017-12-06 12:51:30
nyashiki @nyashiki

次の選手権は、追試に成功した人が勝ちますか

2017-12-06 12:51:44
平岡 拓也 @HiraokaTakuya

DeepMindさんfloodgateに来ないかな〜(´・_・`) Twitterのリプで誘ってみた〜(´・_・`)

2017-12-06 12:52:25
残りを読む(196)

コメント

上野 良樹@C98 5/4月曜日南地区 "ハ "40b @letssaga3 2017年12月8日
今まで在野の研究者が開拓した分野に、大企業が本気を出せばこうなりますというのを見せつけられた感じです。もちろん、本気を出させた先人の功績は、繰り返し強調します。
0
nekosencho @Neko_Sencho 2017年12月9日
同じソフトウェア技術なら高性能なコンピュータを投入したほうが強くなっちゃうので、ソフトの腕比べにするならコンピュータ側の性能をそろえる必要があるね。単に世界最強を目指すなら好きにやってくれってとこだけど
0