みんなのオブザイヤーオブザイヤーを募集中!今年のツイート今年のうちにまとめよう!

AlphaZero

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm https://arxiv.org/abs/1712.01815
コンピュータ将棋 ログ チェス 将棋 Google
7682view 3コメント
7
Hiroharu Kato @hiroharu_kato
永世七冠のニュースの翌日にこれは… - Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (Google DeepMind) arxiv.org/abs/1712.01815
GouKoutaki @gou_koutaki
BonanzaやYaneuraOuが引用されている。
GouKoutaki @gou_koutaki
図1見ると、AlphaZeroはElmoより強くてレーティングが4500くらいあるように見える。
Tomoyuki Kaneko @tkaneko
エイプリルフールかと思った
瀧澤 誠@elmo @mktakizawa
おーDeepMindの論文にelmoデビューしとる。でもElmoって書いてあるから個人的にリジェクトで。しかし強い。DeepMind凄いね。arxiv.org/abs/1712.01815
瀧澤 誠@elmo @mktakizawa
ponanza引退してる場合じゃないですよ
Denny Britz @dennybritz
The generalization of AlphaGo Zero, called AlphaZero, achieves superhuman performance in all of Chess, Shogi, and Go. Starting from random play, and given no domain knowledge. New paper from DeepMind: arxiv.org/abs/1712.01815
やねうら王 @yaneuraou
RT> DeepMindの論文にやねうら王の文字があるんだけどw 何か知らないけど、やねうら王、世界的にデビューしてた!! pic.twitter.com/HVb1CZKue6
 拡大
math26 @math26
(ぬお、読まないと・・・) Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/pdf/1712.01815…
math26 @math26
(そういえばAlphaGoってまるで井山七冠のニュースにかぶせるようにいろいろ発表してませんでしたっけ)
Denny Britz @dennybritz
To be fair, “no domain knowledge” is not accurate. The input features and network architecture are domain knowledge. Unclear how to generalize to domains that look very different, but at least the MCTS part is general purpose. Authors acknowledge this. twitter.com/dennybritz/sta… pic.twitter.com/USpkLOdxec
 拡大
いもす @imos
最強囲碁AIを作っていたDeepMindが将棋AIとチェスAIも作ったらしい(今年の世界コンピュータ将棋選手権で優勝したelmoに対して90勝8敗2引き分けできる強さらしい) Browsing: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/abs/1712.01815
Ryoto_Sawada@Qhapaq @Qhapaq_49
あらら。思ったより早く来てしまいましたね。困りましたなぁ......
uuunuuun @uuunuuun1
elmoは一手35Mnodeでやっているようですね。alphaは40Knode。
Ryoto_Sawada@Qhapaq @Qhapaq_49
elmoのeは小文字であることを英語表記するべきだったか......
瀧澤 誠@elmo @mktakizawa
じーん。これって世界一って言ってますよね…ネタ勢なのに…DeepMind「a world-champion program」
瀧澤 誠@elmo @mktakizawa
実は次の大会は定跡生成、その次は探索でネタ出品しようと思ってたんですが、DeepMindがネタバレしてるので、これキャッチアップしないと駄目だよね
sako@海底 @kaitei_shogi
MTCSだと思考時間増やしたときのレートの伸びも良いってのは普通のことなんですかね
nyashiki @sizensuN
次の選手権は、追試に成功した人が勝ちますか
平岡 拓也‹‹\(´・_・` )/›› @HiraokaTakuya
DeepMindさんfloodgateに来ないかな〜(´・_・`) Twitterのリプで誘ってみた〜(´・_・`)
残りを読む(196)

コメント

上野 良樹@31日S29a規制中 @letssaga3 2017-12-08 01:22:42
今まで在野の研究者が開拓した分野に、大企業が本気を出せばこうなりますというのを見せつけられた感じです。もちろん、本気を出させた先人の功績は、繰り返し強調します。
ぷらずまわい_月曜西と21a @plaxma_y 2017-12-08 10:37:17
GPGPUすら投入されてない分野にTPUをぶっ込むんだろうか。一瞬でペンペン草も生えない焼け野原になるような…
nekosencho @Neko_Sencho 2017-12-09 14:52:32
同じソフトウェア技術なら高性能なコンピュータを投入したほうが強くなっちゃうので、ソフトの腕比べにするならコンピュータ側の性能をそろえる必要があるね。単に世界最強を目指すなら好きにやってくれってとこだけど
ログインして広告を非表示にする
ログインして広告を非表示にする