【新機能】作り忘れたまとめはありませんか?31日前まで期間指定してまとめが作れる高度な検索ができました。有料APIだからツイートの漏れはありません!

AlphaZero

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm https://arxiv.org/abs/1712.01815
コンピュータ将棋 Google チェス 将棋
6732view 3コメント
7
ログインして広告を非表示にする
Hiroharu Kato @hiroharu_kato 2017-12-06 10:53:28
永世七冠のニュースの翌日にこれは… - Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (Google DeepMind) arxiv.org/abs/1712.01815
GouKoutaki @gou_koutaki 2017-12-06 11:45:51
BonanzaやYaneuraOuが引用されている。
GouKoutaki @gou_koutaki 2017-12-06 11:52:19
図1見ると、AlphaZeroはElmoより強くてレーティングが4500くらいあるように見える。
Tomoyuki Kaneko @tkaneko 2017-12-06 11:54:49
エイプリルフールかと思った
瀧澤 誠@elmo @mktakizawa 2017-12-06 12:10:48
おーDeepMindの論文にelmoデビューしとる。でもElmoって書いてあるから個人的にリジェクトで。しかし強い。DeepMind凄いね。arxiv.org/abs/1712.01815
瀧澤 誠@elmo @mktakizawa 2017-12-06 12:13:21
ponanza引退してる場合じゃないですよ
Denny Britz @dennybritz 2017-12-06 12:15:07
The generalization of AlphaGo Zero, called AlphaZero, achieves superhuman performance in all of Chess, Shogi, and Go. Starting from random play, and given no domain knowledge. New paper from DeepMind: arxiv.org/abs/1712.01815
やねうら王 @yaneuraou 2017-12-06 12:23:10
RT> DeepMindの論文にやねうら王の文字があるんだけどw 何か知らないけど、やねうら王、世界的にデビューしてた!! pic.twitter.com/HVb1CZKue6
 拡大
math26 @math26 2017-12-06 12:32:04
(ぬお、読まないと・・・) Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/pdf/1712.01815…
math26 @math26 2017-12-06 12:34:23
(そういえばAlphaGoってまるで井山七冠のニュースにかぶせるようにいろいろ発表してませんでしたっけ)
Denny Britz @dennybritz 2017-12-06 12:34:41
To be fair, “no domain knowledge” is not accurate. The input features and network architecture are domain knowledge. Unclear how to generalize to domains that look very different, but at least the MCTS part is general purpose. Authors acknowledge this. twitter.com/dennybritz/sta… pic.twitter.com/USpkLOdxec
 拡大
いもす @imos 2017-12-06 12:37:44
最強囲碁AIを作っていたDeepMindが将棋AIとチェスAIも作ったらしい(今年の世界コンピュータ将棋選手権で優勝したelmoに対して90勝8敗2引き分けできる強さらしい) Browsing: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/abs/1712.01815
妖怪惑星Qhapaq @Qhapaq_49 2017-12-06 12:43:40
あらら。思ったより早く来てしまいましたね。困りましたなぁ......
uuunuuun @uuunuuun1 2017-12-06 12:44:37
elmoは一手35Mnodeでやっているようですね。alphaは40Knode。
妖怪惑星Qhapaq @Qhapaq_49 2017-12-06 12:45:43
elmoのeは小文字であることを英語表記するべきだったか......
瀧澤 誠@elmo @mktakizawa 2017-12-06 12:47:34
じーん。これって世界一って言ってますよね…ネタ勢なのに…DeepMind「a world-champion program」
瀧澤 誠@elmo @mktakizawa 2017-12-06 12:49:39
実は次の大会は定跡生成、その次は探索でネタ出品しようと思ってたんですが、DeepMindがネタバレしてるので、これキャッチアップしないと駄目だよね
sako@海底 @kaitei_shogi 2017-12-06 12:51:30
MTCSだと思考時間増やしたときのレートの伸びも良いってのは普通のことなんですかね
nyashiki @sizensuN 2017-12-06 12:51:44
次の選手権は、追試に成功した人が勝ちますか
平岡 拓也‹‹\(´・_・` )/›› @HiraokaTakuya 2017-12-06 12:52:25
DeepMindさんfloodgateに来ないかな〜(´・_・`) Twitterのリプで誘ってみた〜(´・_・`)
残りを読む(196)

コメント

上野 良樹 @letssaga3 2017-12-08 01:22:42
今まで在野の研究者が開拓した分野に、大企業が本気を出せばこうなりますというのを見せつけられた感じです。もちろん、本気を出させた先人の功績は、繰り返し強調します。
ぷらずまわい @plaxma_y 2017-12-08 10:37:17
GPGPUすら投入されてない分野にTPUをぶっ込むんだろうか。一瞬でペンペン草も生えない焼け野原になるような…
nekosencho @Neko_Sencho 2017-12-09 14:52:32
同じソフトウェア技術なら高性能なコンピュータを投入したほうが強くなっちゃうので、ソフトの腕比べにするならコンピュータ側の性能をそろえる必要があるね。単に世界最強を目指すなら好きにやってくれってとこだけど

カテゴリーからまとめを探す

「ログ」に関連するカテゴリー

ログインして広告を非表示にする
ログインして広告を非表示にする