編集部イチオシ

更新 2017年12月9日作成 2017年12月6日

AlphaZero

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm https://arxiv.org/abs/1712.01815

ログコンピュータ将棋チェス将棋 Google

merom686
12610
2
30
3
4

永世七冠のニュースの翌日にこれは… - Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (Google DeepMind) arxiv.org/abs/1712.01815

2017-12-06 10:53:28

GouKoutaki @goukoutaki

BonanzaやYaneuraOuが引用されている。

2017-12-06 11:45:51

GouKoutaki @goukoutaki

Elmoも。

2017-12-06 11:46:53

GouKoutaki @goukoutaki

図1見ると、AlphaZeroはElmoより強くてレーティングが4500くらいあるように見える。

2017-12-06 11:52:19

Tomoyuki Kaneko @tkaneko

エイプリルフールかと思った

2017-12-06 11:54:49

瀧澤誠@elmo @mktakizawa

おーDeepMindの論文にelmoデビューしとる。でもElmoって書いてあるから個人的にリジェクトで。しかし強い。DeepMind凄いね。arxiv.org/abs/1712.01815

2017-12-06 12:10:48

たま＠白ビール(24参戦中) @JKishi18gou

つ、ついにAlpha Zeroが将棋に手を出した？？ arxiv.org/abs/1712.01815

2017-12-06 12:11:06

瀧澤誠@elmo @mktakizawa

ponanza引退してる場合じゃないですよ

2017-12-06 12:13:21

Denny Britz @dennybritz

The generalization of AlphaGo Zero, called AlphaZero, achieves superhuman performance in all of Chess, Shogi, and Go. Starting from random play, and given no domain knowledge. New paper from DeepMind: arxiv.org/abs/1712.01815

2017-12-06 12:15:07

やねうら王 @yaneuraou

RT> DeepMindの論文にやねうら王の文字があるんだけどｗ　何か知らないけど、やねうら王、世界的にデビューしてた！！ pic.twitter.com/HVb1CZKue6

2017-12-06 12:23:10

拡大

math26 @math26

（ぬお、読まないと・・・） Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/pdf/1712.01815…

2017-12-06 12:32:04

平岡拓也 @HiraokaTakuya

これマジ卍？(´･_･`)

2017-12-06 12:32:27

math26 @math26

（そういえばAlphaGoってまるで井山七冠のニュースにかぶせるようにいろいろ発表してませんでしたっけ）

2017-12-06 12:34:23

Denny Britz @dennybritz

To be fair, “no domain knowledge” is not accurate. The input features and network architecture are domain knowledge. Unclear how to generalize to domains that look very different, but at least the MCTS part is general purpose. Authors acknowledge this. twitter.com/dennybritz/sta… pic.twitter.com/USpkLOdxec

2017-12-06 12:34:41

拡大

いもす @imos

最強囲碁AIを作っていたDeepMindが将棋AIとチェスAIも作ったらしい（今年の世界コンピュータ将棋選手権で優勝したelmoに対して90勝8敗2引き分けできる強さらしい） Browsing: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm arxiv.org/abs/1712.01815

2017-12-06 12:37:44