AlphaZero
(承前)昨年、NHKがAIの特集番組で羽生さんを起用してDeepMind社を取材したときに、羽生さんと、Hassabis さんはチェスの対戦をしたのではなかったっけ。それが今回将棋が選ばれたのに効いているとしたら、将棋界のトップ外交の成果、といえるのかもしれない。
2017-12-08 08:23:15@aq3948 同意です。そのようなところで実験時間を削って信用できない実験結果を出すより、最後まで指させたほうが良いと思います。
2017-12-08 08:40:19これ、本当に時間節約のためならまだ可愛いんだけど、下手するとMCTSで終盤が実は弱くて、それを隠して結果を良く見せようとするためにあえて評価値で打ち切る対局設定にした、て見方も可能なんだよね。いやまあ自分がうがち過ぎなのかもしんないんだけど。 twitter.com/nodchip/status…
2017-12-08 08:45:53Alpha Zero doesn’t play like humans OR like computer engines. Optimizes for long-term positional sacrifices, when historically sacrifices are done tactically @demishassabis #NIPS2017 #NIPS #AI #ML #chess #games pic.twitter.com/ij9xZYUaII
2017-12-08 08:50:37@aq3948 自分もその可能性はあると思いますし、他の方で同様の指摘をしている方もいます。MDの方々が指摘された点をもとに再度実験を行い、論文を改訂されることを願います。
2017-12-08 08:55:17@nodchip あ、やはりそう思う方は他にもいるのですね。論文もですけど、私としては何よりfloodgateに来て実際に対局してほしいなと思います。それがいちばんすっきりします。
2017-12-08 08:59:40AlphaZero vs Stockfish戦、AlphaZero側は予め作成したOpening Bookを使用、Stockfish側はなしという条件だったようです。Stockfish側はこれについても怒っているようですね。
2017-12-09 01:50:13マヂだとしたら流石に手を抜き過ぎなんじゃ。全ての著者は等しく論文に貢献したのだから、戦犯レベルも全ての著者で等しいのよっ!!
2017-12-09 02:08:56Also the chess community is annoyed about the highly unfair match conditions. It is a fact, that AlphaZero has not only learned how to play chess, at the same time it has also learned the best openings (like humans do). This knowledge is stored in the neural net file from A0.
2017-12-09 02:56:36So in fact, AlphaZero has played with an precalculated opening book, created from a supercomputer with 5000 TPUs (first generation) and 64 TPUs (second generation) and a unknown number of CPUs. In the match, the Stockfish chess engine had exactly zero opening knowledge.
2017-12-09 02:57:27公開されたAlphaZero のチェスの棋譜を見て、感じたことを記事にしました。 Blog: What AlphaZero shows us shinyakojima-blog.blogspot.com/2017/12/what-a…
2017-12-09 03:11:19@uuunuuun1 AlphaZero ですが、あらかじめ作成した OpeningBook を使ったわけではなくて、自己対戦で学習する過程で、OpeningBook に相当するものを学習してしまっているからフェアでは無いという意見だと思います。>chess陣営の意見
2017-12-09 03:22:27論文を読む限り、OpeningBookの設定に関しては書かれていませんし、少なくとも将棋に関しては論文に棋譜が乗せられていないため、elmo側のOpeningBookが有効だったかはよくわかりません
2017-12-09 03:35:03DemisHassabisがtweetしているのを信じる限り、AlphaZero側はOpeningBookを使っていないはずですが、表現能力の高い評価関数であれば、OpeningBook相当の学習は行えてしまう可能性は高いため、もし対戦ソフトがOpeningBookを使っていないならばフェアと言えるのかという話だと思われます
2017-12-09 03:36:46OpeningBook相当のものを学習してしまえるとして、それも含めて評価関数なのでという考え方もできますが、現状のchessや将棋のソフトはOpeningBookがあって初めて完全になるとも言える気もするので
2017-12-09 03:50:05レスをみる限りスナイパー型の定跡ではなく、真やね型の定跡を事実的に持っていたと見なせると。一方で従来型のソフトは評価関数の表現力が十分でないので定跡切ると不利になるのではということですか。
2017-12-09 07:19:31チェスは観ても分からんけどリアルタイムでここで観れるのか twitter.com/demishassabis/…
2017-12-09 09:41:00Announcing #AlphaZero - our general RL system that starts from random and learns thru self-play to beat the top chess, shogi & go programs! Preliminary arxiv paper: arxiv.org/pdf/1712.01815… Games here: goo.gl/UEHcWz More details in full peer-reviewed paper coming soon.
2017-12-09 07:28:58AlphaZeroとstockfishの対局の仕方とOpeningbookの話がTLでちょっと出てた. 震源となったツイートをした人がソースとした文を見た感じだと, stockfishの評価関数はOpeningbookを使う前提で作られているのかな?
2017-12-09 09:57:11それに対してAlphaZeroは, その高い表現力で強化学習の過程で序盤の指し方も学習している. だから両者ともOpeningbookなしで対局という条件はフェアじゃないという指摘と読んだ. この指摘は理屈としては理解できるかな.
2017-12-09 09:57:50まぁ邪推だけど, Openingbook使ったstockfishにも圧勝してればそっちを書くんじゃないのかって気はする. 流石に試してないとは考えにくいと思うし.
2017-12-09 10:05:31