編集部イチオシ

AlphaZero

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm https://arxiv.org/abs/1712.01815
8
前へ 1 ・・ 8 9
takodori @takodori

(承前)昨年、NHKがAIの特集番組で羽生さんを起用してDeepMind社を取材したときに、羽生さんと、Hassabis さんはチェスの対戦をしたのではなかったっけ。それが今回将棋が選ばれたのに効いているとしたら、将棋界のトップ外交の成果、といえるのかもしれない。

2017-12-08 08:23:15
nodchip@tanuki- @nodchip

@aq3948 同意です。そのようなところで実験時間を削って信用できない実験結果を出すより、最後まで指させたほうが良いと思います。

2017-12-08 08:40:19
Eikyu Ito @aq3948

これ、本当に時間節約のためならまだ可愛いんだけど、下手するとMCTSで終盤が実は弱くて、それを隠して結果を良く見せようとするためにあえて評価値で打ち切る対局設定にした、て見方も可能なんだよね。いやまあ自分がうがち過ぎなのかもしんないんだけど。 twitter.com/nodchip/status…

2017-12-08 08:45:53
Mariya Yao @thinkmariya

Alpha Zero doesn’t play like humans OR like computer engines. Optimizes for long-term positional sacrifices, when historically sacrifices are done tactically @demishassabis #NIPS2017 #NIPS #AI #ML #chess #games pic.twitter.com/ij9xZYUaII

2017-12-08 08:50:37
拡大
nodchip@tanuki- @nodchip

@aq3948 自分もその可能性はあると思いますし、他の方で同様の指摘をしている方もいます。MDの方々が指摘された点をもとに再度実験を行い、論文を改訂されることを願います。

2017-12-08 08:55:17
Eikyu Ito @aq3948

@nodchip あ、やはりそう思う方は他にもいるのですね。論文もですけど、私としては何よりfloodgateに来て実際に対局してほしいなと思います。それがいちばんすっきりします。

2017-12-08 08:59:40
uuunuuun @uuunuuun1

AlphaZero vs Stockfish戦、AlphaZero側は予め作成したOpening Bookを使用、Stockfish側はなしという条件だったようです。Stockfish側はこれについても怒っているようですね。

2017-12-09 01:50:13
Qhapaq_Shogi @Qhapaq_49

マヂだとしたら流石に手を抜き過ぎなんじゃ。全ての著者は等しく論文に貢献したのだから、戦犯レベルも全ての著者で等しいのよっ!!

2017-12-09 02:08:56
uuunuuun @uuunuuun1

Also the chess community is annoyed about the highly unfair match conditions. It is a fact, that AlphaZero has not only learned how to play chess, at the same time it has also learned the best openings (like humans do). This knowledge is stored in the neural net file from A0.

2017-12-09 02:56:36
uuunuuun @uuunuuun1

So in fact, AlphaZero has played with an precalculated opening book, created from a supercomputer with 5000 TPUs (first generation) and 64 TPUs (second generation) and a unknown number of CPUs. In the match, the Stockfish chess engine had exactly zero opening knowledge.

2017-12-09 02:57:27
uuunuuun @uuunuuun1

こんなメールを貰ったので。

2017-12-09 02:58:24
小島慎也 @Shinya_Kojima

公開されたAlphaZero のチェスの棋譜を見て、感じたことを記事にしました。 Blog: What AlphaZero shows us shinyakojima-blog.blogspot.com/2017/12/what-a…

2017-12-09 03:11:19
fof @fof_jisin

@uuunuuun1 AlphaZero ですが、あらかじめ作成した OpeningBook を使ったわけではなくて、自己対戦で学習する過程で、OpeningBook に相当するものを学習してしまっているからフェアでは無いという意見だと思います。>chess陣営の意見

2017-12-09 03:22:27
fof @fof_jisin

論文を読む限り、OpeningBookの設定に関しては書かれていませんし、少なくとも将棋に関しては論文に棋譜が乗せられていないため、elmo側のOpeningBookが有効だったかはよくわかりません

2017-12-09 03:35:03
fof @fof_jisin

DemisHassabisがtweetしているのを信じる限り、AlphaZero側はOpeningBookを使っていないはずですが、表現能力の高い評価関数であれば、OpeningBook相当の学習は行えてしまう可能性は高いため、もし対戦ソフトがOpeningBookを使っていないならばフェアと言えるのかという話だと思われます

2017-12-09 03:36:46
fof @fof_jisin

OpeningBook相当のものを学習してしまえるとして、それも含めて評価関数なのでという考え方もできますが、現状のchessや将棋のソフトはOpeningBookがあって初めて完全になるとも言える気もするので

2017-12-09 03:50:05
uuunuuun @uuunuuun1

レスをみる限りスナイパー型の定跡ではなく、真やね型の定跡を事実的に持っていたと見なせると。一方で従来型のソフトは評価関数の表現力が十分でないので定跡切ると不利になるのではということですか。

2017-12-09 07:19:31
kuma@Novice @naonza0

チェスは観ても分からんけどリアルタイムでここで観れるのか twitter.com/demishassabis/…

2017-12-09 09:41:00
Demis Hassabis @demishassabis

Announcing #AlphaZero - our general RL system that starts from random and learns thru self-play to beat the top chess, shogi & go programs! Preliminary arxiv paper: arxiv.org/pdf/1712.01815… Games here: goo.gl/UEHcWz More details in full peer-reviewed paper coming soon.

2017-12-09 07:28:58
Ulyemon @Ulyemon

AlphaZeroとstockfishの対局の仕方とOpeningbookの話がTLでちょっと出てた. 震源となったツイートをした人がソースとした文を見た感じだと, stockfishの評価関数はOpeningbookを使う前提で作られているのかな?

2017-12-09 09:57:11
Ulyemon @Ulyemon

それに対してAlphaZeroは, その高い表現力で強化学習の過程で序盤の指し方も学習している. だから両者ともOpeningbookなしで対局という条件はフェアじゃないという指摘と読んだ. この指摘は理屈としては理解できるかな.

2017-12-09 09:57:50
Ulyemon @Ulyemon

まぁ邪推だけど, Openingbook使ったstockfishにも圧勝してればそっちを書くんじゃないのかって気はする. 流石に試してないとは考えにくいと思うし.

2017-12-09 10:05:31
前へ 1 ・・ 8 9