コンピュータ将棋入門 中身はどうなっているのか?
@CordwainersCat 「GA将」ってここかな GA将!!!!!! in Action http://t.co/0MVe5Zw9ZY 強化学習を使っているソフトってボナンザ以前にもあったのか。 教師無し学習なのね
2013-05-21 01:14:24@bokudentw 人工知能(的側面)と言えば機械学習の手法だと思うけど、森岡さんて人が作ってる「GA将」ってソフトが強化学習を使ってて、ユニークで面白いんだよね。 今の主流は皆、ボナメソ(棋譜からの教師あり学習)なのに「わが道を行く」って感じで。
2013-05-21 00:20:03@CordwainersCat むむ、教師なし学習でいく?ワシは教師アリじゃないとボードゲームは無理だと思えるけどなあ。ボナンザより保木さん、カナダで研究者やってたんだけど自由時間が長いのでボナ作れたってのが最大のスゴイ所かとwカナダはのんびりソフト開発できるから強い?
2013-05-21 01:34:00@bokudentw そうそう、私は森岡さんのブログの方を読んでたんだけど。 ボードゲームの学習を考えるなら、普通はまず強化学習などの教師なし学習を考えるよね。 ボナンザメソッドの凄いところはプロ棋士の棋譜を「最善(に近いもの)」とみなして教師あり学習に変えてしまった所だとオモ。
2013-05-21 01:29:58@bokudentw いやまあ、教師信号があれば良いけど「何が最善か」なんて普通は分からないから、対戦させて勝った方に重みを付けて行くと言うような教師無し学習の発想になると思うんだよ。ボナンザはプロ棋士の棋譜(指し手)をとにかくほぼ最善とみなして学習させてしまうと言う割り切りが
2013-05-21 01:39:41@CordwainersCat あ、そういう方向ね。対戦させて重み付けでも悪くないと思う。ただしボナは内部変数一万点以上らしいからね。普通の人じゃそこまで考えつかないレベルwプロ棋士の棋譜を学習させるのは斬新だったね。棋譜はいちおう選択しているからそこら辺のセンスもいいみたいね
2013-05-21 01:43:57@bokudentw 凄いなあと。もちろん、ただ単純に棋譜の指し手を真似てると過学習に落ち込んでどもならんので、その辺の工夫もいろいろ凄いわけだが。
2013-05-21 01:41:21@bokudentw うん、「駒同士の位置関係」と言う特徴を一万個以上も自動抽出してその一次結合で評価関数を作って自動学習させようなんて発想が物凄いよね。力技と言うか何と言うか。 最初の学習には何ヶ月もコンピュータを振り回したらしいし。
2013-05-21 01:52:46追加 リンクなど
コンピュータは将棋をどのように変えるのか? http://t.co/lCgRGKyMY3 電王戦最終局を「GPS将棋の探索木」で読んでみた http://t.co/1Ys0H7yZvf 将棋ソフトは伝説の一手を発見できるか? http://t.co/nhRo84xNJy
2013-05-21 14:58:44リンク集 コンピュータ将棋のページ(更新されてない) http://t.co/6DxP5JLkV3 ず’s 将棋 http://t.co/VTI0HDYa9B Modified by Yasuhiro Ike http://t.co/MLRB80E6p4
2013-05-21 15:03:10渡辺竜王がレーティングおおよそ3000と言う情報は
「ボナンザvs勝負脳」
という本で竜王自身がいっていた。
激指11のレーティングが3200というのもあくまでブログ主の推定
しかし激指12が激指11より強いのは確からしい、、
将棋ソフト激指(各バージョンの棋力を推定) http://t.co/jWEoZfv9gQ ソフト激指の強さをレーティングで表現、激指11はレーティング3200?!えー渡辺竜王は3000ぐらいといってたが、竜王より強いの?! http://t.co/MLjWPGV1TW
2013-05-21 15:14:43