将棋の評価関数は左右対称であるべき?
@ohashihirofumi なるほど,ありがとうございます.仮に棋士の先生方にアンケートをしたらどういう結果になるか興味深いです.
2014-09-28 23:45:48ちなみにチェスはキャスリングが左右非対称なので、キャスリングの可能性がある場合は左右対称の2つのポジションの評価は違ってくる。
2014-09-28 22:51:22コンピュータ将棋の学習モデルのベンチマークがないから、結局どれがいいのか良く分からない。開発者は感覚的に分かっているかも知れないけど、客観的なデータは表に出てない気がする。探索部分に依存するし、学習に時間がかかるから、学習部分だけの評価は難しいのだろうけど。
2014-09-28 22:49:30初期局面が非対称だから、それが境界条件になって評価関数も非対称になりそう。ある時点の局面だけでなく、全体の流れで見た方が良いと思う。でも現実的には学習サンプルが少ないから左右対称で作ったほうが強い(かもしれない)
2014-09-28 23:05:15左右反転したら最善手が変わっていいなら非対称でいいと思うが、左右反転しても最善手は左右反転したものになる(はず)だから、評価関数は左右対称であるべきと思うな、やはり。
2014-09-28 23:00:53@HiraokaTakuya @kazu_nanoha @issei_y 例えば特徴量が桂馬の位置だけの評価関数があるとして、左右対称じゃない場合恐らく77桂<37桂になりますが、これは88に角がいることが多いことを暗黙に学習してしまっている状態だと考えられます。(続く)
2014-09-28 23:05:20@HiraokaTakuya @kazu_nanoha @issei_y (続き)恐らく桂馬だけの場合、左右非対称の方が強いでしょうけど、特徴量が増えてきた時に、この初期配置から生じる駒の偏りを暗黙に取り込む(≒過学習)のは強さの面でもマイナスになってくるのではないかと思います
2014-09-28 23:06:10@HiraokaTakuya @kazu_nanoha @issei_y 3駒関係程度でもプラスの方が大きいかもしれないですが、哲学的には左右対称で頑張りたい、というのが私の見解ですね。(終わり)
2014-09-28 23:08:00え、理論的に言って、「評価値は左右対称」以外考えられないんじゃないの?そうでない理由が全く理解できない。少なくとも将棋の神様から見れば自明だよね
2014-09-28 23:15:15で、すごいどうでもいいんだけどアンサイクロペディアの井山裕太の記事を思い出した。「2000年ごろ、家族内であまりにも強すぎたために、家族が不利な展開になったときは囲碁盤を180度回転して続きを打つという家族内ルールが存在したという。」 webcache.googleusercontent.com/search?q=cache…
2014-09-28 23:18:24ほー。 羽生四冠もまったく同じエピソードがありまして、 小学生の時の羽生さんーお父様・お母様・妹さん連合軍 で羽生さんが必勝になると将棋盤逆にして、そっから勝つという。たしか「逆転将棋」と呼ばれていたんでしたっけ
2014-09-28 23:22:25@hiraokatakuya @issei_y 横から失礼します。一つお聞きしたいのですが、プログラムがある局面で読む手にその前までの流れ(局面)が影響するものですか?その局面から先の手を読むのであれば、初期局面に関係なく、左右対称ならば同じ手を読むことになるかと思うのですが…。
2014-09-28 22:35:04.@toshim_tw @HiraokaTakuya 将棋というのは任意の初期局面から勝つというゲームならその主張は間違いなく正解なのですが、現実問題は初期局面は左右非対称のゲームとして始まるというのが問題のポイントかと
2014-09-28 22:41:52@issei_y @hiraokatakuya なるほど。そうすると、理論的にどうあるべきかというより、実践的にどうする方がいいか、という話ね。すっきりしました、ありがとう。
2014-09-28 22:48:25@issei_y (左右の)慣れの感覚ってでも多分人間には重要で、トラック競技でいつも左回りってのも同じようなことだよね。慣れていない逆方向に回るとタイムが落ちるとか…(これは体の構造の非対称性が絡んでたりするのかね)。計算機ではやっぱりそういう感覚のバイアスは排除すべきでは?
2014-09-28 22:29:38.@toshim_tw 左右反転を同じ評価値にするとやはりモデルの表現力が落ちるので、例えば相穴熊の微妙な差を表現するのが難しくなります。左右反転しても同じじゃない評価も出るなら、(一般に良しとされている)相穴熊が先手良しというのは、簡単に表現できます。
2014-09-28 22:36:31@issei_y ここでの左右反転は盤面の部分的に、ということ?盤面全体を左右反転するという状況はあまり想定できないけど…。(評価関数に反転対称性みたいなものが入るわけではないよね?)全体のバランスや手番で微妙に優劣がつくというのが一般には自然かなぁなんて思うけど。
2014-09-28 22:42:38.@toshim_tw 争点がずれている意味が(たぶん)わかりました。評価関数の構成要素は基本的には盤面の部分部分の評価の合計になります。左右反転しても同じ評価値を取るなら (▲19玉と▲28銀形の評価値) = (▲99玉と▲88銀形の評価値)みたいになります。
2014-09-28 22:45:55@issei_y @wiiu_boy 確かに手番の影響はあるね。それは忘れてました。で、(考えてみたら当然あるはずだけど)相手・周りの駒の配置も評価に影響するよね?そうすると、ローカルに左右対称を取り込んでも、すぐ周りの駒の影響で対称性は崩れるから実は影響ないんでは…?
2014-09-28 23:12:00