爆打に対する質疑応答
- girl_meets_love
- 5244
- 7
- 1
- 0
今月は少し早いですが、ここで対戦実験を打ち切りたいと思います。 対戦してくださった皆様ありがとうございました。 来月は東南で対戦する予定です。 pic.twitter.com/tLIo5TK2no
2015-12-27 12:25:39爆打が7段になり大きな反響があって驚いています。 twitterを見る限り、爆打について誤った知識が広まっているのでここで訂正していきます。
2015-12-27 12:31:03一番多そうな誤解は、「爆打は対戦するたびに強くなる」というものです。 おそらく機械学習という言葉からそう連想された人が多いのかもしれません。ゲームAIでは強化学習と呼ばれる対戦結果からパラメータを調整する方法はありますが、爆打はその手法をとっていません。
2015-12-27 12:33:52そのため、特東で打っても、仮に鳳南で打っても、何万試合こなそうとも、実力は一定です。 爆打の打牌が一定に見えないのは人間が似たような局面を同一視できるからであり、爆打は違う局面ととらえてしまっているからです。
2015-12-27 12:38:25もう一つ誤解は「爆打の安定段位が5.5程度の確変で7段」です。 確かに、特上の成績を通算で見ると安定段位は5.5です。 12月に改良を行っているので、通算で見るのではなく、今月の成績で見るのが正しい実力です。すなわち1639試合で平均順位2.39,安定段位6.8ほどです。
2015-12-27 12:45:18詳しい数字はあとで計算しますが、この成績がそこそこの確変と仮定しても、6~7段ループの実力はありそうです。開発者の実力も超えていると思います。
2015-12-27 12:54:14爆打について正しい知識を知ってもらうために、質問を受け付けます。 気になる点は質問してみてください。できる限り回答します。 質問集まり次第、今日の夜から回答を始めます。 質問の意味が分からない場合には無視するかもしれませんがご了承ください。
2015-12-27 13:06:16Q.現時点でこの先、安定○段までならおそらく到達可能という見通しや予想などはありますか? A.何を改良したらどれくらい実力が上がるのかさっぱりわからないため、全く予想できません。天鳳位の方が確か安定段位9段程度ですので、それを超えるのは目標ではあります。
2015-12-27 22:05:24Q.爆打にラス回避の思考は組み込まれているんですか? A.組み込まれていません。爆打の中終盤において手の決定はシミュレーションによって手を決定しています。そのシミュレーションの報酬は各順位を取る確率を求めそこから得られる期待順位です。1
2015-12-27 22:11:32期待順位の代わりに、順位の得点*順位を取る確率とすることで(プログラムを1行変更するだけ)ラスの重さを考慮したプレイヤは構築できます。 論文では平均順位で評価しているため、そのようなことは行っていません。2
2015-12-27 22:13:31Q.牌譜をいくつか拝見しましたが、無意味と思われる鳴きをするなど、鳴き判断の精度が低いように見えます。原因や、今後の改善の見通しなど、差し支えなければ見解を教えてください。 A.無意味なように自分も見えますが、最近考えが変わりました。1
2015-12-27 22:16:35恐らく爆打は待ちを精度よく見積もっており、鳴くことにより放銃するリスクは高まらず、また流局聴牌をあわよくば取りに行き、取れなくても相手を降ろして流局時の失点を減らしているのではないかと考えています。2
2015-12-27 22:18:17Q.パラメータが少し変わっただけでも異なると数えることにして、天鳳での対戦実験は、何種類の AI で、それぞれいつからいつまで行いましたか? A. 論文で書かれた以外のAIは対戦実験を行っていません。 対戦日程もさすがに覚えていません。大体100局/日行います。1
2015-12-27 22:25:52具体的には,logos.ic.i.u-tokyo.ac.jp/~mizukami/pape… で3種類。logos.ic.i.u-tokyo.ac.jp/~mizukami/pape… で1種類。logos.ic.i.u-tokyo.ac.jp/~mizukami/pape… で1種類。logos.ic.i.u-tokyo.ac.jp/~mizukami/pape… で1種類。今月のアップデートで1種類です。2
2015-12-27 22:29:45Q.12月の改良について、天鳳での対人戦のほか、自己対戦などの評価があれば教えてください。 A. 新しいプログラム1体 vs 古いプログラム3体の自己対戦72,247の結果、新しいプログラムの平均順位は2.48です。
2015-12-27 22:31:56Q.麻雀の情報処理分野での立ち位置はどうなのか? A.今年のゲームプログラムワークショップ (GPW) で麻雀の発表は5件あり人気なのかな?将棋・囲碁はやはりよく題材になり、次に麻雀・人狼ですね。
2015-12-27 22:35:36Q.麻雀の研究者同士のつながりはどうなっているのか? 基本的に全然ないです。交流は持ちたいです。 まったり麻雀のkmo2さんとは一度お会いしました。
2015-12-27 22:37:50Q. 爆打ではどのような事を目標にされていますか? A. 完全解明(ナッシュ均衡戦略を求める)は無理だと思いますが、ほかのゲームAIと同じように爆打の手を人間が学ぶようなぐらいに強くしたいですね。
2015-12-27 22:40:30Q. urx.red/q7YB に関して、そのまま繋げたプログラムと機械学習と学習機能の違いを素人向けに説明してもらえますか。 A. 序盤の手の決定では鳳凰卓の牌譜の和了したプレイヤまた初めてリーチを打ったプレイヤを教師として学習しています。1
2015-12-27 22:50:42機械学習を使った手の選択ではある牌を切った手牌から、特徴量 (0,1で表現)を抽出し、その重みベクトルとの掛け算の総和で計算し、最も点数の高い手を選択しています。 これによってどんな手牌であっても同じ計算をするだけで手を選択できるためif文をずらずら並べるよりも簡単に書けます。2
2015-12-27 22:56:38どのような特徴量を使用するかは開発者が試行錯誤しながら作ってます。 ただ特徴量を作ってしまえばその重みは牌譜から自動で調節できるのが機械学習の強みです。3
2015-12-27 22:59:05Q. 爆打の強さは現在の作者のMAXか、もっと強くできますか。 A. もう開発者の実力を超えてます。しかしながら明らかに爆打のミスもありますので改良すればまだまだ強くなりそうです。
2015-12-27 23:01:49Q. 今後鳳凰や特南を打つ予定や希望ってありますか A. 来月、特南を打ちます。鳳凰は打ちたいですが許可されていません。 東風ばかり打っていますが、それは試合数を稼げるためであり、仮に鳳凰が許可されたとして鳳東が卓立たないなら鳳南でも問題はありません。
2015-12-27 23:06:26Q. 爆打は、見えている牌の枚数や、手出し・ツモ切りをすべて正確に把握して、それを打牌に反映させているのでしょうか?(・ω・) A. 把握しています。具体的には相手の聴牌率や待ち牌を推定する際に特徴量として使用しています。
2015-12-27 23:08:23