爆打に対する質疑応答

平成27年12月27日から28日にかけて、爆打の中の人が爆打に関する質問を受け付け、回答されたため、その内容を保存します。 なお、質問者のツイートは削除いたしました。 一つ、爆打でないアカウントのツイートがありますが、それは直後の質問に関連するツイートです。
3
爆打 @ai_mahjong

今月は少し早いですが、ここで対戦実験を打ち切りたいと思います。 対戦してくださった皆様ありがとうございました。 来月は東南で対戦する予定です。 pic.twitter.com/tLIo5TK2no

2015-12-27 12:25:39
拡大
爆打 @ai_mahjong

爆打が7段になり大きな反響があって驚いています。 twitterを見る限り、爆打について誤った知識が広まっているのでここで訂正していきます。

2015-12-27 12:31:03
爆打 @ai_mahjong

一番多そうな誤解は、「爆打は対戦するたびに強くなる」というものです。 おそらく機械学習という言葉からそう連想された人が多いのかもしれません。ゲームAIでは強化学習と呼ばれる対戦結果からパラメータを調整する方法はありますが、爆打はその手法をとっていません。

2015-12-27 12:33:52
爆打 @ai_mahjong

そのため、特東で打っても、仮に鳳南で打っても、何万試合こなそうとも、実力は一定です。 爆打の打牌が一定に見えないのは人間が似たような局面を同一視できるからであり、爆打は違う局面ととらえてしまっているからです。

2015-12-27 12:38:25
爆打 @ai_mahjong

もう一つ誤解は「爆打の安定段位が5.5程度の確変で7段」です。 確かに、特上の成績を通算で見ると安定段位は5.5です。 12月に改良を行っているので、通算で見るのではなく、今月の成績で見るのが正しい実力です。すなわち1639試合で平均順位2.39,安定段位6.8ほどです。

2015-12-27 12:45:18
爆打 @ai_mahjong

詳しい数字はあとで計算しますが、この成績がそこそこの確変と仮定しても、6~7段ループの実力はありそうです。開発者の実力も超えていると思います。

2015-12-27 12:54:14
爆打 @ai_mahjong

爆打について正しい知識を知ってもらうために、質問を受け付けます。 気になる点は質問してみてください。できる限り回答します。 質問集まり次第、今日の夜から回答を始めます。 質問の意味が分からない場合には無視するかもしれませんがご了承ください。

2015-12-27 13:06:16
爆打 @ai_mahjong

Q.現時点でこの先、安定○段までならおそらく到達可能という見通しや予想などはありますか? A.何を改良したらどれくらい実力が上がるのかさっぱりわからないため、全く予想できません。天鳳位の方が確か安定段位9段程度ですので、それを超えるのは目標ではあります。

2015-12-27 22:05:24
爆打 @ai_mahjong

Q.爆打にラス回避の思考は組み込まれているんですか? A.組み込まれていません。爆打の中終盤において手の決定はシミュレーションによって手を決定しています。そのシミュレーションの報酬は各順位を取る確率を求めそこから得られる期待順位です。1

2015-12-27 22:11:32
爆打 @ai_mahjong

期待順位の代わりに、順位の得点*順位を取る確率とすることで(プログラムを1行変更するだけ)ラスの重さを考慮したプレイヤは構築できます。 論文では平均順位で評価しているため、そのようなことは行っていません。2

2015-12-27 22:13:31
爆打 @ai_mahjong

Q.牌譜をいくつか拝見しましたが、無意味と思われる鳴きをするなど、鳴き判断の精度が低いように見えます。原因や、今後の改善の見通しなど、差し支えなければ見解を教えてください。 A.無意味なように自分も見えますが、最近考えが変わりました。1

2015-12-27 22:16:35
爆打 @ai_mahjong

恐らく爆打は待ちを精度よく見積もっており、鳴くことにより放銃するリスクは高まらず、また流局聴牌をあわよくば取りに行き、取れなくても相手を降ろして流局時の失点を減らしているのではないかと考えています。2

2015-12-27 22:18:17
爆打 @ai_mahjong

Q.パラメータが少し変わっただけでも異なると数えることにして、天鳳での対戦実験は、何種類の AI で、それぞれいつからいつまで行いましたか? A. 論文で書かれた以外のAIは対戦実験を行っていません。 対戦日程もさすがに覚えていません。大体100局/日行います。1

2015-12-27 22:25:52
爆打 @ai_mahjong

Q.12月の改良について、天鳳での対人戦のほか、自己対戦などの評価があれば教えてください。 A. 新しいプログラム1体 vs 古いプログラム3体の自己対戦72,247の結果、新しいプログラムの平均順位は2.48です。

2015-12-27 22:31:56
爆打 @ai_mahjong

Q.麻雀の情報処理分野での立ち位置はどうなのか? A.今年のゲームプログラムワークショップ (GPW) で麻雀の発表は5件あり人気なのかな?将棋・囲碁はやはりよく題材になり、次に麻雀・人狼ですね。

2015-12-27 22:35:36
爆打 @ai_mahjong

Q.麻雀の研究者同士のつながりはどうなっているのか? 基本的に全然ないです。交流は持ちたいです。 まったり麻雀のkmo2さんとは一度お会いしました。

2015-12-27 22:37:50
爆打 @ai_mahjong

Q. 爆打ではどのような事を目標にされていますか? A. 完全解明(ナッシュ均衡戦略を求める)は無理だと思いますが、ほかのゲームAIと同じように爆打の手を人間が学ぶようなぐらいに強くしたいですね。

2015-12-27 22:40:30
爆打 @ai_mahjong

Q. どういう条件を満たした際に改良をしますか? A. 論文書き終わったらです。

2015-12-27 22:43:07
爆打 @ai_mahjong

Q. urx.red/q7YB に関して、そのまま繋げたプログラムと機械学習と学習機能の違いを素人向けに説明してもらえますか。 A. 序盤の手の決定では鳳凰卓の牌譜の和了したプレイヤまた初めてリーチを打ったプレイヤを教師として学習しています。1

2015-12-27 22:50:42
爆打 @ai_mahjong

機械学習を使った手の選択ではある牌を切った手牌から、特徴量 (0,1で表現)を抽出し、その重みベクトルとの掛け算の総和で計算し、最も点数の高い手を選択しています。 これによってどんな手牌であっても同じ計算をするだけで手を選択できるためif文をずらずら並べるよりも簡単に書けます。2

2015-12-27 22:56:38
爆打 @ai_mahjong

どのような特徴量を使用するかは開発者が試行錯誤しながら作ってます。 ただ特徴量を作ってしまえばその重みは牌譜から自動で調節できるのが機械学習の強みです。3

2015-12-27 22:59:05
爆打 @ai_mahjong

Q. 爆打の強さは現在の作者のMAXか、もっと強くできますか。 A. もう開発者の実力を超えてます。しかしながら明らかに爆打のミスもありますので改良すればまだまだ強くなりそうです。

2015-12-27 23:01:49
爆打 @ai_mahjong

Q. 今後鳳凰や特南を打つ予定や希望ってありますか A. 来月、特南を打ちます。鳳凰は打ちたいですが許可されていません。 東風ばかり打っていますが、それは試合数を稼げるためであり、仮に鳳凰が許可されたとして鳳東が卓立たないなら鳳南でも問題はありません。

2015-12-27 23:06:26
爆打 @ai_mahjong

Q. 爆打は、見えている牌の枚数や、手出し・ツモ切りをすべて正確に把握して、それを打牌に反映させているのでしょうか?(・ω・) A. 把握しています。具体的には相手の聴牌率や待ち牌を推定する際に特徴量として使用しています。

2015-12-27 23:08:23