卒論で、麻雀ソフトやって見たいひとは、なにかテーマを絞って論文としないと、1年では到底成果がだせない。それとは別に、地味な開発は何年も継続して続けないと爆打ちレベルにはなれない。
2017-05-22 00:27:49和了りに向かうとした場合、ベタオリした場合のそれぞれソフトの選択との比較で評価しているとのこと。(評価値の差分を二乗誤差とかでみているのか?ときいたらそうではないとのこと、一致率を見ている?) <つづく>
2017-05-22 00:38:52閾値の調整は割と適当な手での調整っぽい。最初閾値を甘くしていたら、爆打事態が不正プレイヤーとして検出されたwとのこと。 状況証拠にしかならず、冤罪生むのでは?との質問には、閾値を厳しめみすると、ちゃんと、人も目で見ても相当怪しいと思えるものが引っかかるそうだが、最後はつの判断。
2017-05-22 00:40:48天鳳でうたせる回数制限とか、ソフトとの対戦拒否機能の実装とかは否定的だった。ソフト対戦拒否いれるとレートがインフレ化するのでは?とのこと。(私としてはそこは疑問だったが)
2017-05-22 00:46:48それと、天鳳の段位ポイントはあまり意識しておらず、平均順位を目標としているようだ。論文読む限り仕組みとしては、段位ポイントを目標としたプログラムにできる仕組みになっている感じ(多クラスロジスティック回帰にしてる)
2017-05-22 00:49:18あと、相手の平均和了点は前は、平均点をスカラーでもっていたけど、今は、x符y飜の毎の分散を持つようにしたとのこと。(前回お会いした時はここが平均値だけだったので平均が5700点とかで、差が6000点とかだと絶対逆転されないとおもってオーラスプレイしていた)
2017-05-22 00:51:28大体そんなところかな。爆打ちの人に聞いたのは。プログラミングの高速化についての工夫もちょこっと聞いたけど、テーブル利用してデータ事前に持ってるてきなこと言ってた。向聴数計算は、あらさんのページに載っているやり方とのこと。
2017-05-22 00:58:45序盤は、モンテカルロを使わず評価関数で選択しているとのこと、終盤同様モンテカルロを使うと弱くなるとのこと。 どういやって序盤と終盤を切り分けているかというと、 ベタオリした場合のシミュレーションの評価値(失点)を閾値としているとのこと。
2017-05-22 01:15:34もうひとつ。評価パラメータは500万くらい。それぞれは入力は0.1。 評価するとき、手牌は分割していない(分割とは手牌を、面子塔子対子孤立牌にわけること)
2017-05-22 01:37:37