- enjoy_enjo_
- 130378
- 294
- 209
- 37
@tamanegi_itame 特定のコマンド入力の制限、とかならまだ大丈夫なんですが、特定の状況下で特定のコマンドを特定のタイミングで、みたいなバグだとコードで制限かけるのはもう不可能なんですよ……!
2022-08-11 23:58:37@KgPravda aiって、目標をedを見る的なものに設定するのは難しいのですか? 長時間生き残りが目標だと、バグで時間待ちは最善策に見えちゃいますね💦
2022-08-12 00:15:06@br_balloonfc もともと報酬として与えているのは勝利数と相手の体力だけなんです、でもそれでも、下手に戦って負けるよりスコアの平均値は上がるって判断なのかもしれません。
2022-08-12 00:16:54「人工知能はバグを認識できない」は間違っていたが、「これからの人工知能はBASARA勢が何故毛利の攻略情報を秘匿したのかを理解出来るようにならなければダメ」は当たってたな。
2022-08-12 00:07:57AIにゲームを学ばせるってことは、「AIがゲームを楽しんでるに違いない」と俺が納得するための戦いなんだということが分かった。その点では、人もAIも同じだわ。「こう遊んだらこう面白いんだよ!」という話は、すれ違い、100は伝わらない。
2022-08-12 00:14:49だんだんボス倒した後のカービィのダンスに見えてきたわ……。完全に味占めてるもん……。 pic.twitter.com/XQrq5Pe4tG
2022-08-12 00:27:11何が腹立つって、ゲームワンプレイ終ると「面白いゲームを遊べて嬉しい!」って言う設定にしてあるから、遅延使われると1000万ステップまで無言なんだよコイツ。1000万ステップも待てないから俺が痺れを切らして先に強制終了するしかない。二重に抗ってきてる。
2022-08-12 00:40:54簡略化するけど報酬付けは「勝利数」×1000 + 「勝利時の播磨灘の残体力」- 「敗北時の相手の残体力」みたいな数式になってるので、「下手に自分の体力削られてマイナス食らうくらいなら体力有利確定したところで試合を遅延する」という格ゲープレイヤーとしては正しい判断になってるっぽいな……。
2022-08-12 01:02:02伊達vsお市でフリーズバグ使って制限時間ギリギリにダメージ与えてタイムアップ勝利狙うのと逆で、体力有利確定したらフリーズバグ使ってコード上の規定タイムまで遅延するみたいな……。(播磨灘のゲーム自体にタイムアップはない、あるのは機械学習で無限遅延に陥ったとき用のコード内のタイムアップ)
2022-08-12 01:07:38播磨灘のゲームシステムとしてバグ使ってタイムアップ勝利を狙うならまだ許容範囲なんだけど、ここでいうタイムアップってプログラムが無限ループに陥ったとき用のエラー処理として俺が定めてる制限時間のタイムアップだから、それをメタってゲーム内の戦果上がってる扱いはちょっとな〜〜!?
2022-08-12 01:11:55あと5000万回も土俵に上げれば、遅延戦術よりも安定して相手に勝てるパターン・スコアが高くなるパターンを見つけるはずなので、信じて土俵に送り出し続けるしかない。
2022-08-12 01:23:59@nniiicccooholic 実はあんまりにも直らなかった場合にはそうしてやろうと思ってました。ただ学習中は本当の本当に70連勝で時間がかかってる時と区別がつかないので、もう少し様子見ですね。
2022-08-12 02:03:36