- kasajimajima
- 45979
- 84
- 11
- 1
nemo
@nemomanas
わかる 『理想的な評価関数は「1手先の評価値がゲーム終了時の勝敗と一致する」というものだと思っていて、一度下がった評価値が後で上がるのは良くないです。』
2023-02-13 11:56:08
としてゃ
@toshity1980
死ぬこと以外はかすり傷って考え方、間違ってない。 バカにされるのを恐れて挑戦しない人よりも、 バカといわれてもいいから挑戦する人の方が好き。
2023-02-14 03:19:58
コルン
@colun
(僕の場合、人生の評価関数が壊れているので、爆弾を置き続ける人生だった。(箱がないところにまで置いてる可能性。 twitter.com/tsukammo/statu…
2023-02-13 09:41:34
ツカモ
@tsukammo
人生最適化が上手くいかない原因、ゲーム木探索で説明できてしまって困る。 pic.twitter.com/v07PCsup2a twitter.com/ValGrowth/stat…
2023-02-12 16:50:58本当にそうか?
むらおか
@jbking
これ人生最適化に用いるには捨象しすぎてるだけなんじゃなかろうか ステートマシン(寿命)と死のネガティブスコアを導入して行動しないとスコアが減っていくモデルにすれば回るようになる気がする しらんけど twitter.com/tsukammo/statu…
2023-02-13 15:46:13
裏技君
@urawazakun
最初のボムで壁一個しか壊せないの、爆風が1しかない上に壁の配置のせいで不利だったんやろかと考えてしまう twitter.com/tsukammo/statu…
2023-02-13 10:45:46