- RedBull_7584
- 5595
- 32
- 1
- 0
びっくりするほどアノテーションが適当だった。これはいかんやろ。 pic.twitter.com/aMLNN6QSsP
2023-10-10 22:33:081週間ぐらい掛けてCOCOのデータセットを自分でアノテーションし直しただけで mAP が 10 ポイントから 20ポイントぐらい上がりそう。
2023-10-10 22:39:24まだCOCOデータセット全体の20%しかクレンジングできていないけど、試しにトレーニングしてみたら mAP で 1.2 ポイント以上性能が上がってる。
2023-10-13 20:54:50@PINTO03091 ブートストラップ的に、今のモデルでCOCOのアノーテーションデータ生成ですか
2023-10-13 20:57:20@kuronekodaisuki はい。手動アノテーションの負荷軽減のために、2日ほど前に公開していたモデルを使ってオートアノテーションをしたうえで、さらに手動補正を4500枚やってます。
2023-10-13 21:08:12まぁ、もともとこのサイズを的中させにくる性能があるモデルだから当然かもしれない。 pic.twitter.com/tdPjZvkT5r
2023-10-13 21:13:42子供の運動会が終わったら、COCO改善途中で作ったモデルの性能がどれぐらい変わったかを見てみる。数値上、mAPは1ポイント改善している。確認するポイントは、 1. 過検出 2. 暗がり+5メートル距離 3. ハレーション 4. Blur
2023-10-14 11:55:042000枚の画像のうち、今の所最もアノテーションが辛かった画像。どこかの球団がリーグ優勝した瞬間。観客のほぼ全員が手を上げている。地獄。 pic.twitter.com/bE17qChBCs
2023-10-14 13:52:17COCOを50%クレンジングして試しにトレーニングを始めてみたら、学習の進み方が明らかに変わってきた。300epoch前後までmAPがじわじわ上がり続けるようになった。なんとか100%クレンジングをやりきりたい。
2023-10-14 20:44:05@kuronekodaisuki ですね。以前から思ってはいましたが、今回のステップ・バイ・ステップの検証で確信に変わりました。
2023-10-14 20:47:49やっと2400枚クレンジングが終わった。あと1600枚。100枚で1時間掛かるから、あと16時間ぐらい作業時間が必要。
2023-10-15 02:11:47これvalidationデータはクレンジング前のデータなのだろうか 答えが間違っていて予測がより正確に出してしまってスコア下がる現象とかないのでしょうか twitter.com/PINTO03091/sta…
2023-10-15 16:40:40今試しにトレーニングしている 65% 版Nanoサイズ (20MB) モデルは、先週公開した Middle サイズ(165MB) の mAP をすでに上回っている。
2023-10-15 16:42:35@yumion7488 validationデータもクレンジング後のデータを使用しています。試行作業ごとに毎回Splitしているので厳密には mAP の単純比較はできません。また、クレンジング前のデータが35%含まれていますのでまだかなり学習が不安定です。
2023-10-15 16:45:28