2022/08/07第11回全日本コンピュータビジョン勉強会「CVPR2022読み会」(前編)
#111論文等共有 (343/365) #japancv openaccess.thecvf.com/content/CVPR20… [CVPR'22] 幾何学的な最適化問題の偽の解を避けつつ高速に(~70 ms)解く手法を提案。機械学習とhomotopy continuationを利用。二つのカメラからの相対位置推定等に使える。
2022-08-07 18:17:52#111論文等共有 (344/365) #japancv openaccess.thecvf.com/content/CVPR20… [CVPR'22]絵画に対し感情に関する説明文をつけるタスク(affective image captioning)のデータセットArtEmis[CVPR’21]にはpositive emotionに偏っている(バイアスがある)ことを示し改善したものを提案。URL: artemisdataset-v2.org
2022-08-07 18:18:05#111論文等共有 (345/365) #japancv openaccess.thecvf.com/content/CVPR20… [CVPR'22]Table location (画像中のどこに表があるか) とtable-structure decomposition (cellを分ける) をE2Eで同時に予測するTransformerベースのモデルを提案。SOTA。
2022-08-07 18:18:43#111論文等共有 (346/365) #japancv openaccess.thecvf.com/content/CVPR20… [CVPR'22]自動運転で必要になる3D物体検出と追跡を単眼カメラ画像からE2Eで行えるモデルを提案。Transformerベース。2Dと3Dのボックスを統一的な表現に変換したり、時間的トポロジーに制約を加え軌跡を滑らかにするlossなどが特徴。
2022-08-07 18:19:02#111論文等共有 (347/365) #japancv openaccess.thecvf.com/content/CVPR20… [CVPR'22]単眼画像からの物体姿勢推定。提案手法は姿勢を分布として求めることでPnPの曖昧性を入れる。6自由度姿勢推定、3次元物体検出で性能が改善。
2022-08-07 18:19:20#111論文等共有 (348/365) #japancv openaccess.thecvf.com/content/CVPR20… [CVPR'22]Radiance field (NeRF) とsurface field (PIFu) 両者の利点を生かして少ない入力画像から高精度な人体3D再構成やレンダリングを実現。既存手法PixelNeRFをもとに精度改善。
2022-08-07 18:19:30#111論文等共有 (349/365) #japancv arxiv.org/abs/2205.11487 [arXiv'22]高品質Text2Image。T5 (tagに合わせてタスクをやってくれる万能Transformer model)の中間特徴量によるtext embeddingをcross attentionするU-Netを拡散モデルに用いて、超解像用拡散モデルとカスケード接続したモデルを提案。
2022-08-07 18:20:10#111論文等共有 (350/365) #japancv openaccess.thecvf.com/content/CVPR20… [CVPR'22]Multimodal学習ではmodality毎にoverfitとunderfitが同時に起こり個別に学習するより精度が下がる。既存手法gradient blendingでは或るmodalityでoverfitが始まると合成勾配内の重みを調整して対策する。 1/2
2022-08-07 18:21:22@losnuevetoros (少なくとも私は)通常1つで精一杯だが4つ論文紹介していただいた上に背景にはムーンショットに使えそうなパーツ探しというビジョンがあり研究者としてすばらしい限り #japancv
2022-08-07 18:32:572022/08/07第11回全日本コンピュータビジョン勉強会「CVPR2022読み会」(前編) togetter.com/li/1927234 #japancv
2022-08-07 18:53:24#japancv で、絶賛準備中のムーンショットプロジェクト「人と融和して知の創造・越境をするAIロボット」のパーツにつながる研究を探す…というテーマでCVPR論文を読みました。お時間あればご笑覧下さい。 speakerdeck.com/yushiku/patuta… 個人的にはDALL·EとMidjourneyでの素材作りが楽しかった。 pic.twitter.com/nqhflAV4CZ
2022-08-07 18:57:0410年以上前に文書画像の処理で表部分の抽出とかやったけど、深層学習(Transformer)で出来るようになったのが感慨深い #japancv
2022-08-07 19:31:412022/08/07第11回全日本コンピュータビジョン勉強会「CVPR2022読み会」(前編)資料まとめ - takminの書きっぱなし備忘録 @はてなブログ takmin.hatenablog.com/entry/2022/08/… #japancv
2022-08-07 22:45:18