2021/07/31全日本CV勉強会「CVPR2021読み会」(後編)
本日の全日本コンピュータビジョン勉強会「CVPR2021読み会」(後編)はこれにて終了です。 発表者の皆様大変ありがとうございました。また聴講した皆様もご参加ありがとうございました。 #japancv
2021-07-31 18:03:58SimSiam色んなところで見かけてすごいなぁ,11月段階で発表してくださったsasanoさんの慧眼に脱帽speakerdeck.com/sansandsoc/sim… #japancv
2021-07-31 18:04:16第7回 #japancv 後編も無事終了しました.発表・聴講でご参加頂いた皆様,質問や議論に参加くださった皆様ありがとうございました.
2021-07-31 18:07:192021/07/31全日本CV勉強会「CVPR2021読み会」(後編) - Togetter togetter.com/li/1752612 #japancv
2021-07-31 18:30:09#111論文等共有 (74/365) m-niemeyer.github.io/project-pages/… [CVPR'21 Best Paper] compositional 3D representation for controllable synthesis をする論文。 1/3
2021-07-31 19:01:21- compositional = 背景や物体の組み合わせでシーンを表現する。 - controllable synthesis = 物体の配置、角度、視点などの要素を調整可能な形で描画するタスク。 2/3
2021-07-31 19:01:21提案手法GIRAFFEは既存手法NeRFベースのレンダリング手法。 - 背景と物体のdisentanglementを教師なしで(!)獲得。 - しかもcontrollable synthesis可能。物体だけ、背景だけのcontrolができる(!)。 - 実験でも他手法より優れた結果。 3/3
2021-07-31 19:01:22#111論文等共有 (75/365) openaccess.thecvf.com/content/CVPR20… [CVPR'21] メタデータ(補助ラベルなど)の影響を排除するための正規化層の提案。batch normに代わるもの。追加パラメタなしで組込める。メタデータが変わる方向(メタデータ空間)と変わらない方向に特徴量を分ける。
2021-07-31 19:02:22実験で有効性を確認。バッチサイズが大きいほどメタデータの影響をうまく排除でき、精度が上がる。
2021-07-31 19:02:22#111論文等共有 (76/365) openaccess.thecvf.com/content/CVPR20… [CVPRw'21] 超解像workshop NTIRE の報告論文。 今年のテーマは一つの低解像画像に対し複数の超解像画像(SR space)を出力する=super-resolution space challenge。winnerはSRFlowにノイズ対策したモデル。 全体としてflow-based生成モデルが強い。
2021-07-31 19:03:17#111論文等共有 (77/365) openaccess.thecvf.com/content/CVPR20… [CVPR'21] 自己教師あり学習の単眼深度推定モデルでSOTA。単眼&複数画像による推論を同じモデルで扱えるようにした。特に、自己教師あり単眼・マルチフレーム深度推定において以下の問題を克服。 1/2
2021-07-31 19:05:10①単眼深度推定におけるスケール曖昧性を解消 ②マルチフレーム深度推定における動く物体がある場合の精度向上 ③マルチフレーム深度推定において静止カメラから同じフレームが入力され続ける際の影響を低減。 2/2
2021-07-31 19:05:11#111論文等共有 (78/365) openaccess.thecvf.com/content/CVPR20… [CVPR'21] visual storylellingにおいてvisual encoder & language modelはそれぞれ別個に学習される。それぞれのpretrained modelをdownstream taskに応じてfine-tuningすることになるので、catastrophic forgettingのようなことが起きうる。 1/2
2021-07-31 19:07:09そこでvisual & language を一緒に学習できる新しいモデルTAPMを提案。 連続的な静止画や動画のキャプション生成で性能向上。 2/2
2021-07-31 19:07:10#111論文等共有 (79/365) openaccess.thecvf.com/content/CVPR20… [CVPR'21] 光学文字認識(Optical Character Recognition: OCR)の研究。画像を入力とし文字領域検出+文字認識するタスク。従来はアルファベットに焦点を当てた研究が多かった。 1/3
2021-07-31 19:09:33多言語対応するにしても、softmaxの出力クラス数を数十から数千へと増やすものが多かった。これだと言語の追加が容易でない。 2/3
2021-07-31 19:09:33本論文は各言語を担当するheadをそれぞれ付け加えることで追加が容易な多言語対応を実現。またheadを鍛えるには言語ラベルが必要になるがそういうデータは少ない。そこで言語ラベルが無しにテキストラベルのみでE2Eで学習できる手法を提案。headが対応してない言語にペナルティをかけるlossを使う。3/3
2021-07-31 19:09:33#111論文等共有 (80/365) openaccess.thecvf.com/content/CVPR20… [CVPR'21] 対照学習では特徴量の一様性(特徴量が局在化してるか否か)が学習のカギを握ると明らかになってきた。本論文では一様性と温度との関係を解析。uniformity-tolerance dilemmaを定式化した。 1/3
2021-07-31 19:25:17