3D的な位置をもつバウンディングボックスで物体検出。いろいろな情報をいろんなレベルで融合するネットワーク pic.twitter.com/yEGFKWd6Go
2018-06-20 02:00:43これって本来直線じゃね?みたいな箇所を見つけて1枚絵でカメラキャリブレーション pic.twitter.com/Wp4nzqISJ1
2018-06-20 02:02:11動画シークエンスに対して、フローとか使って自動でセグメンテーションするネットワーク pic.twitter.com/O1ZyugpL8k
2018-06-20 02:04:48ビデオに繰り返し登場する物体(人の顔?)のアピアランスモデルを逐次的に学習する。 pic.twitter.com/F1nEQBHD1z
2018-06-20 02:10:48上空からの画像から地上からのストリートビュー画像を生成したり、逆をしたりするGAN pic.twitter.com/t9Gji6qvvW
2018-06-20 02:12:58限られた計算量やメモリバジェット内でディープしたいときに、推論時に動的に計算経路を変更できる感じのネットワーク? pic.twitter.com/ZH3TvcL8ZL
2018-06-20 02:19:53群衆解析のときは、解像度を保つためにpoolingよりもdilated convを使うといい。multi-column cnnよりsingleがいい。ところでmccnnってなに? pic.twitter.com/Ol64Qbf9Sl
2018-06-20 02:24:50super class分類とfine grained class分類をわけたネットワークで3000クラス分類の物体検出 pic.twitter.com/aaacDoRnXX
2018-06-20 02:28:16テストと学習データの分布が違うときのドメイン アダプテーション。二つの分布をreproducing kernel Hibert spaceでアラインする白色化と最適輸送を導出。 pic.twitter.com/at6OKFi7f6
2018-06-20 02:35:22GMMをEMで求めるときに、KL divergenceでなく、sliced wasserstein距離でやるといい。1次元のWDはclosed formな解が求まるので、それを利用する pic.twitter.com/IvfIBfQRaS
2018-06-20 02:39:19リグレッション型の顔ランドマーク検出は、Wing Lossというロス関数つかうとよい pic.twitter.com/l5slngj0R6
2018-06-20 02:42:06テンソルのfactrizationで、画像から物体同士の関係を学習 pic.twitter.com/wHEY0lTCiS
2018-06-20 02:45:00attributeを抽出? 二つの画像の特徴量を、ランダムマスクでまぜてたりデコードしたりして、なんやかんやで最終的に入力画像と復元画像が近くなるようなロスを最適化することで、自動的にattributeが学習できて、転送とかできるようになる。もっと図を吟味する必要あり。 pic.twitter.com/eMUdJWJ97N
2018-06-20 02:53:46確率的な出力をする軽量なCNN。ワンパスの推論。ちと分かりづらいが、既存のネットワークに簡単に挿れられるPropOutというレイヤーを提案してて、実際にFlowNetで、予測期待値とその信頼性みたいなスコアを出してテストしてる。 pic.twitter.com/eulXWwdf5i
2018-06-20 03:00:46GANにDPM的なものをブチ込むと、人物画像が、いろいろな姿勢でも綺麗に生成できる pic.twitter.com/c7ohU6NFsr
2018-06-20 03:01:08点群の点毎のconv。動作時に均一グリッドでNNサーチして、近傍点に対してconvを定義し、そのbackpropを導出。3次元シーンのセマンティック セグメンテーションなど。 pic.twitter.com/gH7fLyMLxh
2018-06-20 03:06:13座れるか歩けるかみたいなラベリングを推定。特徴マップ上で、gated graph neural net を作って、neural message passingしてる pic.twitter.com/jv9LBo6Ybd
2018-06-20 03:10:131x1 convだけでもなんかうまくいくよってやつ。(でもpoolingは使ってる) pic.twitter.com/igV3w32DwD
2018-06-20 03:12:37Cartesian k meansベースのプロダクト量子化。CKMが解きやすい形に変形できる pic.twitter.com/EaD97aT8bn
2018-06-20 03:15:57raw画像を直接入力してsRGBで出力するようにすると、暗い画像でもいける pic.twitter.com/2ftUaj3oVX
2018-06-20 03:17:572枚シークエンスから、モーション境界を推定。フロー推定と同時にやる。 pic.twitter.com/PcvHmGBrl3
2018-06-20 03:21:32部分的に画像について手がかりがあるときに、推論時にバックプロバゲーションして中間の表現を更新するのを繰り返して、手がかり利用する。 pic.twitter.com/heBcqs8AAN
2018-06-20 03:25:04パノラマ画像とそのエッジ画像から部屋のレイアウトを推定するネットワーク pic.twitter.com/2J7n7HZcDf
2018-06-20 03:35:47