一般物体認識や類似画像検索に紛れ込んだ迷信？についての議論

Toshikazu Wada @toshikazuwada

顔画像認識とか，一般物体認識とか，類似画像検索とか，こういう研究分野に，色んな迷信が紛れ込んでるような気がする．

2011-02-20 22:10:08

Akisato Kimura @_akisato

えっ、なんですか？きになります　RT @toshikazuwada: 顔画像認識とか，一般物体認識とか，類似画像検索とか，こういう研究分野に，色んな迷信が紛れ込んでるような気がする．

2011-02-20 22:12:57

Hirofumi Mochizuki @hmczk

どのような迷信か、ぜひともお聞かせください。　RT @toshikazuwada: 顔画像認識とか，一般物体認識とか，類似画像検索とか，こういう研究分野に，色んな迷信が紛れ込んでるような気がする．

2011-02-20 22:58:05

Toshikazu Wada @toshikazuwada

迷信というのが正しいかどうか：まずは，特徴近辺について．descriptor をどこで走らせるか，キーポイントを取り出してから計算か，エッジ付近か，はたまたグリッド上で走らせるか？CodeBookは平坦なのがいいか，Ni… (cont) http://deck.ly/~TrnwG

2011-02-20 23:35:35

Toshikazu Wada @toshikazuwada

pLSAかＬＤＡか，そんなトピックなんてようわからんし，結局ＳＶＭでいいじゃん．とか，...

2011-02-20 23:38:10

Toshikazu Wada @toshikazuwada

あそうそう，キーポイント取り出してdescriptor 走らせると，さそりの尾っぽとか，ギターのくぼみとか，背景部分の特徴が混じるで．

2011-02-20 23:39:42

Toshikazu Wada @toshikazuwada

いろいろ，こうしたらうまくいくとかどうとか，言うけれど，何が本当かが分からない．Vocabulary Treeは近似最近傍探索のインデックス構造であると同時に，ＶＷのシソーラスでもあるという理解は，かしこーい，と思わせるけど，ちょっと違う．

2011-02-20 23:45:42

Toshikazu Wada @toshikazuwada

ホントのBOWとBOVWでは，語彙をガンガン増やしたほうがいいのか，どこかで絞ったほうがいいのかという問題に対する答えは違うとおもう．

2011-02-20 23:49:44

Toshikazu Wada @toshikazuwada

MKLとかでのノルム制約の話は迷信じゃない，きれいな話と思う．

2011-02-20 23:54:19

Toshikazu Wada @toshikazuwada

大量のデータにまみれて識別器などのトレーニングをすると，迷信に弱いタイプの人は道に迷い，何がいいのか完全に道を見失う．迷信に惑わされない人は，なんとかできるけど，でも迷信だらけ．

2011-02-21 00:04:08

yu4u @yu4u

画像認識で、シソーラスの葉カテゴリの認識精度は、Flatなカテゴリだと仮定した場合と比較して、シソーラスを考慮しても認識精度が向上しないという主張のほうが多い。

2011-02-21 00:20:52

Toshikazu Wada @toshikazuwada

僕もそう思います．うちのＭ２が調べたところ，根っこの直下で違うパスを辿るのが多いんです．だからidfの重み付け投票が効かない． RT @yu4u: 画像認識で、シソーラスの葉カテゴリの認識精度は、Flatなカテゴリだと仮定した場合と比較して、シソーラスを考慮しても認識精度が

2011-02-21 00:31:14

Toshikazu Wada @toshikazuwada

でも，Nisterの手法は速い！

2011-02-21 00:32:08

Toshikazu Wada @toshikazuwada

BoFがなぜうまくいくのかも，Ｍ２の研究で偶然わかった．他のＭ２の研究と組み合わせると，類似性・相違性尺度とBoFの関連が見えてきた．技術的にはどうか分からんけど，哲学的には進歩している．

2011-02-21 00:52:57

Toshikazu Wada @toshikazuwada

@hmczk @_akisato 迷信の件，素直なご意見をいただけるとありがたいです．

2011-02-21 10:30:17

Akisato Kimura @_akisato

これから@toshikazuwada 先生の「迷信」を追いかける旅に出ます

2011-02-21 22:30:05

Toshikazu Wada @toshikazuwada

自分で自分の文章を見て，くどいと思うな．だが，今この時点で，多分地球上で類似度とか，相違度に関して詳しい人のトップ10位には入ってると思う．

2011-02-21 22:39:09

Akisato Kimura @_akisato

@toshikazuwada あれ、でも、グラム行列が非正則になると解が不安定になりやすい気がしますが、それって理解が間違っていますでしょうか？

2011-02-21 22:49:14

Akisato Kimura @_akisato

@toshikazuwada 問題がたくさんあり過ぎるので１つずつばらばらに私のコメントを述べようかと思います。

2011-02-21 22:51:20

Toshikazu Wada @toshikazuwada

まあ，グラム行列が非生息ならしゃあないですね．でもそれと迷信は別の話．

2011-02-21 22:52:12

Akisato Kimura @_akisato

@toshikazuwada まずはdescriptorの問題。狭義のdescriptorは元々同一画像領域の検出に用いられていたものなので、そのdescriptorが外的要因で変動するような箇所で計算するのは本来はナンセンスな気がしています。

2011-02-21 22:54:06

Akisato Kimura @_akisato

@toshikazuwada ただし、descriptorが量子化されて使用されると話が変わる気がします。多少変動しても量子化で吸収されてしまうので、それがたまたま見えなくなってしまっている。

2011-02-21 22:55:55

Toshikazu Wada @toshikazuwada

@_akisato 外的要因とはなにか良く解らん．ボトムアップで正しいキーポイントの場所が計算できるはずがないというのが僕の主張だが，だからといって，全部間違いなわけでもない．

2011-02-21 22:57:05

Hirofumi Mochizuki @hmczk

画像処理（〇〇認識）に迷信が紛れ込むとすれば、科学としての完成度が低いからと思われます。Harr-like,HOGは偶像崇拝的でもあります。前向きに捉えれば、これから開拓されるべきフロンティアが目の前に広がっているとも言えると思います。RT @toshikazuwada:...

2011-02-21 22:57:21

Akisato Kimura @_akisato

@toshikazuwada そこでBoFに話題が移るのですが、先日の原田先生＠東大のご講演が示す通り、BoFは結局、descriptorの分布を近似していたものと見なせるわけです。

2011-02-21 22:59:02

いま話題のタグ