自然言語処理における論理と機械学習・統計処理

中川先生との表題の議論についてまとめました。
5
中川裕志 @hiroshnakagawa3

最新号の人工知能学会誌の辻井先生に記事を読んだ。いつもながらの辻井節だが、経験主義(タグ付きコーパスによる統計的処理)についてえらく辛口。お弟子さんたちは圧倒的に経験主義みたいだが。とはいえ、例外が1名いました。論理至上主義のB次さんだ。お、B次さんもこの号に書いてるぞ!!

2012-05-12 00:07:26
中川裕志 @hiroshnakagawa3

最新号の人工知能学会誌の辻井先生に記事の次の記事は筋金入り経験主義のM橋さんだ。もうこうなると宗教戦争みたいだな。

2012-05-12 00:12:32
戸次大介/Daisuke Bekki @kaleidotheater

もちろん論理学は好きだが、論理至上主義者と言われると自分のことのような気がしない。僕らの仕事は、言語科学において論理でモデル化すべきところをそうしているだけで、そうではないところでは統計モデルや機械学習の人が仕事をする余地を残しているはず。

2012-05-12 13:42:42
戸次大介/Daisuke Bekki @kaleidotheater

しかし、敢えて論理至上主義者を名乗ることで、どこかで機械学習至上主義者との戦いがセッティングされたりするなら、そのアングルにのっかってもいいかも。

2012-05-12 13:51:26
中川裕志 @hiroshnakagawa3

@kaleidotheater 敢えて言わせてください。言語が論理も機械学習もコミットできる場になっているのは、人間の心や行動について言語が広く覆いをかぶせているからで、論理がうまく扱える言語の側面と、機械学習がうまく扱える言語の側面は、そうそう大きく重なっていない。

2012-05-12 21:12:04
中川裕志 @hiroshnakagawa3

@hiroshnakagawa3 @kaleidotheater つまり、イタリア料理のシェフと中華料理のシェフが、自分たちの料理こそ、世界で1番、のみならず世界を制覇する、と言い合っているような感じを受けるのです。

2012-05-12 21:14:02
戸次大介/Daisuke Bekki @kaleidotheater

@hiroshnakagawa3 コメントを書いたのですが、読み返してみてやはり140字制限だとちょっと自信がないので、この件についてはいずれ改めて、きちんと書くか話すかさせてください。

2012-05-13 03:21:56
中川裕志 @hiroshnakagawa3

@kaleidotheater フォローしていなかったので、このツイートを読まずに書きましたが、この主旨には全く異論ないです。

2012-05-13 10:44:25
中川裕志 @hiroshnakagawa3

@kaleidotheater その戦いが、1段メタレベルに持っていって議論すべきかと思っています。つまり、同じ現象の扱いの巧拙を競うのではなく、扱う現象を論理と統計処理に切り分ける議論が必要かと。PS:遅ればせながらフォローしました。

2012-05-13 10:46:48
中川裕志 @hiroshnakagawa3

@kaleidotheater 140字だと文脈が共有されないと話が進みませんね。そんなに遠い場所ではないし、一度、お越しいただき、当方の統計ベースの人々と議論できると面白いかもしれないです。

2012-05-13 10:49:00
中川裕志 @hiroshnakagawa3

@hiroshnakagawa3 @kaleidotheater 「扱う現象を論理と統計処理に切り分ける議論が必要」じゃメタレベルになってないですね。「扱う現象を論理と統計処理に切り分ける**理論**について議論する必要」が必要と書かなきゃいけませんでした。

2012-05-13 10:52:02
中川裕志 @hiroshnakagawa3

@hiroshnakagawa3 @kaleidotheater 言語現象のうち論理で扱う部分と統計処理で扱う部分に切り分けると言ったが、間違っていました。統計処理で扱う現象の背後にあるモデル自体は、その構造とか曖昧性などを論理で扱うと都合がよいので、二者択一ではないですね。

2012-05-13 14:26:13
中川裕志 @hiroshnakagawa3

@hiroshnakagawa3 @kaleidotheater 技術の現状からすると、統計処理の潜在変数で扱える部分が論理の枠組みに合致していれば、同じ現象を論理と統計の2方面から攻略できてうれしい。しかし、この「合致」を見分けるのは、なかなか難しいタスクみたいだ。

2012-05-13 14:28:52
中川裕志 @hiroshnakagawa3

@hiroshnakagawa3 @kaleidotheater じゃあ、お前はどうなのよ?とか怒られそうだが、発想の逆転はありえるかもしれない。今までは、まず言語現象から入って背後の意味にたどり着こうとジタバタしていた。形態素解析以上はあまりうまくいっていない。

2012-05-13 14:44:44
中川裕志 @hiroshnakagawa3

@hiroshnakagawa3 @kaleidotheater 逆に社会現象を統計処理して、得られた知見を論理などで表し、それがどのような言語現象として現れているかを分析する。

2012-05-13 14:45:23
中川裕志 @hiroshnakagawa3

@hiroshnakagawa3 @kaleidotheater 人間は、こういう方向で発想することが多いけれど、自然言語処理の人々は、多くの場合、逆の方向で物事(アルゴリズムやシステム)を組み立ててきたんじゃなかろうか?

2012-05-13 14:45:32
戸次大介/Daisuke Bekki @kaleidotheater

.@hiroshnakagawa3 コメントがちょっと長くなってしまったので以下のURLに貼りました。「言語において、論理と機械学習で「うまく扱える」範囲について」 http://t.co/G0YS58Nq

2012-05-13 22:55:19
リンク ka-lei-do-scope weblog 2012-05-13 言語において、論理と機械学習で「うまく扱える」範囲について 論理と機械学習が本質的にうまく扱える現象..
中川裕志 @hiroshnakagawa3

@kaleidotheater 拝見しました。明快な論旨で、結論「論理に基づく文法・意味の理論の基礎の確立」は期待したいです。とはいえ、(つづく)

2012-05-13 23:05:07
中川裕志 @hiroshnakagawa3

@kaleidotheater (つづき)別の方向から行く方法として、さっき私がFBに書いた「社会現象を統計処理して、得られた知見を論理などで表し、それがどのような言語現象として現れているかを分析する。」というのもご提案に絡むかもしれません。今後ともよろしく。

2012-05-13 23:06:18
戸次大介/Daisuke Bekki @kaleidotheater

@hiroshnakagawa3 はい、それは僕も今まで考えたことのなかった方向性で、興味深いと思いました。

2012-05-13 23:18:16
中川裕志 @hiroshnakagawa3

@kaleidotheater イメージとしては、「株価の変動」という数値的データから数値的に異常な動きという事象などを統計的に学習し、その事象が起きたときのテキストを収集して分析し、言語モデル化するとかです。いろいろなハードルがあって、非常に難しそうですけど。。。。

2012-05-13 23:33:27