「コーパス言語学」とは何か

19
langstat @langstat

昨日から、FBのCorpus lingusiticsグループで"corpus linguist"と"linguist who uses corpora"との違いが議論されている。もはや言語(学)研究でコーパスを使うことは特別なことではないし、結論の出るような議論とも思えない。。。

2013-02-21 18:55:07
langstat @langstat

(承前)前者を文系っぽい感じ、後者を理系っぽい感じで捉えている人がいるけど、統計やNLPが専門の人(あと、ツール開発者)を"linguist"と呼ぶのには抵抗がある。そもそも"linguist who uses corpora"ではない"corpus linguist"とは誰か?

2013-02-21 19:00:05
Akira Murakami @mrkm_a

@langstat コーパス言語学という学問が進むべき道、みたいな方向に議論が進むと面白いと思って読んでいるのですが、そういう方向には行かなさそうですね。

2013-02-21 19:00:07
langstat @langstat

黎明期に"corpus linguistics"という用語を戦略的に定義した人やコーパス設計に関する論文を書いた人などは、狭義での"corpus linguist"かも知れない。でも、程度の差はあれ、今はみんな"linguist who uses corpora"である気がする。

2013-02-21 19:08:26
Akira Murakami @mrkm_a

@langstat 最初の問に表面的に答えてしまうとラベリングだけの問題になりそうで・・。そしてそもそも厳密に境界線を引くことはできないと思うので、よりコーパス言語学に固有の領域・課題はどういうものか、に個人的には興味があります。

2013-02-21 19:12:36
langstat @langstat

@mrkm_a 「コーパス言語学に固有の領域・課題」、もっと言えば「コーパス言語学」という分野が仮にあるとしたら、それは他の言語学領域と差別化を図る必要があります。ただ、そういうものが現時点で存在するとは思えないんですよね。corpus-drivenというのも全くピンとこないし。

2013-02-21 19:17:46
i_narrator @i_narrator

コーパス言語学の立ち位置を考える議論おもしろいなー。自分は目的に応じて使っている人だけど、コーパス言語学者の卵と呼べるのかなー?コーパスやコンコーダンサー作ったら呼べるかな?

2013-02-21 19:19:58
langstat @langstat

ワタクシは、「コーパス言語学」なる「分野」が存在するとは思っていない。かつては「方法論」だと思っていたが、最近はそれすらも怪しいと感じている。そして、「戦略的標語」としての新鮮味も薄れているので、現在では単なる「コミュニティ」、もしくは便宜的な「ラベル」に過ぎない可能性はある。

2013-02-21 19:23:19
Akira Murakami @mrkm_a

@langstat やっぱりそうですよね。。。あるとしたらGriesがやってるdispersionの指標のように汎用性の高い手法(?)の開発なのかと思うのですが、それも計算言語学など他の近接領域と重なりますし。

2013-02-21 19:26:19
langstat @langstat

(承前)かつてはコーパスを使うことが珍しく、その可能性や活用性を模索する必要があった。しかし、今では殆どの言語学領域でコーパスが使われており、(広義での)コーパスを使った社会学や経済学の研究もある。さらに、コーパスの大規模化に伴い、言語処理やウェブ解析との区別も曖昧になってきた。

2013-02-21 19:27:51
Akira Murakami @mrkm_a

International Journal of Corpus Linguistics誌を見ても、社会言語学、言語教育、意味論など様々な分野が扱われている。共通点は「コーパスを用いている」ということのみか。

2013-02-21 19:30:15
i_narrator @i_narrator

コーパスの設計デザインとか、どうやって検索するとか、コーパスを使った研究や分析をしたい人に、目的に応じたアドバイスができるコンシェルジュみたいな人なのかな?

2013-02-21 19:30:26
langstat @langstat

(承前)でも、それはコーパスを使った言語研究が一般的なものになりつつあるということであり、言語に関わる諸々の領域にとっては良いことのはず。その一方で、「コーパスを使った〜」というタイトルで外部資金を取ったり、査読をパスしたりする確率があまり上がらなくなったりはしているでしょうが。

2013-02-21 19:31:35
Akira Murakami @mrkm_a

手法の研究を行う分野という意味で、統計学とパラレルに考えると、統計学が汎用性の高い分析手法を他分野に提供し続けてきた一方で、コーパス言語学はどうか。言語研究者がコーパスを用いることに抵抗がなくなってきたという意味では、コーパス言語学という分野が成功したとも言える。

2013-02-21 19:34:59
langstat @langstat

corpus linguisticsであれ、digital humanitiesであれ、data scienceであれ、社会の中で研究活動をしていくには、戦略的に標語を作る必要もあるのだろう。ただ、ある程度しっかりした研究を継続するには、既存の学問領域に関する理解や知識が不可欠。

2013-02-21 19:36:29
langstat @langstat

RT @mrkm_a 手法の研究を行うという意味で、統計学とパラレルに考えると、統計学が汎用性の高い分析手法を他分野に提供し続けてきた一方で、コーパス言語学はどうか。言語研究者がコーパスを用いることに抵抗がなくなってきたという意味では、コーパス言語学という分野が成功したとも言える

2013-02-21 19:37:42
Akira Murakami @mrkm_a

しかし統計学とは違い、その代償にコーパス言語学が分野として消滅の危機(?)に瀕しているのはなぜか。なぜ統計学は汎用性の高いツールを提供し続けることができ、コーパス言語学はできないのか。

2013-02-21 19:39:43
langstat @langstat

表面的に見れば、統計は分析手法で、コーパスは分析対象に過ぎないから? RT @mrkm_a: しかし統計学とは違い、その代償にコーパス言語学が分野として消滅の危機(?)に瀕しているのはなぜか。なぜ統計学は汎用性の高いツールを提供し続けることができ、コーパス言語学はできないのか。

2013-02-21 19:43:56
Akira Murakami @mrkm_a

そもそも(統計手法を用いる)学問一般と統計学の関係を、言語研究とコーパス言語学の関係と類似していると考えるのは正しいんだろうか。それとも学問一般と統計学の関係は言語研究と計算言語学の関係なんだろうか。だとするとますますコーパス言語学とは何ぞやとなる。

2013-02-21 19:44:33
Akira Murakami @mrkm_a

@langstat なるほど。その違いはありますね。コーパスの分析手法は必ずしもコーパス言語学に特有のものではないからですね。だとするとコーパス言語学が生き残るには手法の開発を主軸とする必要がありますが、そうすると他分野との境界が更に曖昧になる、というジレンマが。

2013-02-21 19:51:01
langstat @langstat

ワタクシの記憶が正しければ、2006年度の特定領域研究「日本語コーパス」公開WSで、招待講演者の一人が「フィールドワークなどでテープレコーダーを使う言語学を『テープレコーダー言語学』と呼ばないのに、コーパスを使うと『コーパス言語学』になるのは何故か?」という類いの発言をされていた

2013-02-21 19:51:53
Tomoji Tabata @lctabata

料理の経験・能力のない人がどんな銘刀・道具を使おうが,良い料理を作れるわけがないのと同じ! RT @langstat: corpus linguistics/digital humanities…であれ、…研究活動を…を継続するには、既存の学問領域に関する理解や知識が不可欠。

2013-02-21 19:55:17
langstat @langstat

@mrkm_a しかも、従来の言語学とは違う手法の開発が果たして可能か、という問題があって、さらに、量的な路線を突き進む場合に(本格的に言語データを扱い始めた)NLPerや統計学者に勝てるのか、という問題もあります。恐らくは、かなり厳しいかと(そもそも「分野」じゃないんだから)。

2013-02-21 19:55:51
Tomoji Tabata @lctabata

レコーダーはツールにすぎないが,コーパスは研究対象たるからでしょうね。RT @langstat: …「フィールドワークなどでテープレコーダーを使う言語学を『テープレコーダー言語学』と呼ばないのに、コーパスを使うと『コーパス言語学』になるのは何故か?」という類いの発言…

2013-02-21 19:58:53
Tomoji Tabata @lctabata

勝てないようであれば人文学者の看板など背負えないでしょうね。最後は職人としての力量でしょう。 RT @langstat: @mrkm_a …量的な路線を突き進む場合に(本格的に言語データを扱い始めた)NLPerや統計学者に勝てるのか…

2013-02-21 20:02:19