コロケーションって前から後ろ?後ろから前は?

鍵を外した923が思い出話からコロケーションに関するマジメな話を始めました。興味深いお話だったのでまとめました。
1
くさなぎ @iganasuk

昔ルーマニア人の先生と英語で話している時に,「成仏」ってなに?と聞かれてとっさに,It means reincarnetion, probably.と答えてしまったのを思い出しました。間違って覚えていらっしゃるかもしれませんね。

2014-05-11 22:23:31
くさなぎ @iganasuk

今なら,going to heavenで通じると判断できるし,enter Nirvanaとかattain Buddhahoodなどとも頑張れば言えそうです。

2014-05-11 22:25:25
くさなぎ @iganasuk

ちょっと真面目なことをつぶやいてみます。

2014-05-11 22:26:34
くさなぎ @iganasuk

複単語表現,およびコロケーションは基本的に組み合わせ(combination)による考え方なのですが順列(permutation)による考え方もあります。たとえば遷移確率,条件付き確率,一部のベイズなどが後者に当たります。

2014-05-11 22:28:02
くさなぎ @iganasuk

enter Nirvana(涅槃に入る=成仏する)というのはかなり結びつきの強い表現です。MI(相互情報量)なども恐らく高いでしょう。しかしこの結びつきは順列として非常に興味深いのです。

2014-05-11 22:29:11
くさなぎ @iganasuk

テキスト的に見て,enterの次にNirvanaが来る確率と,NIrvanaの前がenterである確率は大分異なるはずです。恐らく後者の確率がずっと高いでしょう。

2014-05-11 22:33:36
くさなぎ @iganasuk

こういうのをdirectional collocation, asymmetric collocationないしcranberry collocation, right and left predictiveまたはupward and downwardなどといいますね。

2014-05-11 22:35:58
くさなぎ @iganasuk

一般に先行する語に特定の語が来る確率(順行遷移確率)がどのように文処理や読解,コロケーション知識の発達に関わるかという研究は進んでいますが,後ろの後から見た前の語の確率についてはあまり知られていません。

2014-05-11 22:37:55
wtrych @wtrych

Nirvanaの後に来る確率が高いのは、Kurt CobainとかSmells Like Teen Spiritとかじゃないのか。はい、茶化してごめんなさい。

2014-05-11 22:38:08
くさなぎ @iganasuk

一般に先行する語の後に特定の語が来る確率(順行遷移確率)がどのように文処理や読解,コロケーション知識の発達に関わるかという研究は進んでいますが,後ろの後から見た前の語の確率についてはあまり知られていません。

2014-05-11 22:38:15
くさなぎ @iganasuk

だからなんだって話なのですが,enter Nirvanaを見て思い出しました。しかしちょっと調べたらattain Nirvanaの方が確率的に多いみたいですね

2014-05-11 22:39:59
wtrych @wtrych

@iganasuk 全然知らなくて訊くんだけど、言語の線状性に鑑みて、後から見た前の語の確率を考える理論的意義は何なのだろうか。

2014-05-11 22:41:53
くさなぎ @iganasuk

@wtrych 例えば,VP->V NのheadはVなのですが,即時的な想起しやすさという点では必ずVに重みづけがあるとはいいきれしれません。make a mistakeといったVPはmakeよりもmistakeの方が発話の際などに先に想起されるとかんがえることもできます。

2014-05-11 23:16:30
くさなぎ @iganasuk

@wtrych 受容の際に,予測文法的な見地から見れば,ほぼ意味がないとおもいますが,学習や習得の際にこのような要因に何らかの影響があるだろうと思うには十分だとおもいます。

2014-05-11 23:18:05
くさなぎ @iganasuk

Nasselhauf(綴り大丈夫かな)やSinclairなどがこのあたりについてよく述べています。

2014-05-11 23:19:13

Tam @tam07pb915

これですかね?/ Nesselhauf(2003) The Use of Collocations by Advanced Learners of English and Some Implications for Teaching http://t.co/FhH0meXZ4j

2014-05-11 23:41:25
Tam @tam07pb915

書籍はこれ。/ Nesselhauf (2005) Collocations in a learner corpus http://t.co/VsAYlzzE1V

2014-05-11 23:46:14

くさなぎ @iganasuk

語形成についても似たようなことがあって,cranberry morphemeなどということもあります。 クランベリー型形態素 http://t.co/Wo7RfyVG3V

2014-05-11 23:23:12
wtrych @wtrych

@iganasuk なるほど。もう一個。この場合「確率的に多い(or少ない)」ってのはどういう意味?ある話者(の集団)をつかまえた時に想起する、あるいは発話する確率が高いということ?それと使用頻度は同じ?

2014-05-11 23:25:20
くさなぎ @iganasuk

barberryにはbarもberryもあります。bearberryも両方あります。blackberryも両方あります。cranberryのcranはありません。踏みにじるは複合動詞のように見えますが,「にじる」は単独で現れません。

2014-05-11 23:25:27
wtrych @wtrych

にじみ出る煮汁 vs. 煮えたぎる煮え湯。はい茶化してすいません。

2014-05-11 23:26:18
くさなぎ @iganasuk

@wtrych 私はtextual associationとpsychological associationというのをしっかりと区別しましょうと思ってます。最初のはコーパスなどの総体頻度の確率論的な計算によります。もうひとつは(続く)

2014-05-11 23:27:50
くさなぎ @iganasuk

@wtrych もう一つは厳密には個々人,しかし研究上はある母集団における言語運用上の想起しやすさです。極端に操作可すると連想語の順位みたいなものだと思っています。語彙知識がネットワークを成すとか難しいことをいう人もいますけど。

2014-05-11 23:29:27