言語研究と統計の関係

限りある時間の中で、言語研究者が統計をどこまで学ぶべきか。そして、統計を使って、どのように言語研究の発展に寄与することができるのか。
8
Akira Murakami @mrkm_a

Baayen (2008)の最後のケーススタディー部分を読む。これで全部読み終えたが良い本だった。これだけ中身の濃い統計本は言語系の人向けではほかにないはず。でもここからどこへ行けばいいのだろうか。これと同レベルか少し上級の内容を扱った書籍をご存じの方はご教授頂けると嬉しいです。

2011-04-18 12:25:56
Akira Murakami @mrkm_a

たぶん数式をそれほど伴わない概説本ではもうなくて、個別の手法に関する本になるんだろうなあ。

2011-04-18 12:27:58
KANETA Taku @taku_kaneta

@mrkm_a 言語系のネタを扱った本がないんだよねぇ。そして同じようなタイトルの本をひも解くと、半分くらいは既にみたことのあるケーススタディーが扱われているという。

2011-04-18 13:09:31
Akira Murakami @mrkm_a

@taku_kaneta 言語系に限定せずに心理学や社会・行動科学まで範囲を広げ、且つ(「縦断的データ分析」のように)トピックを狭めるか手法を特定しないともうないんだろうなあ、という印象。そもそも一般的な言語系の研究のためにはBaayen本以上の手法は必要ないのかもしれないけど。

2011-04-18 17:42:11
KANETA Taku @taku_kaneta

@mrkm_a しかし逆に手法を知っているからこそ生まれる新しい研究もきっとある……と特に根拠もなく思うよ。命題→ソリューションが望ましい流れなのかもしれんけどね。不適切かもしれないが、正しい理由は後から発見されることって多い気がする。

2011-04-18 17:53:51
Akira Murakami @mrkm_a

@taku_kaneta まあそれはね。ただ徹底的に統計で勝負するというならまだしも、そうでなければこれ以上学ぶのはコスパが悪いのではという気もする。「まだ言語系に導入されていない新しい手法」を身につけるのと引き換えに分野の知識を得る機会を失っているのなら本末転倒なわけで。

2011-04-18 18:10:37
Akira Murakami @mrkm_a

@taku_kaneta 特になまじ統計の学習成果は目に見えやすいだけに、このリスク評価が難しいと最近思うよ。

2011-04-18 18:11:13
langstat @langstat

ドキッ、グサッ(笑) RT @mrkm_a ただ徹底的に統計で勝負するというならまだしも、そうでなければこれ以上学ぶのはコスパが悪いのではという気もする。「まだ言語系に導入されていない新しい手法」を身につけるのと引き換えに分野の知識を得る機会を失っているのなら本末転倒なわけで。

2011-04-18 18:13:59
KANETA Taku @taku_kaneta

@mrkm_a なべて世は中庸か。そのバランス感覚を取るためには、やっぱり自分の中でテーマが欲しくなるんだよな。しかしテーマが決まってないときほど、手法も含めて勉強すべきなんだよな。学問に王道なし、か。昔の人は真理を言い当てるなぁ。

2011-04-18 18:14:54
langstat @langstat

そうなんだよね〜(笑) RT @mrkm_a 特になまじ統計の学習成果は目に見えやすいだけに、このリスク評価が難しいと最近思うよ。

2011-04-18 18:15:46
KANETA Taku @taku_kaneta

@langstat @mrkm_a 基本的には同意なんですが、それってリスクというんだろうか。遠回りをリスクと呼ぶなら、それは確かにリスクだ。世の中は〆切で動いてるから、やっぱりリスクなのかもしれない。でも冒険は必要だと思う。評価に結び付かない冒険でも、誰かがきっと見てる。

2011-04-18 18:22:05
Akira Murakami @mrkm_a

@langstat いやいやいやw@langstatさんは「徹底的に統計で勝負」することを選んだ人じゃないですか。それはそれで筋が通っていて良いと思うのですが、私のようにただの「統計好き」レベルの言語系研究者(の卵)はどう舵を取るべきか考えてしまうのです。

2011-04-18 18:23:15
Akira Murakami @mrkm_a

@taku_kaneta @langstat 「遠回り」というか、統計手法だって日進月歩なわけで、それを追い求めるとキリがない。同じく日進月歩であろう分野的知識等を得ることを最優先に物事を考えなければいけないんじゃ、と思う。両者共に得られれば良いけど、そんな時間も頭もない。

2011-04-18 18:27:35
langstat @langstat

.@mrkm_a @taku_kaneta 統計をやればやるほど、手法の選択ではなくて、変数の選択(=どの角度からデータを見るか)で勝負が決まるということが嫌というほど分かってきました。。。「何で解くか」ではなくて「何を解くか」が重要。至極当たり前のことだけど。。。

2011-04-18 18:31:17
langstat @langstat

言語学に詳しい言語学者は多い(当然)。プログラミングができる言語学者も意外と多い。それらと比べれば、統計好きの言語学者はまだ少ない(隙間産業?)。 RT @mrkm_a @langstatさんは「徹底的に統計で勝負」することを選んだ人じゃないですか。それはそれで筋が通っていて良い

2011-04-18 18:35:31
こうさぎ(みっふぇ) @hasenjunges

ただ言語教育学まで範囲にいれると統計強い人はたくさんいますね。 RT @langstat: 言語学に詳しい言語学者は多い(当然)。プログラミングができる言語学者も意外と多い。それらと比べれば、統計好きの言語学者はまだ少ない(隙間産業?)。

2011-04-18 18:38:53
Akira Murakami @mrkm_a

@langstat @taku_kaneta やっぱりそうですか・・。機会学習等をSLA研究に応用できないかと時々考えるのですが、それをどう使えばSLA的に新しい知見を得られるのかがはっきりしません。この辺りは分野そのものについて深く学ばないといけないんだろうなあと思っています。

2011-04-18 18:40:51
langstat @langstat

そうですね。どこからを「強い」と見なすかにもよりますが、テスト系の人は強い人が多いですね。 RT @hasenjunges ただ言語教育学まで範囲にいれると統計強い人はたくさんいますね。 RT @langstat 統計好きの言語学者はまだ少ない(隙間産業?)。

2011-04-18 18:41:43
Akira Murakami @mrkm_a

@langstat なるほどw ただ少なくとも言語習得・教育系の研究は心理系の統計手法を採択しているので、そうなると心理統計系の人たちとの棲み分けを考えないといけないような気がします。彼等と真っ当に統計で勝負するとまず勝てないので・・・。

2011-04-18 18:45:28
langstat @langstat

そこで、機械学習やパターン認識の出番ですw RT @mrkm_a 言語習得・教育系の研究は心理系の統計手法を採択しているので、そうなると心理統計系の人たちとの棲み分けを考えないといけないような気がします。彼等と真っ当に統計で勝負するとまず勝てないので・・・

2011-04-18 18:51:15
Akira Murakami @mrkm_a

なるほどw 確かに心理統計系では機械学習はあまり見ませんね。 RT @langstat そこで、機械学習やパターン認識の出番ですw RT @mrkm_a 言語習得・教育系の研究は心理系の統計手法を採択しているので、そうなると心理統計系の人たちとの棲み分けを考えないといけない

2011-04-18 18:56:30
langstat @langstat

統計やNLPの人に対しては変数選択と結果の解釈(つまりは言語学的知識)で戦うしかなく、言語や教育の人に対してはプログラミングや統計の技術で戦うしかない。だが、貿易商人というか蝙蝠というか、そういうことを続けていると、どこに行ってもアウェイになる。まさに、根無し草状態のワタクシww

2011-04-18 18:58:27
Akira Murakami @mrkm_a

自分もブートストラップを使ったりと、言語系研究者には浸透していない手法の恩恵に預っている。また統計は好きなので◯◯の手法をSLA研究に活かせないか、と考えたりもする。しかし統計駆動で研究計画を立てても良いものか。まあ研究発想法は過程で、最後は「分野への貢献度」で勝負なのだろうが。

2011-04-18 19:01:05
Starseeker @priancho

@langstat 冒険者のようで素敵ではないですか!;-)

2011-04-18 19:02:32
langstat @langstat

ありがとうございます! では、そう思うことにしますw RT @priancho @langstat 冒険者のようで素敵ではないですか!;-)

2011-04-18 19:06:55