#gengo2011wsの午前中のつぶやき
宮尾さん「大学と企業は仲良くする必要無い。大学の中途半端な企業化が不幸の一因。昔は言語処理が何の役にも立たなかったので良かった。皆が優秀な人を求めるが、優秀な人はそんなに居ない。ちなみに優秀なポスドク募集中。」 #gengo2011ws
2011-03-11 10:39:01鳥澤先生:「本を読んでいないものは,日本語のユーザではない.日本語のユーザではない者が,どうして言語処理の研究ができるのか.」 #gengo2011ws
2011-03-11 10:42:54MSRの鈴木久美さん:「データの話がもっと出ると思った.」 「Penn Treebankがあるからアノテーションがしなくていい,は疑問.人間は何らかのルールを用いてアノテーションしているのだから,そのルールをそのままコード化してしまえば良い.」 #gengo2011ws
2011-03-11 10:47:15アカデミアがそれ単体としての役割、何を目指すべきかを十分に思索する前に、他のコミュニティとの歩み寄りを重視するのは危険だと思う。“@mhagiwara: 宮尾さん「大学と企業は仲良くする必要無い。大学の中途半端な企業化が不幸の一因」 #gengo2011ws”
2011-03-11 10:48:18宮尾先生:「企業は持っているデータを全部出せ.それしかない.」「Penn Treebankを全部見た人がどれだけいるか分からないが,一回は見ておくべき.あれは,思想.アノテーションマニュアルもある.」 #gengo2011ws
2011-03-11 10:48:34MSR鈴木さんより質問「データ公開について」回答「病院(大学)がデータを持っている。Web(企業)がデータを持っている。それによって力関係が変わるのでは?という指摘」「データよりも人間が重要なことも」「持ってるデータは全部公開して欲しい」 #gengo2011ws
2011-03-11 10:48:47議論されていないけど,何のために作られたデータなのか,というのが重要だよね.人間に対する科学の一環として,言語研究を行うなら,データを見るよりも,人間を見たほうがいいかもしれないね.でも,アプリケーションを作りたいのであれば,データを見たほうがいいよね. #gengo2011ws
2011-03-11 10:52:11それは,企業と大学というよりも,理学と工学の話だよね.研究としては,理学的な目的も工学的な目的でも,どちらでも取れる. #gengo2011ws
2011-03-11 10:53:59某H社にSBMのデータを全部下さい。サーバに保存しているデータを全部下さい。と依頼したらさすがに断られた。良い思い出ですね。 #gengo2011ws
2011-03-11 10:55:37個人的には,理学的な目的でやるなら,データの取り方の設計からやらなければならないと思うよ.アプリケーションを作る人は,理学的な研究をすることを目的にデータを作っていないから. #gengo2011ws
2011-03-11 10:56:15ぶっちゃけて言うと,企業からデータをもらったり,一緒にデモシステムを作ったりするのは時間がかかりすぎる.もちろん面倒な手続きが必要とか,製品品質といった事情は分かるが,研究は待ってくれないので結局頼れない. #gengo2011ws
2011-03-11 10:59:42Yet Another なんちゃってWebサービスが,10年後の研究の役にたったらどうするのだろう…?かぶったから同じWebサービスを作るのに意味が無いのだとすれば,そもそもWeb検索エンジンとして後発のGoogleは存在していないよね. #gengo2011ws
2011-03-11 11:00:32企業は面白い成果を出してくれるならデータを出すという。研究者はデータを眺めていないからどのような研究が出来るかわからない。そんな壁は無いだろうか? #gengo2011ws
2011-03-11 11:00:38RT @jmizuno: ぶっちゃけて言うと,企業からデータをもらったり,一緒にデモシステムを作ったりするのは時間がかかりすぎる.もちろん面倒な手続きが必要とか,製品品質といった事情は分かるが,研究は待ってくれないので結局頼れない. #gengo2011ws
2011-03-11 11:01:16大学はデータをもらうばっかりという前提で話されているが,語学教育の世界では,大学の方がデータつくってますよ.だって,語学教育のクラスの受講者の反応が,そのままデータになる.人間に対する反応のデータを集めたいなら人がいくらでも入れ替わる大学はある意味で天国 #gengo2011ws
2011-03-11 11:03:44研究テーマによっては,学生を実験対象にしてデータをとればいい,むしろ,そうしないとだめ,という場合もありますよ. #gengo2011ws
2011-03-11 11:04:52「はいっ!!この議論つまんない!天使の話をもっとしたいんです!大学にもっと天使を増やすにはどうしたらいい??」やっぱ、冴えてます。白熱ししてます。。。#gengo2011ws
2011-03-11 11:05:28でも、正直なところデータはコアコンピタンスであることが結構あるから多くの会社が出せないと思う。人類の叡智が進まないのと、参入障壁がなくなってその分野の会社が成り立たなくなり従業員が全員路頭に迷うのと社会的にどっちがマシ?#gengo2011ws
2011-03-11 11:05:37データ出す出さない問題の解決のひとつの形がインターンだと思いますよ:企業がデータを一般に出すのではなく,企業は大学からインターンを受け入れて,インターンが研究をする.企業は人材が取れ大学はデータが使えwin-win.だから,インターンという制度が普及した #gengo2011ws
2011-03-11 11:07:46この議論から何を生みだすんだろね?そもそもそんな話が必要ないってことか。 #gengo2011ws
2011-03-11 11:08:47