第5回 データ構造と情報検索と言語処理勉強会 #DSIRNLP

第5回 データ構造と情報検索と言語処理勉強会 #DSIRNLP のまとめです。追加・削除・編集などご自由に。
7
前へ 1 2 ・・ 5 次へ
Mamoru B Komachi @mamoruk

#DSIRNLP 去年聞いたときも思ったが、予測入力に使うなら速度も重要な気がするが、現状サイズを小さくしたいという要求の方が強いってことかな。common prefix search できればいいような気も? そこから先は企業秘密らしい。

2014-01-11 14:02:08
Mamoru B Komachi @mamoruk

#DSIRNLP 4つ目は@conditional さんによる「いまさら聞けない "モデル" の話」。学生さんに「先生から『モデルを考えよう』と言われるけど、どうしたらいいんでしょうか?」と言われるが、どうアドバイスすればいいか? 特徴量の設計ではなさそうだ。具体的にどうする?

2014-01-11 14:08:32
Yuya Unno @unnonouno

モデルとはなにかという話は、ボクも学生の時に質問した気がしますね #DSIRNLP

2014-01-11 14:10:30
Mamoru B Komachi @mamoruk

#DSIRNLP おもしろい。モデルとは何を捨てて何を使うか。データに語らせる。モデルとデータを組み合わせ、アルゴリズムでパラメータを導き出す。確かにモデルを設計するってよく分からない概念。自分もD2くらいになってようやく腑に落ちた気がするし……。どうやったら分かるんだろうか?

2014-01-11 14:17:37
くまぎ @kumagi

みんなモデルモデルって言っててよくわからないというのは有ったけど、最近は全く気にならなくなった。 #DSIRNLP

2014-01-11 14:17:39
くまぎ @kumagi

脇道が多くてどれが本道なのかわからなくなってきた。 #DSIRNLP

2014-01-11 14:19:03
Mamoru B Komachi @mamoruk

#DSIRNLP 学生さんはどんな問題でも分類問題に落としたがる傾向がある。しかし実は問題の本質を考えると選好関係や回帰だったりのほうが適切ではないか? 構造を考慮した方がいいのではないか? 確率を考慮した方がいいのではないか? これらを学ぶために、たくさん論文を読みましょう。

2014-01-11 14:20:27
Mamoru B Komachi @mamoruk

#DSIRNLP アルゴリズムの実装は大変だが、多くの場合は「目的関数」に対する「最適化問題」に落とせる。この部分はサボるためのツールキットが多数公開されている。これらを活用すれば、効率的に(ものによっては数行で)実装できる。時間をかけて先人の知恵を借りられるか調べる価値あり。

2014-01-11 14:25:23
散歩𝕏 @PENGUINANA_

http://t.co/eEZr4oVmJY 画像処理調べてた時に出てきたんだけど(だからCUDAとか出てくる)よく分からなかったからスルーしてたけど紹介されてたから見てみようかな #DSIRNLP

2014-01-11 14:25:29
Yuya Unno @unnonouno

最後にセクシーコマンドーモデルの話が #DSIRNLP

2014-01-11 14:25:40
Mamoru B Komachi @mamoruk

#DSIRNLP @shuyo さん「新人エンジニアには、分類が速くないといけないとかモデルのサイズが小さくないといけない、という目的に応じて設計することも伝えたい@sleepy_yoshi さん「経験的には新人にはこういう概念的なことを言うより、手を動かしてもらうほうがよい

2014-01-11 14:35:26
Mamoru B Komachi @mamoruk

#DSIRNLP 持橋さん「モデルを固定するとSVMで解ける問題しか解かないようになってしまう恐れがあるので、データを固定してモデルは自由に考えてもらうほうがいいのでは」@conditional さん「最近の学生さんはTwitterのような新し目のデータでやりたがるので難しい…」

2014-01-11 14:37:41
Mamoru B Komachi @mamoruk

#DSIRNLP 5つ目は@pseudo_finite さんによる「制約付きモデルの構築」のお話。現実のデータからモデルを学習すると、ノイズがあったりデータ数が少なかったりして、パラメータが直感と異なることがあるので、おかしなことが起きないように制約を入れて問題を解き直す。

2014-01-11 14:44:08
Yuya Unno @unnonouno

「この回帰係数が負になるのは気に食わない!」と怒られる事例、あるあるすぎて泣ける #DSIRNLP

2014-01-11 14:40:05
Yuya Unno @unnonouno

お客様が最もキモチイイパラメタになるような任意の正則化をモデリングしてあげましょう話、プロ過ぎて泣ける #DSIRNLP

2014-01-11 14:46:20
散歩𝕏 @PENGUINANA_

業務上の施策の影響が反映されてしまっているとかデータの一部が歪んでそうとか、サンプルが少ない部分とかを要件に応じて都合よく調整できるってことかな #DSIRNLP

2014-01-11 14:56:39
ゆっち〜 (Yuichiro MUKAI) @yucchiy_

iwiwi先生のDSIRNLPの発表聞きたい

2014-01-11 14:59:20
Koji Matsuda @conditional

本日の発表スライドから過剰なネタ分だけ除いたものをアップしました | いまさら聞けない “モデル” の話 @DSIRNLP#5 #DSIRNLP http://t.co/5yyVdyyMht ハッシュタグ忘れたので再告知

2014-01-11 15:26:10
Mamoru B Komachi @mamoruk

#DSIRNLP 休憩を挟んで6件目は @nakajijiji さんによる「SmartNews ×地域ニュース」。今回の会場を提供してくださっている SmartNews さんのお話をしてくださいます〜。

2014-01-11 15:08:05
KOMIYA Atsushi @komiya_atsushi

記事からの地域情報の推定、ということかな? #DSIRNLP

2014-01-11 15:10:06
KOMIYA Atsushi @komiya_atsushi

地域を表す単語はこちらを使っているそう。 #DSIRNLP GeoNLPプロジェクト (GeoNLP Project) - 自然言語文のジオタギングのための地名情報処理システム http://t.co/wxqgtpIReq

2014-01-11 15:11:36
前へ 1 2 ・・ 5 次へ