#DSIRNLP 去年聞いたときも思ったが、予測入力に使うなら速度も重要な気がするが、現状サイズを小さくしたいという要求の方が強いってことかな。common prefix search できればいいような気も? そこから先は企業秘密らしい。
2014-01-11 14:02:08#DSIRNLP 4つ目は@conditional さんによる「いまさら聞けない "モデル" の話」。学生さんに「先生から『モデルを考えよう』と言われるけど、どうしたらいいんでしょうか?」と言われるが、どうアドバイスすればいいか? 特徴量の設計ではなさそうだ。具体的にどうする?
2014-01-11 14:08:32#DSIRNLP おもしろい。モデルとは何を捨てて何を使うか。データに語らせる。モデルとデータを組み合わせ、アルゴリズムでパラメータを導き出す。確かにモデルを設計するってよく分からない概念。自分もD2くらいになってようやく腑に落ちた気がするし……。どうやったら分かるんだろうか?
2014-01-11 14:17:37#DSIRNLP 学生さんはどんな問題でも分類問題に落としたがる傾向がある。しかし実は問題の本質を考えると選好関係や回帰だったりのほうが適切ではないか? 構造を考慮した方がいいのではないか? 確率を考慮した方がいいのではないか? これらを学ぶために、たくさん論文を読みましょう。
2014-01-11 14:20:27#DSIRNLP アルゴリズムの実装は大変だが、多くの場合は「目的関数」に対する「最適化問題」に落とせる。この部分はサボるためのツールキットが多数公開されている。これらを活用すれば、効率的に(ものによっては数行で)実装できる。時間をかけて先人の知恵を借りられるか調べる価値あり。
2014-01-11 14:25:23http://t.co/eEZr4oVmJY 画像処理調べてた時に出てきたんだけど(だからCUDAとか出てくる)よく分からなかったからスルーしてたけど紹介されてたから見てみようかな #DSIRNLP
2014-01-11 14:25:29#DSIRNLP @shuyo さん「新人エンジニアには、分類が速くないといけないとかモデルのサイズが小さくないといけない、という目的に応じて設計することも伝えたい」@sleepy_yoshi さん「経験的には新人にはこういう概念的なことを言うより、手を動かしてもらうほうがよい」
2014-01-11 14:35:26#DSIRNLP 持橋さん「モデルを固定するとSVMで解ける問題しか解かないようになってしまう恐れがあるので、データを固定してモデルは自由に考えてもらうほうがいいのでは」@conditional さん「最近の学生さんはTwitterのような新し目のデータでやりたがるので難しい…」
2014-01-11 14:37:41#DSIRNLP 5つ目は@pseudo_finite さんによる「制約付きモデルの構築」のお話。現実のデータからモデルを学習すると、ノイズがあったりデータ数が少なかったりして、パラメータが直感と異なることがあるので、おかしなことが起きないように制約を入れて問題を解き直す。
2014-01-11 14:44:08お客様が最もキモチイイパラメタになるような任意の正則化をモデリングしてあげましょう話、プロ過ぎて泣ける #DSIRNLP
2014-01-11 14:46:20業務上の施策の影響が反映されてしまっているとかデータの一部が歪んでそうとか、サンプルが少ない部分とかを要件に応じて都合よく調整できるってことかな #DSIRNLP
2014-01-11 14:56:39本日の発表スライドから過剰なネタ分だけ除いたものをアップしました | いまさら聞けない “モデル” の話 @DSIRNLP#5 #DSIRNLP http://t.co/5yyVdyyMht ハッシュタグ忘れたので再告知
2014-01-11 15:26:10#DSIRNLP 休憩を挟んで6件目は @nakajijiji さんによる「SmartNews ×地域ニュース」。今回の会場を提供してくださっている SmartNews さんのお話をしてくださいます〜。
2014-01-11 15:08:05地域を表す単語はこちらを使っているそう。 #DSIRNLP GeoNLPプロジェクト (GeoNLP Project) - 自然言語文のジオタギングのための地名情報処理システム http://t.co/wxqgtpIReq
2014-01-11 15:11:36