- shima__shima
- 6182
- 0
- 4
- 6
固有表現抽出のチュートリアル research.microsoft.com/en-us/people/c… 固有表現は,特定の何かについて言明している節とかを抽出して,それが人物名とか場所名であるとかの型に分類すること
2015-08-10 11:13:15その他,ラベルの少ない weakly 教師ありや,別目的のタクソノミ・オントロジを使う遠距離教師ありなども紹介.基本は曖昧なところを仮にラベル付けして,仮定や弱い情報でチェックして再ラベル付けするNLPでのブートストラッピング
2015-08-10 11:25:42@toyodam 鈴村さん司会でパネル中。Leskovecは、スケールさせることは良いが、それによるインパクト(新たな発見や知見)があることが重要だとフォロー。
2015-08-10 11:32:38KDD 2015 slide of the day 1 (1): Yu Zheng's cross domain data fusion #ML #KDD2015 #bigdata #similarity #urban pic.twitter.com/JVu6GSZ3vw
2015-08-10 12:38:58KDD 2015 slide of the day 1 (2): Eric Xing's overcrowded tutorial- distributed machine learning #KDD2015 #ML #BigData pic.twitter.com/4KznNxVddR
2015-08-10 12:42:29KDD 2015 Slides of the day 1 (3): Eric Xing - data or model parallel? #BigData #ML #KDD2015 pic.twitter.com/2MIXOL2aau
2015-08-10 13:28:21KDD 2015 slides of the day 1 (4): Eric Xing's parallel coord descent for faster convergence #KDD2015 #ML #BigData pic.twitter.com/KubC3by55G
2015-08-10 13:30:12KDD 2015 Day 1 (6): Profiling passengers from Smart card data #datamining #KDD2015 #BigData #ML #urbancomputing pic.twitter.com/FZ24OMpx6F
2015-08-10 14:01:37Was a great talk by Eric Xing from CMU on distributed machine learning algorithms #KDD2015 pic.twitter.com/3QbW2tp6Wr
2015-08-10 14:06:36@kdd_news: slides from the #KDD2015 tutorial on "dense subgraph discovery", ow.ly/QGPti, with @Tsourolampis
2015-08-10 14:12:07IDEAというWSでもLeskovecさん招待講演。USでは逮捕された容疑者を裁判まで留置しようにも場所がないので1度リリースしなくてはならない。裁判に現れない人や新たに犯罪を犯す人はロックしたい。誰を選べばよいか機械学習したいがリリースしたことない人は訓練データにできない。
2015-08-10 15:24:20@toyodam さあどうすればよいか、と言うところまで聴いたがその後は記憶が途絶えている… #KDD2015
2015-08-10 15:25:55P. Reutemann (@waikato) presents cool #opensource project @TheAdamsFlow #MOA for #Streaming #datamining at #KDD2015 pic.twitter.com/DfIxMvEhYm
2015-08-10 15:33:11@toyodam しかしまあ色々やっておられる。逮捕からのリリースからの犯罪歴とかかなり機微な情報だと思うけど、よく触らせてもらえるものだ
2015-08-10 15:34:09機械学習の並列計算のチュートリアル petuum.org/kdd2015_tutori… (資料は後で掲載らしい)Petuum というプラットフォームを開発している人達だけど,GraphLab や Spark など他のプラットフォームについても俯瞰できた.
2015-08-10 16:06:12データを分割するデータ並列とパラメータ空間を分割して計算する並列計算についての基本に始まって,GraphLab などのデータ間の依存関係を考えてうまく分割する方法とか,パラメータの収束性にばらつきがあるので更新の優先順位を変えるとかいろいろ考えられてることが分かった.
2015-08-10 16:06:22複数のスレッドで返事の遅いパラメータを無視するのをstaleというらしいが,無視するスレッドの割合に依存したレグレットの上界とかの理論も出てきてるとか.
2015-08-10 16:06:42ML系の人はシステムの同期コストとかを無視しがちで,システム系の人はモデリングの変更に伴う書き換えコストを無視するという比較は '`,、('∀`) '`,、 だった.
2015-08-10 16:06:47Big program at #bigdata #kdd2015 conference - opening session kdd.org/kdd2015/progra… pic.twitter.com/1Cwd9Uhx2r
2015-08-10 17:46:11オープニング:現在の参加者:1182 (←2014:2134+←2013:1176),39ヶ国(米:382,豪:292,中:115)(アカデミア:533,学生:249,インダストリ:502,政府:120),スポンサー:27(金額 USD 350K は過去最大)
2015-08-10 17:49:04バンケットとかレセプションで翌日に影響がでないようにというのを optimize enjoyment と言っていてウケをとってる
2015-08-10 17:52:20Research track chairs discussing review process at #kdd2015 pic.twitter.com/s1TQsKsK6C
2015-08-10 17:54:25