大量ツイートの関連性をリアルタイム判定 ! Tornado/ElasticSearchで構築されたスケーラブル全文検索エンジン #PyConJP_C #pyconjp

Tornado/ElasticSearchで実現する大量ツイートのリアルタイム関連文書判定 Satoru Kadowaki https://pycon.jp/2015/ja/schedule/presentation/51/
1
前へ 1 2 ・・ 5 次へ
すてにゃん @stefafafan

ElasticSearchメインでお話するらしい #PyConJP_C #pyconjp

2015-10-10 14:02:51
すずどら @sz_dr

tweetは非整形短文,機械学習だと上手くいかない #PyConJP_C

2015-10-10 14:05:14
Keita @KeitaW09

機械学習を用いた関連文書分類にはある程度の文量が必要であるためツイートには向いていない #PyConJP_C

2015-10-10 14:05:17
すてにゃん @stefafafan

機械学習を利用してもツイートのような非整形の多分ではあまりいい結果が得られない #PyConJP_C #pyconjp

2015-10-10 14:05:19
cocuh @cocuh_

ツイートでトピック推定的なことかな…むずかしそう… #pyconjp_c #pyconjp

2015-10-10 14:05:30
mctk - マクトク @mactkg

Tweetの関連文書判定方法として正規表現: メッチャ大変 #pyconjp #PyConJP_C

2015-10-10 14:06:06
すてにゃん @stefafafan

正規表現でやろうと思うと呪文のようになってしまう #PyConJP_C #pyconjp

2015-10-10 14:06:54
Takuya Kitazawa @takuti

分類だ!機械学習だ!とならずに、ツイートは短いんだしもっとシンプルに考えてゆく e.g. 正規表現 #pyconjp #PyConJP_C

2015-10-10 14:06:56
SHIMIZU Taku @takuan_osho

正規表現に関する格言を思い出すな、これ #pyconjp #PyConJP_C

2015-10-10 14:06:58
Takuya Kitazawa @takuti

早速水ぶっかけられたような気分ですね #pyconjp #PyConJP_C

2015-10-10 14:07:26
すてにゃん @stefafafan

正規表現は精度が高かったとしても索引の自動化が不可能 #PyConJP_C #pyconjp

2015-10-10 14:07:37
shsh @shshb21

正規表現を使ってマッチング。索引の自動化が難しい。 #PyConJP_C

2015-10-10 14:08:04
mctk - マクトク @mactkg

正規表現は大変だけど精度が高い(はず)。索引の自動化は不可能なので、人の手でやりたい。でも分類するためのindexが増えるほど大変(ミスが起こりやすい)。良いバランスで自動化出来ないものか? #pyconjp #PyConJP_C

2015-10-10 14:08:25
PyCon JP @PyConJ

[会場別 Hashtag] 国際会議場/Conference Hall: #PyConJP_C, メディアホール/Media Hall: #PyConJP_M, 会議室1/Conference Room 1: #PyConJP_1 #pyconjp

2015-10-10 14:09:05
FJ @FJKei

#pyconjp #PyConJP_C 正規表現で関連文書判定は結構精度が良いけど、呪文になるし、自動化できないのが辛い。

2015-10-10 14:09:35
cocuh @cocuh_

そこをsearch engineと呼ぶのか…タグ付けだけするなら分類器だろうけれど検索するからたしかにsearch engineとしたほうがいいのかな…? #pyconjp_c #pyconjp

2015-10-10 14:09:55
Takahiro Ikeuchi / Awarefy CTO @iktakahiro

Elasticssearch は最近 AWS で簡単に使えるようになりましたね #PyConJP #PYConJP_C

2015-10-10 14:10:04
すてにゃん @stefafafan

短文(ツイート)にElasticsearchをかまして分類する #PyConJP_C #pyconjp

2015-10-10 14:10:17
前へ 1 2 ・・ 5 次へ