2012/11/26(#solrjp)第9回Solr勉強会

1
前へ 1 2 ・・ 8 次へ
Jun Ohtani @johtani

@r_fujimoto #SolrJP 数週間後に出るらしいという噂が。

2012-11-26 19:25:33
KITAZAKI Shigeru @kshigeru

これは読んでおいた方が良い、という記事。 / Lucene's new analyzing suggester - http://t.co/Eyj8IYES #SolrJP

2012-11-26 19:26:01
HARUYAMA Seigo @haruyama

RT @kshigeru: これは読んでおいた方が良い、という記事。 / Lucene's new analyzing suggester - http://t.co/Eyj8IYES #SolrJP

2012-11-26 19:26:13
ふじもと @r_fujimoto

#SolrJP 退職していたらしょうがないよなぁ....、そんなプロジェクトあるある

2012-11-26 19:32:26
Jun Ohtani @johtani

#SolrJP これ話していいのかなぁw

2012-11-26 19:32:42
ふじもと @r_fujimoto

#SolrJP mysql/senna -> solrへ移設したらしい

2012-11-26 19:33:40
やのさん、(本人) @yano3

以前は MySQL + senna → Solr へ。あるあ(ry #SolrJP

2012-11-26 19:34:10
やのさん、(本人) @yano3

放送開始後1分以内の検索ヒットが要件。( Google のクロールの方が早かった。) #SolrJP

2012-11-26 19:36:24
ふじもと @r_fujimoto

#SolrJP solr3.4でマスター1台、スレーブ2台。そんだけの構成?すくな。2core 8G mem.

2012-11-26 19:37:16
KITAZAKI Shigeru @kshigeru

ニコ生は master/slave 構成で jetty-7.5 で立ち上げている。リプリケーションは Solr の機能を利用。元々は分散インデクスも検討していたらしい。 #SolrJP

2012-11-26 19:38:16
ふじもと @r_fujimoto

#SolrJP 70万番組/week, 1kb-10kb/1番組。このうち、Index対象の情報量が気になるな。

2012-11-26 19:39:51
やのさん、(本人) @yano3

1週間以前の番組(見られないので)はインデックスしない(更新多いが全量少ない)。来場者数とコメント数の更新頻度特に高い。 #SolrJP

2012-11-26 19:40:26
ふじもと @r_fujimoto

#SolrJP へえぇ,Redisにいったんつっこんでから、masterのsolrを更新しているのか。

2012-11-26 19:41:01
やのさん、(本人) @yano3

インデックス作成はバッチ。更新、削除情報は Redis にためてから流す。 #SolrJP

2012-11-26 19:41:19
KITAZAKI Shigeru @kshigeru

(なんで batch が PHP なのか。。。) #SolrJP

2012-11-26 19:41:46
Jun Ohtani @johtani

#SolrJP 「形態素」ですねw確かに、新語に対しては形態素解析のエンジンは弱い部分があります。

2012-11-26 19:42:33
close_yutori @kimukou2628

#solrjp トーカナイザー:インデックス更新優先 solr.CJKTokenizerFactory フィルタ;solr.HTMLStripCharFilterFactory & お手製正規化フィルタ <Bi-gram情報なので・・タグ情報で凌ぐ

2012-11-26 19:43:35
やのさん、(本人) @yano3

CJKTokenizer 。 Bi-gram なので FF, DQ などに弱い。タグ情報付加でしのいでる。 #SolrJP

2012-11-26 19:43:54
close_yutori @kimukou2628

#solrjp ピーク時: sélect: 40QPS<IPhone,Android 小さいピーク・・ユーザさんお手製ツール(これをどれだけ弾くかがポイント update:80QPS(番組作成、更新、削除

2012-11-26 19:45:32
やのさん、(本人) @yano3

ピーク時 SELECT 40QPS 程度。 UPDATE 80QPS 程度。 #SolrJP

2012-11-26 19:45:52
前へ 1 2 ・・ 8 次へ