2012/11/26(#solrjp)第9回Solr勉強会

1
upmeetup.info bot @upmeetup

11/26(月) [参加156人/定員110人]http://t.co/XCk9jqHv【第9回Solr勉強会】 #SolrJP

2012-11-26 11:00:03
KITAZAKI Shigeru @kshigeru

Atilika のコアは search engine, big data analysis, NLP の3本立て。製品を開発してコンサルティングもやるっぽい。customer-driven innovation と称するモデル。 #SolrJP

2012-11-26 19:06:00
Jun Ohtani @johtani

#SolrJP 今出てる画面は、4.0から導入された管理画面です。

2012-11-26 19:12:24
Jun Ohtani @johtani

#SolrJP Tokenizerチェインの紹介。schema.xmlに設定してあるTokenizerとTokenFilterの流れです。

2012-11-26 19:13:47
ふじもと @r_fujimoto

#SolrJP Compound nounsちょーきになる

2012-11-26 19:14:58
Jun Ohtani @johtani

#SolrJP 複合的な名詞とかのお話です。形態素解析で「関西国際空港」と抽出されると、通常は、「空港」で検索ができないです。(詳細はSolr入門を読んでもらえるとわかるかも?)

2012-11-26 19:15:10
Jun Ohtani @johtani

#SolrJP Kuromojiで実装されているsearch modeの紹介です。

2012-11-26 19:15:33
ふじもと @r_fujimoto

#SolrJP http://t.co/d6zvcQj9 に掲載されている内容をかぶってるのかな

2012-11-26 19:16:39
Jun Ohtani @johtani

#SolrJP カタカナの最後の「ー」の正規化の話。lucene-gosenでもありますよー

2012-11-26 19:17:09
Jun Ohtani @johtani

#SolrJP 今後のお話。Kuromojiの改良について。いくつかJIRAにチケットが上がってるかな。

2012-11-26 19:18:23
Jun Ohtani @johtani

#SolrJP UniDicは辞書のライセンスの問題で取り込めないと。

2012-11-26 19:20:11
Jun Ohtani @johtani

#SolrJP あー、パッチおくろうと思って送ってないですね。スミマセン。。。

2012-11-26 19:20:45
Jun Ohtani @johtani

#SolrJP 幾つかは、4.0で使える状態のものがありますよ。踊り字対応とか。

2012-11-26 19:21:50
KITAZAKI Shigeru @kshigeru

Kuromoji の ongoing work: improve compound segmentation, explore improving unknown word segmentation, additional dictionary support #SolrJP

2012-11-26 19:22:11
ふじもと @r_fujimoto

#SolrJP odoriji で検索したらこんなんヒットした http://t.co/99vUjEgb ビール飲みたい

2012-11-26 19:22:12
sifue(吉村 総一郎) @sifue

Kuromojiの踊り字対応を聞くと、日本語大変なことばかりだな…。 #SolrJP

2012-11-26 19:22:21
Yu Gori @yugori

#SolrJP 外人ぽいのに日本語の扱いうまいな。Kuromojiのひと。

2012-11-26 19:22:27
Jun Ohtani @johtani

#SolrJP 漢数字をアラビア数字に変換してIndexに登録したりするパッチも開発中。

2012-11-26 19:22:28
Jun Ohtani @johtani

#SolrJP 漢数字のパッチはTokenFilterで書いてたけど、今書き直してる所。色々と問題合ったので。

2012-11-26 19:23:50
Jun Ohtani @johtani

#SolrJP 4.1から導入されるAnalyzingSuggesterの話も出てる。

2012-11-26 19:24:35
ふじもと @r_fujimoto

#SolrJP 4.1はいつごろでるんだろうか..

2012-11-26 19:24:53
Jun Ohtani @johtani

#SolrJP 欲しい機能とかあったらSolrのJIRAにエントリーしてねー。

2012-11-26 19:25:20
1 ・・ 8 次へ