第5回Solr勉強会

0
前へ 1 2 ・・ 11 次へ
Eiji Iwazawa @iwazer

UIMA=非構造化テキストから有益な情報を抽出するフレームワーク。楽しそう。良い方は[you-ee-muh] #SolrJp

2011-05-16 19:17:42
@redhotstar

位置情報系処理が強化されてて面白そうだ #SolrJP

2011-05-16 19:17:52
Eiji Iwazawa @iwazer

フィールドの横断検索ができるdismaxを改良したedismax。 #SolrJp

2011-05-16 19:18:48
@redhotstar

Solr3.1のFastVectorHighlghter→巨大なドキュメントに対して高速なハイライトを実現、ngramでハイライトを実現 #SolrJP

2011-05-16 19:20:56
Jun Ohtani @johtani

1.4.1のDIHはいろいろバグがあるみたい。#SolrJp

2011-05-16 19:21:32
hayato_1980 @hayato_1980

replicationのバグのJIRAオープンしたのオレオレ。とまったく自慢にならないことを書いてみる。 #SolrJP

2011-05-16 19:21:33
新米医療情報技師 @Kengo_TODA

Wikiは実装との乖離が進んでしまうので、google-code-prettifyを使ってJavadocに各種情報をまとめるようにした、と。なるほど発想は理解できるが、prettifyでなんとかなるものか?あとでちょっと調べる。 #SolrJP

2011-05-16 19:22:09
Jun Ohtani @johtani

lucene-gosenはjarファイルに辞書も入ってるよ。#SolrJp

2011-05-16 19:22:22
quoth @quoth

lucene-gosenでは、辞書もjarファイル内に入るので、簡単にデプロイできる #SolrJP

2011-05-16 19:22:42
@ryo0301 @ryo0301

#SolrJp ほぼホワイトペーパーに書いてある内容 http://t.co/csA6DCS

2011-05-16 19:22:57
新米医療情報技師 @Kengo_TODA

lucene-gosenはnaist japanese dictionaryに対応。NAIST! #SolrJP

2011-05-16 19:23:14
Eiji Iwazawa @iwazer

lucene-gosen 新しいTokenizerプロジェクト。jarファイルに辞書が入ってるので簡単にデプロイ。マピオンではニュース記事の解析にSenを使っているけど、custom辞書を取り込めるようになったらこっちを使いたいな〜 #SolrJp

2011-05-16 19:24:01
Hirotaka Niisato @hirotakaster

何気に非構造体データの検索って興味深い。 #SolrJP

2011-05-16 19:25:35
せーさん @seikun

形態素解析にMeCab(CMeCab), Sen, GoSen, Igoと色々あって悩んでいたけど、lucene-gosenがスタンダードになるといいなぁ。 #SolrJP

2011-05-16 19:25:40
新米医療情報技師 @Kengo_TODA

「Keep maintenance」がOSSプロダクトの売りになるとは……いや理解はできるんですが。勝手にやれよウリャーと言えるのもOSSの魅力ですよね。メンテナンスが頻繁ってことはパッチ書くのも一気に仕上げないとつらいのかな。そんなことはないか。 #SolrJP

2011-05-16 19:26:15
Eiji Iwazawa @iwazer

UIMAの統合だが、やはり日本語のサポートが全くできなかったので→roundhuit-uima #SolrJp

2011-05-16 19:26:42
新米医療情報技師 @Kengo_TODA

uimaって何?と思ってぐぐったら「UIMAはこれらの非構造化データの取り扱いに対して、IBMが示した解のひとつです。」だそうで。 http://ibm.co/ivhPb7 #SolrJP

2011-05-16 19:28:04
hayato_1980 @hayato_1980

キーフレーズ抽出はfacetなんかに使えるんじゃないか、と #SolrJP

2011-05-16 19:30:49
前へ 1 2 ・・ 11 次へ