第5回Solr勉強会 (2ページ目)

Eiji Iwazawa @iwazer

UIMA＝非構造化テキストから有益な情報を抽出するフレームワーク。楽しそう。良い方は[you-ee-muh] #SolrJp

2011-05-16 19:17:42

@redhotstar

位置情報系処理が強化されてて面白そうだ #SolrJP

2011-05-16 19:17:52

Nakamura @nakamuu

Apache UIMAが統合 #SolrJp

2011-05-16 19:18:01

Eiji Iwazawa @iwazer

フィールドの横断検索ができるdismaxを改良したedismax。 #SolrJp

2011-05-16 19:18:48

@redhotstar

Solr3.1のFastVectorHighlghter→巨大なドキュメントに対して高速なハイライトを実現、ngramでハイライトを実現 #SolrJP

2011-05-16 19:20:56

坂上真大（マダイ）@VALT JAPAN　組織開発/鎌倉/法務/労務/採用/山形 @madai0517

Solr3.1ではDIHのバグがかなり修正されている模様 #SolrJP

2011-05-16 19:21:29

Jun Ohtani @johtani

1.4.1のDIHはいろいろバグがあるみたい。#SolrJp

2011-05-16 19:21:32

hayato_1980 @hayato_1980

replicationのバグのJIRAオープンしたのオレオレ。とまったく自慢にならないことを書いてみる。 #SolrJP

2011-05-16 19:21:33

Yakitori @WildKetchup

edismax調べとこ#SolrJp

2011-05-16 19:21:39

Jun Ohtani @johtani

lucene-gosenのお知らせ。#SolrJp

2011-05-16 19:21:53

新米医療情報技師 @Kengo_TODA

Wikiは実装との乖離が進んでしまうので、google-code-prettifyを使ってJavadocに各種情報をまとめるようにした、と。なるほど発想は理解できるが、prettifyでなんとかなるものか？あとでちょっと調べる。 #SolrJP

2011-05-16 19:22:09

Jun Ohtani @johtani

lucene-gosenはjarファイルに辞書も入ってるよ。#SolrJp

2011-05-16 19:22:22

quoth @quoth

lucene-gosenでは、辞書もjarファイル内に入るので、簡単にデプロイできる #SolrJP

2011-05-16 19:22:42

@ryo0301 @ryo0301

#SolrJp ほぼホワイトペーパーに書いてある内容 http://t.co/csA6DCS

2011-05-16 19:22:57

新米医療情報技師 @Kengo_TODA

lucene-gosenはnaist japanese dictionaryに対応。NAIST！ #SolrJP

2011-05-16 19:23:14

Eiji Iwazawa @iwazer

lucene-gosen 新しいTokenizerプロジェクト。jarファイルに辞書が入ってるので簡単にデプロイ。マピオンではニュース記事の解析にSenを使っているけど、custom辞書を取り込めるようになったらこっちを使いたいな〜 #SolrJp

2011-05-16 19:24:01

Hirotaka Niisato @hirotakaster

何気に非構造体データの検索って興味深い。 #SolrJP

2011-05-16 19:25:35

せーさん @seikun

形態素解析にMeCab(CMeCab), Sen, GoSen, Igoと色々あって悩んでいたけど、lucene-gosenがスタンダードになるといいなぁ。 #SolrJP

2011-05-16 19:25:40

新米医療情報技師 @Kengo_TODA

「Keep maintenance」がOSSプロダクトの売りになるとは……いや理解はできるんですが。勝手にやれよウリャーと言えるのもOSSの魅力ですよね。メンテナンスが頻繁ってことはパッチ書くのも一気に仕上げないとつらいのかな。そんなことはないか。 #SolrJP

2011-05-16 19:26:15

Eiji Iwazawa @iwazer

UIMAの統合だが、やはり日本語のサポートが全くできなかったので→roundhuit-uima #SolrJp

2011-05-16 19:26:42

坂上真大（マダイ）@VALT JAPAN　組織開発/鎌倉/法務/労務/採用/山形 @madai0517

UIMAのデモコード http://bit.ly/lPc327 #SolrJP

2011-05-16 19:27:50

新米医療情報技師 @Kengo_TODA

uimaって何？と思ってぐぐったら「UIMAはこれらの非構造化データの取り扱いに対して、IBMが示した解のひとつです。」だそうで。 http://ibm.co/ivhPb7 #SolrJP

2011-05-16 19:28:04

@ryo0301 @ryo0301

#SolrJp NExTR on Rails

2011-05-16 19:28:12

Eiji Iwazawa @iwazer

rondhuit-uima URLはこれかな→ http://bit.ly/lUtaZb #SolrJp

2011-05-16 19:28:44

hayato_1980 @hayato_1980

キーフレーズ抽出はfacetなんかに使えるんじゃないか、と #SolrJP

2011-05-16 19:30:49

いま話題のタグ