MySQLとPostgreSQLと日本語全文検索

2016年2月9日(肉の日)にDMM.comラボさんで開催された「MySQLとPostgreSQLと日本語全文検索」の様子です。
2
Groonga @groonga

今日は年に一度の肉の日なので「MySQLとPostgreSQLと日本語全文検索」があります! #mypgft groonga.doorkeeper.jp/events/35295

2016-02-09 12:09:31
山岡広幸 | Hiroyuki Yamaoka @hiro_y

今日はこれに行きます: MySQLとPostgreSQLと日本語全文検索 (02月09日) #mypgft groonga.doorkeeper.jp/events/35295 @groongaさんから

2016-02-09 19:11:49
Takashi Takizawa @ttkzw

会場に到着。ハッシュタグはこれか #mypgft / MySQLとPostgreSQLと日本語全文検索 groonga.doorkeeper.jp/events/35295

2016-02-09 19:46:13
Kazuki Sakai @flame1980

来てみた MySQLとPostgreSQLと日本語全文検索 (02月09日) #mypgft groonga.doorkeeper.jp/events/35295

2016-02-09 19:52:19
s-ichikawa @ichikawa_0829

着席。昨日nginxのでLTしてた方がいる。 #mypgft

2016-02-09 20:01:34
山岡広幸 | Hiroyuki Yamaoka @hiro_y

MySQLとPostgreSQLの全文検索の事例紹介をしたかったけど、事例を持ってる人が見つからずMySQLの事例を厳選して紹介する感じになった #mypgft

2016-02-09 20:03:51
dupont @dupont_kedama

山崎さんのMySQL5.7の全文検索の機能紹介 #mypgft

2016-02-09 20:12:10
dupont @dupont_kedama

ツイートできないコメントいただきました #mypgft

2016-02-09 20:15:57
dupont @dupont_kedama

MySQL5.6の全文検索が日本語対応してない理由の説明。日本語の分かち書きが標準では搭載されていないため。 #mypgft

2016-02-09 20:19:12
dupont @dupont_kedama

会場アンケートでPostgreSQLユーザーは3割くらいでした。(MySQLは多数。) #mypgft

2016-02-09 20:21:16
dupont @dupont_kedama

MeCabパーサのインストール方法の説明。 #mypgft

2016-02-09 20:22:20
dupont @dupont_kedama

FTS_DOC_ID列を作るのを推奨。作らないと内部的に勝手に作る。 #mypgft

2016-02-09 20:25:37
dupont @dupont_kedama

今後の展開予定 ・パフォーマンス ・曖昧検索 など。 #mypgft

2016-02-09 20:31:37
dupont @dupont_kedama

お願い。 日本語で使ってどんどんフィードバックしてほしい。(開発者は日本人ではない) #mypgft

2016-02-09 20:32:45
kichi*2 @kich1x

#mypgft パーサーによるパフォーマンスへの影響はどの程度違うのだろう

2016-02-09 20:32:50
山岡広幸 | Hiroyuki Yamaoka @hiro_y

InnoDBの日本語全文検索のメインの開発担当者が日本人じゃないらしい。なので積極的にフィードバックいただきたいとのこと #mypgft

2016-02-09 20:32:51
Hiroyuki Inoue @inohiro

行が挿入される毎に転置インデックスが更新されると、結構重たい? インデックス更新のタイミングは制御できる? #mypgft

2016-02-09 20:35:52
dupont @dupont_kedama

PostgreSQL pg_bigm のお話。 #mypgft PostgreSQLの全文検索プラグインはたくさんある。

2016-02-09 20:38:30
dupont @dupont_kedama

形態素解析できるのは textsearch_ja (本体最新版で使うにはソースいじらないと。)とpgroongaとtextsearch_groonga(9.1まで?) #mypgft

2016-02-09 20:41:28
Hiroyuki Inoue @inohiro

pg_trgm はデフォルトで日本語に未対応。また、1,2文字の検索だと低速 #mypgft postgresql.jp/document/9.5/h…

2016-02-09 20:47:19
dupont @dupont_kedama

N-gram 昔はtextsearch_sennaを使っていた。検索は外部で行う。 その後pg_trgmが付属モジュールとして実装。ただしマルチバイト非対応で1,2文字の検索が低速。 #mypgft

2016-02-09 20:47:55