「Elasticsearch、Kibana、Logstashではじめるログ解析入門」 #oscnagoya #elasticsearch
2016-05-28 10:12:27Logstash in 10 seconds ・ログデータを集めてきてどこかに流す ・いらないデータを落としたりといった加工 ・Rubyで書かれているが実行は JRuby なのでちょっと重かったり ・オープンソース #oscnagoya #elasticsearch
2016-05-28 10:12:41Logstash Arcitecture ・どこから? ・加工 ・どこへ? #oscnagoya #elasticsearch
2016-05-28 10:12:46filter ・grokプラグイン →正規表現 ・dateプラグイン →タイムスタンプを入れ替えたり ・agentプラグイン →User Agentをとってくる #oscnagoya #elasticsearch
2016-05-28 10:13:27output ・elasticsearch →日付などをログファイル名にできたり #oscnagoya #elasticsearch
2016-05-28 10:13:57フリーワード検索 ・GitHub →裏で Elasticsearch が動いている →ここで試すことができる #oscnagoya #elasticsearch
2016-05-28 10:14:44Elasticsearch in 10 seconds ・スキーマフリー、分散ドキュメントストア、REST&JSON →簡単に叩くことができる →スケールアウトがしやすい →→クラスタを作れる #oscnagoya #elasticsearch
2016-05-28 10:16:01・設定無しで簡単に試すことができる ・Javaで実装、拡張も容易(?) →癖があるコードなので… #oscnagoya #elasticsearch
2016-05-28 10:16:45データ登録・削除・取得: ・JSONで投げつけて ・JSONで返ってくる #oscnagoya #elasticsearch
2016-05-28 10:17:42検索:Query DSL: ・JSONで構造化したクエリーを書くこともできる #oscnagoya #elasticsearch
2016-05-28 10:18:02Basic terms: ・スケールする→「Elastic」 #oscnagoya #elasticsearch
2016-05-28 10:18:26・インデックス →データの論理的な集合 ・レプリケーション ・シャーディング →複数マシンを分散 #oscnagoya #elasticsearch
2016-05-28 10:18:49シャードとレプリカ: ・シャードの数を指定 ・レプリカの数を指定 ・ノードを増やすとうまい感じに分散してくれる #oscnagoya #elasticsearch
2016-05-28 10:19:48用語 ・インデックス →データが保存される先 ・ドキュメント(文書) →検索エンジンに保存されたデータ →もともと、図書館で使われていたから? #oscnagoya #elasticsearch
2016-05-28 10:20:45ドキュメントの登録: ・ドキュメントの登録→単語に分割→単語からIDの配列が引けるように #oscnagoya #elasticsearch
2016-05-28 10:21:31単語の区切り方: ・英語→スペースで区切れば良い ・日本語→難しい… #oscnagoya #elasticsearch
2016-05-28 10:22:28N-Gramと形態素解析: ・形態素解析 ・N-Gram #oscnagoya #elasticsearch
2016-05-28 10:22:49形態素解析: ・辞書に載っている単語を元に ・メリット →意味のある単語の切れ目 →品詞情報を元に追加処理が可能 ・デメリット →辞書にないものに弱い #oscnagoya #elasticsearch
2016-05-28 10:23:38N-Gram: ・N文字ずつ頭から切っていく →単語をすべて網羅できる ・メリット →未知語に対応可能 ・デメリット →インデックス肥大化 →品詞情報に基づく処理が不可能 #oscnagoya #elasticsearch
2016-05-28 10:24:31