あふれたらbuf_fileになるというの,一つのチャンクがflushされたらfileで保存されているチャンクはメモリにロードされるのか?
2014-04-02 01:32:33fluent-plugin-buffer-lightening は buffer plugin のAPIについてうっかりしていたところがあって、所定の目的を達成できない中途半端な機能になってしまったのが残念である、さっさとbuffer/outputまわりの内部APIを作り直したい
2014-04-02 01:32:39@repeatedly streaming mode(on memory mode)とtroubling/recovery mode(file mode)を切り替えながら動くとか? scribedはそういう動作
2014-04-02 01:33:27@repeatedly いや、基本的には読み込み→出力が同期的に行われる(メモリ上にしかない)、出力が失敗したらファイルチャンクに書くモードに遷移する、リカバリが開始されてファイルチャンクがなくなったらまた同期モードに戻る、という感じ
2014-04-02 01:35:29@tagomoris クラッシュはそもそも諦めるというスタイルですか.出力失敗時にはメモリにあるのを全てファイルに書き出して,リカバリ時には全てまたオンメモリに戻すか…それはそれでコスト掛かりそうな予感
2014-04-02 01:37:37@repeatedly @tagomoris @sonots クラッシュ時は諦めて良いと思います。出力失敗時も、buffer_chunk_limitが溢れるまではオンメモリモードでも良さそうな気がしますが、シグナルで強制flushを受信したが出力に失敗した場合は書き出すとか、
2014-04-02 01:39:37@repeatedly ん? いや通常は転送はすべて同期転送だから、自分がクラッシュしたときはクライアント(かファイル)にある、という想定なのでscribedは諦めてないですね
2014-04-02 01:40:18@repeatedly @tagomoris @sonots シャットダウン時には最優先で(他のプラグインの終了を待たずに)ファイルに書き出すとか、手動で対応できる方法が一応あると良い感じはありますね。
2014-04-02 01:40:28@frsyuki @repeatedly @sonots 個人的にはいまのfluentdの耐障害想定はそう悪くないと思いますけどね。ファイルチャンクのフォーマットがプラグイン任せなことと、それを後から手動で読み出してリカバリする手段が提供されてないのが問題だと思うくらいかな。
2014-04-02 01:41:29@tagomoris あれ、例えばOOM killerで殺されたとか、SIGKILLで死んだような場合は、バッファには入っているが未送信のデータはオンメモリなので失われるのでは?
2014-04-02 01:41:56@frsyuki その場合はそのノードに送ってきたクライアントにはまだOKが返ってないので、クライアントが再送可能(他のノードが生きてれば
2014-04-02 01:43:14手動で buf_file 先を読み込んで、新たに送り直すのって、fluentd 再起動すればやってくれるかんじ?
2014-04-02 01:43:24確かに fluentd で失敗したのだから、外から別のバッチで再送信しやすいように、buf_file を読み込むなにかが提供されているとうれしいのかも?
2014-04-02 01:44:37fluentdにactorが実装されたら1週間くらいつかってでもv11風のbuffer/output/input plugin APIを作り直して提案してみるつもりはある
2014-04-02 01:44:45@tagomoris ファイルチャンクのフォーマットは、統一した方がいいですかね?前に内部フォーマットがmsgpack固定の方が良いのでは?という話をしたときに、writeメソッドでフォーマットの変換が走って遅くなる、という話になった覚えがありますが。
2014-04-02 01:45:29buf_file からの復旧とはちょっとずれるけど、<secondary>type file</secondary> でとりあえずファイルに吐いておいた場合に、復旧できるコマンドが欲しいって誰か言ってた
2014-04-02 01:46:32@frsyuki そうですね。なんで、ふたつくらい(出力先にそのまま渡せる形式 or msgpack)とかに縛る感じでAPI作るのがたぶんいいんじゃないかと思います
2014-04-02 01:46:41secondaryに出力して後から頑張るより、決まった形式のchunk fileが残ってるほうが嬉しいよなあ、という気はしている
2014-04-02 01:48:06