#hbstudy 第60回: SerfとConsulでシステム運用を楽しくしよう!のまとめ
Serf/Consulは本当に伝達系ミドルウェアだから使いどころがピンと来ないかもですがアイデア次第で超便利ツール #hbstudy
2014-07-20 14:21:42メンバ管理ではイベント発生を特定のタグをもつグループのみで伝達できる #hbstudy
2014-07-20 14:25:40AWS、(Serf|Consul) で使ってる gossip protocol をかなり昔から S3 で使ってる #hbstudy / “AWS Service Health Dashboard - Amazon S3 Avail…” htn.to/BsBFTA
2014-07-20 14:29:57障害検知は、ある喉が死んだノードをチェックしに行ったタイイングで検知され、クラスタ全体に同期される。死んだという判断は1台でもダメだと判断されたら切り離される。多数決ではない。間違っていたら、他ノードからの検知で復活する。(はしょりすぎ) #hbstudy
2014-07-20 14:32:27Serfが「こいつダメ」と判断するのは1台?何台かの合意?→1台がダメと思ったらダメ #hbstudy 通信系ダウンなどサーバ外因のときはパニックになるかも(^^;
2014-07-20 14:33:23あるノードが死んだ場合は、Serf はすぐに dead と判定するんじゃなくて、suspiciou 状態にして、他のノードからの迂回経路からも通信できなくなった場合に dead にするんじゃなかったっけ? #hbstudy
2014-07-20 14:35:31Serfはノード単位の死活監視のみ。もっと細かい管理を行いたい時はConsulの出番。 #hbstudy
2014-07-20 14:42:20Consulの守備範囲。サービス検出、障害検知、マルチデータセンタ、キーバリューストレージ。 #hbstudy
2014-07-20 14:43:46@netmarkjp 2 つに分断されたらダメですねえ…。とはいえ現状は何を使っても二分されたらダメな気がしていて、Serf がいいのは経路を 2 つ確保しておけば、迂回が比較的簡単に出来るところなんじゃないかなあと思います。よくわかんないですが...。 #hbstudy
2014-07-20 14:44:37SWIM、Heartbeat protocol がクソだから作られたって書いてあって笑ってる #hbstudy
2014-07-20 14:45:44Consulに近々イベントトリガの機能が付くはず。そうなれば使い方の幅が広がりそう。 #hbstudy
2014-07-20 14:48:06