飯田さんによる「試して覚えるPacemaker入門 排他制御機能編」です。 #osc15tk #Pacemaker_jp
2015-10-24 15:16:35Pacemakerとは?: ・オープンソースで開発されている効果用クラスタソフトウェアです。 #osc15tk #Pacemaker_jp
2015-10-24 15:17:23フェイルオーバーのイメージ: ・障害を検知、対象ソフトを停止させ、サービスを自動的に他のサービスに切り替える #osc15tk #Pacemaker_jp
2015-10-24 15:17:58スプリットブレインとは?: ・クラスタを組んでいるノード間をつなぐインターコネクト通信が全て切断 ・それぞれのノードで起動したリソースが二重で書き込んだりして、データ破壊が発生 #osc15tk #Pacemaker_jp
2015-10-24 15:19:09リソースの停止故障とは?: ・Pacemakerが管理しているリソースを停止できなくなること →プロセスが書き込みを継続しているなど、Pacemakerからの指示を受け付けない場合 #osc15tk #Pacemaker_jp
2015-10-24 15:21:05・停止に失敗したリソースは、クラスタから管理不可 →フェイルオーバーできない →サービス継続不可 #osc15tk #Pacemaker_jp
2015-10-24 15:21:12・STONITH →ノードの電源操作を行う ・SFEX →ストレージを使う ・VIPcheck →仮想IP #osc15tk #Pacemaker_jp
2015-10-24 15:22:50・STONITHは、スプリットブレイン、リソースの停止故障の両方に対応できる #osc15tk #Pacemaker_jp
2015-10-24 15:23:25STONITHとは?: ・制御が効かなくなったノードの電源を強制的に停止して、クラスタから「強制的に離脱」させる #osc15tk #Pacemaker_jp
2015-10-24 15:24:06STONITHプラグイン: ・Pacemakerに備わっている ・フェンシング →ipmi, libvirt, ec2など、各サーバーに接続されている電源管理デバイスに合わせて使用する #osc15tk #Pacemaker_jp
2015-10-24 15:25:24・サーバー生死確認、相撃ち防止 →stonith-helper #osc15tk #Pacemaker_jp
2015-10-24 15:25:25STONITHによる排他制御のイメージ: ・インターコネクト通信が停止したら →相手の状態がわからない ・STONITHが実行され、相手の電源が切れる #osc15tk #Pacemaker_jp
2015-10-24 15:26:11・リソース故障の場合は? ・相手からSTONITHが実行される →ノードを停止させる #osc15tk #Pacemaker_jp
2015-10-24 15:26:45STONITHの相撃ち問題: ・スプリットブレインになった場合、お互いのオードが相手にSTONITHを実行し、相撃ちが怒ってしまう #osc15tk #Pacemaker_jp
2015-10-24 15:27:38→helperを入れた場合、stonith-helperが、自分のクラスタの状況を確認する →→stonith実行までの sleep時間を入れ、この間に、stonith-helperが、自分がActiveになったかどうかを確認 #osc15tk #Pacemaker_jp
2015-10-24 15:30:30STONITHが使えない場合: ・環境に合わせて、SFEXや VIPcheck を使うことになる #osc15tk #Pacemaker_jp
2015-10-24 15:31:02SFEXによる排他制御のイメージ: ・共有ディスに、ロックファイルを置く専用パーティションを用意 ・スプリットブレインになった場合、ロックを取れなくて失敗する #osc15tk #Pacemaker_jp
2015-10-24 15:32:17VIPcheck による排他制御のイメージ: ・ping を使って確認 ・VIPが他のノードに割り当てられている場合は失敗するので #osc15tk #Pacemaker_jp
2015-10-24 15:32:59