Inspiring talk of Mr. Kodai Terashima san, CEO of Zabbix Japan, about the impressive progress on Zabbix adoption in Japan. #ZabConfJp2016 pic.twitter.com/PsLoCx9Dya
2016-11-18 14:38:01寺島さん:日本からの新機能要望: ・本社の開発サービスを使って ・Zabbix 4.0への新機能追加要望を前回の懇親会で募集 →2つを選定 →→ローレベルディスカバリで作成した設定を変更したい →→ホストグループの階層化 #ZabConfJp2016
2016-11-18 14:38:26寺島さん:今年も実施します: ・懇親会で要望を受け付け →Zabbix Japanから開発サービスを利用 ・アンケート用紙にも #ZabConfJp2016
2016-11-18 14:38:58寺島さん:ハードウェアアプライアンス製品: ・ZS-5300 ・ZP-1300 来年、もう一つ上のアプライアンスを出そうかと ・ZS-7300 →来年2月頃 #ZabConfJp2016
2016-11-18 14:40:01加藤さん:今日は、Zabbix の技術的の話というよりかは、大規模環境でどのように Zabbix を使っていくかの話を。 #ZabConfJp2016
2016-11-18 14:41:57加藤さん:KCPS(KDDI クラウドプラットフォームサービス): ・とめない(高可用性) ・まもる(高信頼性) ・つながる(高接続性) #ZabConfJp2016
2016-11-18 14:44:29続きまして、KDDI 加藤様より「大規模クラウド環境におけるZabbix利用事例」についての講演です。 #ZabConfJp2016 pic.twitter.com/tv1uEAQxi4
2016-11-18 14:46:27加藤さん:まもる: ・2時間以内の多重故障から復旧 ・故障時は能動通知で「30分以内」を目標 →このサービスを契約したお客様のみ #ZabConfJp2016
2016-11-18 14:48:49なーんか今年のカンファレンス、登壇者の自社サービスの話ばかりでZABBIXの話してくれない。実は使ってないんじゃ?って言いたいくらい。 #ZabConfJp2016
2016-11-18 14:54:21Interesting talk full of technical details on implementing Zabbix for monitoring of KDDI cloud with the highest availability. #ZabConfJp2016 pic.twitter.com/xhael5LcTW
2016-11-18 14:55:25加藤さん:システム概要: ・LOG解析基盤 →Zabbix と CloudStack が出すログを、専用で解析する →判定ロジックに #ZabConfJp2016
2016-11-18 14:55:54加藤さん:KCPSのシステム規模: ・国内 4拠点 ・物理サーバー 数千台 ・Zabbix サーバー:50台 ・マルチテナント監視:あり ・クラウドの環境なので、監視対象は増えたり減ったり #ZabConfJp2016
2016-11-18 14:57:05加藤さん: ・Zabbixがインストールされているハードウェア →仮想サーバー及び物理サーバー →→パフォーマンスが必要だったりもするので #ZabConfJp2016
2016-11-18 14:57:34加藤さん:クラウド基盤を考慮した監視ポイント: ・変化の激しい仮想サーバーの増減に対応した自動監視登録 ・仮想サーバーの正常動作と異常動作を自動で判断する ・自動化のリスクを自動化で守る ・複雑なインフラ環境における詳細な障害影響をどう特定するか #ZabConfJp2016
2016-11-18 14:59:47加藤さん:仮想サーバーの自動監視登録: ・苦労したポイント →お客様のホスト名と、Zabbix に登録するホスト名など、沢山の「ホスト名」 ・Zabbixのログ監視機能を活用 #ZabConfJp2016
2016-11-18 15:00:57加藤さん:仮想サーバー再起動時の動作を考慮: ・CloudStack の APIログから検知 #ZabConfJp2016
2016-11-18 15:01:30加藤さん:CloudStackと Zabbix監視の登録状態の同期: ・CloudStack APIにより取得 ・Zabbix API を自ら発行して取得 ・Zabbix にてそれらを比較 #ZabConfJp2016
2016-11-18 15:03:00加藤さん:障害影響を短時間で特定する: ・Zabbix 1台ではやりきれません →窓口にしている ・他のログとかも突き合わせながら、最終的にお客様通知へ →闇雲に通知すると、ユーザー様から怒られる #ZabConfJp2016
2016-11-18 15:03:51加藤さん: ・障害試験、受入試験で Zabbix を使っています →大量のログを分析している →検証環境で #ZabConfJp2016
2016-11-18 15:05:01