馬淵さん: なぜ: 障害児の原因究明 顧客の経路変動/正常性 主要なPeerの経路変動、Peerしているのに上流から流れてないか。 マネジメント面: 上流トランジットへの経路依存率の把握 経路情報を見るのは運用だけでなく コストマネジメントにも使いたい #janog
2017-07-28 13:17:33馬淵さん:今までは、Quagga + MRT dump + libBGPdump で。 ・前後関係とか、何時何分にどれくらい?とかが見にくい #janog
2017-07-28 13:18:01馬淵さん: いままではQuagga+MRT Dump+LibBGPdump 新しい経路をモニタリングするものが欲しい グラフとして経路の変動が見える。リアルタイム性が欲しい。ほかのトラフィック情報と併せて経路変動が見られるとうれしい。 あんまり難しいことはしたくない #janog
2017-07-28 13:18:35馬淵さん:要件: ・グラフで変動を ・リアルタイムで ・トラフィックの情報と合わせて、一緒に経路変動も ・難しいことをしたくない。自分で全てを作るのはツライ #janog
2017-07-28 13:18:39馬淵さん:BMP: ・BGP Monitoring Protocol ・これを使えないルーターもある… ・代替手段を探していた #janog
2017-07-28 13:19:06馬淵さん: 最近だとBMP モニタリングできるプロトコル 結局商用の環境ではサポートしてないものがありできない。 落としどころでは経路を GoBGPとiBGPで各ルータから経路を取得して GoBGPからBMPを送信 #janog
2017-07-28 13:19:38馬淵さん:各ルーターで iBGP で繋いで、BMP を喋れるルーターから BMP で収集する: ・GoBGP で集めて経路を記録する #janog
2017-07-28 13:19:52馬淵さん: 肝心のBMPサーバ 自分でやろうとしたら良いオープンソースがあった SNAS http:.//www.snas.io/ オープンソースで今年の4月に誕生、Docker、APIも使える #janog
2017-07-28 13:20:30馬淵さん:BMP Server: ・SNAS という OSS が ・OpenBMP を中心として、Kafka とか OSS で提供されているものが誕生していて →4月ころ ・Docker で立ち上がったり #janog
2017-07-28 13:20:34馬淵さん: 簡単にダッシュボードで見ることができる。 アルプレフィックスの時系列情報も見ることができる。 このツール障害対応でトレースしていくところに注力するととてもわかりやすい #janog
2017-07-28 13:21:12馬淵さん:SNAS UI: ・Withdraw とか、コミュニティが消えましたよとかが時系列で ・障害対応でトレースするならとても良い #janog
2017-07-28 13:21:14馬淵さん: 障害の原因究明ではなく、経路依存率や主要なPeerの経路変動を見るには標準のWebUIでと難しいので、APIでInfluxDB+Graphanaで見る形にした #janog
2017-07-28 13:21:54馬淵さん:しかし: ・上流雨トランジットの、とかだと、独自の視点があるので、それは独自で取得するしか無い →InfluxDB から Grafana へ #janog
2017-07-28 13:22:05馬淵さん: データを入れるだけで手間はかかりませんでした。Graphanaで格納したもので、ダッシュボードを作った #janog
2017-07-28 13:22:19続いて、「お手軽! BGP RIBのリアルタイム経路解析+可視化」です。馬淵 俊弥さん(ビッグローブ株式会社)の発表です。 #JANOG pic.twitter.com/3OnARgd7eF
2017-07-28 13:22:40馬淵さん: 経路変動や、影響の大きいPeer、お客様経路の監視、 上流トランジットにどれだけ依存しているかを一覧で見られる #janog
2017-07-28 13:22:54馬淵さん:作った Dashboard: ・上流雨トランジットやUpdate/Widthdrawn発生数、顧客経路の状態監視、特定ピアの状態 ・トラフィックのグラフとピアの経路のグラフを一緒に →これが Grafana で良いところ #janog
2017-07-28 13:23:19馬淵さん: トラフィックとそのピアの経路の詳細と横並びにしてダッシュボードにできた。すごくGraphanaのいいところ トラブルシューティングのときに経路変動がおきて問題がおこったのがわかる #janog
2017-07-28 13:23:32馬淵さん:良かった点と改善点: ・SNAS で作るのが楽になりました →注目すべき経路に特化してみることができるように ・改善点 →ベストパスを受けているだけ →ベストじゃないものは見れていない →BGP Add-pathを使って? →→ルータのバージョン問題 #janog
2017-07-28 13:24:35馬淵さん: 良かった点: SNASで大分作るのが楽になった。 注目すべき経路情報に絞って剣士できた。 RESTAPIの充実 改善点 ベストパスを集めてるだけなので、 BMPを直接つかうか BGP Add-Pathを使うのはどうか。 ルータのバージョンの壁 #janog
2017-07-28 13:24:37馬淵さん:まとめ: ・経路状態は、運用以外でも、ピアリングでどうやっていくかの目標、依存率を減らすといったとおろで意外と使えるな、と ・経路監視を GoBGP, OpenBMP, InfluxDB などでやってみました ・Grafana で可視化は便利 #janog
2017-07-28 13:25:31