デブスト2019【B-6】CloudNativeな監視とは? 今日から始める監視 #devboostB
- developersboost
- 1740
- 3
- 1
- 0
従来のような「想定された障害」に対するアラートでは、障害を予測できない分散システムに対応できない。そこで、すべてのコンポーネントを観測可能にしておく必要がある。 #devboostB #devboost
2019-11-30 16:12:05ObservabilityにおけるTestingの概念 - サービスの品質を高めるため - ビジネス観点で品質を満たしているか? #devboost #devboostB
2019-11-30 16:13:32サービス品質を高めるためのtesting。ビジネス観点での品質を保てているかも観測する。 可観測性を実現するツールに求められる要素、手段の一つをtelemetryという。 #devboostb
2019-11-30 16:14:20Telemetryの要素 - Metrics - Logging - Tracing #devboost #devboostB
2019-11-30 16:18:43telemetry ・ロギング: イベントを把握できる。設計が必要 ・トレーシング: リクエストライフサイクルを横断。jaegerなど ・メトリクス: 集計を行える。アラート。単一のメトリクスだけでは何もわからない #devboostb
2019-11-30 16:18:46Tracingすることで様々なコンポーネント横断の情報をリクエストベースで見ることができる、とのこと。あんまりイメージつかないけど便利そう(小並感) #devboostB #devboost
2019-11-30 16:19:10telemetryの課題 ・telemetry全体を繋いでデバッグするソリューションがない ・運用構築コストが高い。datadogとか使って賄うなどするとよい #devboostb
2019-11-30 16:19:55ちなみに弊社プレイドさんでは、Datadogをヘビーに使ってます。 #devboostB #devboost
2019-11-30 16:20:50Telemetryの3要素(現時点) ・メトリクス → 数値計測。これだけでは問題の原因はわからない ・ロギング → イベントの記録 ・トレーシング → 複数のコンポーネントに渡ってリクエストベースで見ることができる この3つを合わせて見るという手法がTelemetry。 なるほどー! #devboost #devboostB pic.twitter.com/ux4M31KVwX
2019-11-30 16:22:39