デブサミ2019【15-B-7】無意味なアラートからの脱却 ~ Datadogを使ってモダンなモニタリングを始めよう ~ #devsumiB

1
えいや @aya_eiya

次はdatadogs。 モニタリングを自分で色々仕込んで運用するの辛い現場むけ。#devsumi #devsumiB

2019-02-15 16:09:46
諏訪真一 @suwa_sh

●なぜアラートの嵐に埋もれるのか? ・監視する必要がない ・通知する必要がない ・1つに引きづられて発泡している ・複数の条件がそろって発砲するべき #devsumi #devsumiB

2019-02-15 16:22:45
のりぃ @m_norii

DataDogの入社試験は実際に環境構築してDataDog設定したりするのか。 #devsumi #devsumiB

2019-02-15 16:23:57
おっち @ottijp

Datadogは実はDatacatだった? #devsumiB

2019-02-15 16:24:12
諏訪真一 @suwa_sh

●Datadogって何? ・モニタリングのSaaS ・いろいろできる ・self serviceしやすい #devsumi #devsumiB

2019-02-15 16:25:56
諏訪真一 @suwa_sh

●レガシーなモニタリングツールではクラウド時代のスピードとペースに追いつけない 分散 マイクロサービス アジャイル 多種tayouna OSS, SaaSコンポーネント 複数チーム #devsumi #devsumiB

2019-02-15 16:26:09
諏訪真一 @suwa_sh

●なぜモニタリングするの? ・1時間のサービスダウンでの機会損失 amazon: 14億円 ・99.999 まで達成する必要ある? ・いち早く気づいて、いち早く回復させるが命題 #devsumi #devsumiB

2019-02-15 16:28:02
諏訪真一 @suwa_sh

●可視化の3本柱 ・Traces ・Metrics ・Logs これらを組み合わせて状況を理解する #devsumi #devsumiB

2019-02-15 16:29:12
eisaku teddy TERAO @eterao

なぜモニタリングするのか? サービスの機会損失を減らす。早く見つけて早く復活する #devsumiB #devsumi

2019-02-15 16:29:53
eisaku teddy TERAO @eterao

OOTB(Out of the box: 箱から出して直ぐ使える)、Fast Time to Value #devsumiB #devsumi

2019-02-15 16:31:29
諏訪真一 @suwa_sh

●Why Datadog ・セルフサービス ・250以上のインテグレーション 全てセルフサービス ・すぐに価値を得られる サイバーマンデーでスパークしたが、入れて1時間で復旧 #devsumi #devsumiB

2019-02-15 16:31:48
eisaku teddy TERAO @eterao

Cattle, not Pets ペットではなく、家畜 リソースは家畜のように群れとして管理しろよってこと。 #devsumiB #devsumi #datadog

2019-02-15 16:33:20
星 永亮 @inase17000

タグ、Mackerelにもあるなー。そういえば。 #devsumiB

2019-02-15 16:33:50
eisaku teddy TERAO @eterao

Tagでリソースを分類する。タグを役割ごとに考えるのがとても重要。 #devsumiB #devsumi #datadog

2019-02-15 16:34:35
諏訪真一 @suwa_sh

Cattle, not pets ・メトリクスにタグを付けられる 使い込むと重要になるよ #devsumi #devsumiB

2019-02-15 16:35:36
のりぃ @m_norii

DataDogのAPMいいなぁ。サービスマップも良さげ #devsumi #devsumiB

2019-02-15 16:38:35
諏訪真一 @suwa_sh

●モニタリングのポイント ・ワークメトリクス アプリのKPI ・リソースメトリクス ワークメトリクスの深掘りに使おう ・イベント 処理が遅延しだしたときに何をした? ・APM 6言語対応中 サービスマップで依存関係が見える ・ログ #devsumi #devsumiB

2019-02-15 16:39:31
のりぃ @m_norii

APMはPython, Ruby, Golang, Java, Node.js, NET, PHPに対応している #devsumi #devsumiB

2019-02-15 16:40:18
諏訪真一 @suwa_sh

・ログ ログをクラスタリングして、パターンを分析できる #devsumi #devsumiB

2019-02-15 16:42:13
のりぃ @m_norii

アラートの種類:記録(Record)、通知(Notification)、呼び出し(Page) #devsumi #devsumiB

2019-02-15 16:43:07
のりぃ @m_norii

PageはサービスのSLAに抵触するものに #devsumi #devsumiB

2019-02-15 16:44:30
諏訪真一 @suwa_sh

●アラートの種類 ・記録する ・通知する ・呼び出す の3段階で考えよう #devsumi #devsumiB

2019-02-15 16:44:36