[自由編集可] 次世代 Web カンファレンス 2019 SRE セッション (#nwc_sre)

これからの SRE について真剣に議論する
1
前へ 1 ・・ 4 5 7 次へ
ザネリ @so_zaneli

狼少年アラート問題対策。アラートを設定する際にチーム内でレビューする。「俺は朝3時にこのアラートで叩き起こされるがこのアラートを設定する事は妥当か?」 #nwc_all #nwc_sre

2019-01-13 10:41:38
hirapi🍔 @chmv71

(おお、prometheusってテストも書けるの?) #nwc_sre

2019-01-13 10:41:41
れい (Yoshikawa Ryota) @rrreeeyyy

監視に強い気持ちがある人、一体何者なんだ...... #nwc_sre

2019-01-13 10:41:55
Masashi Kondo @mssknd

アラートもテストをして、管理者から承認されたものを運用する。 #nwc_sre

2019-01-13 10:42:42
hirapi🍔 @chmv71

オオカミ少年アラート、前職でめちゃくちゃあったけど真面目な人からしんでいくからな #nwc_sre

2019-01-13 10:42:50
Makio Tsukamoto @tsukamoto

「アラートはすべてレビューしていて『このアラートを承認する≒このアラートで朝3時とかに起こされることを許容する』覚悟でみんなで見る」 分かるけどSREチームが24時間対応なら3交代制を敷けなきゃじゃないかな。SREチーム員の勤務体制って「緊急コールは24時間許容」前提なんだろうか。 #nwc_sre

2019-01-13 10:43:52
guyon @gu4

低アラートを実現するために「設定するときにレビューする=叩き起こされてもいい」という話、チームビルディングのバランスどりと密接な関係にありそう #nwc_sre

2019-01-13 10:44:21
さわら @xhiroga

朝3時叩き起こされるの基準はチームサイズによって変えるのが良さそう 例えばSREが2人だけなら「通勤前に家でログインしてまで調査したいか」とか #nwc_sre

2019-01-13 10:46:17
神田 佳積 @kazumiks

セルフサービス化は大事。TerraformでGCPの基盤を構築するとのこと。 #nwc_sre

2019-01-13 10:46:42
Masashi Kondo @mssknd

インシデントだけではなく、アラートにもポストモーテムが必要な気がするなぁ #nwc_sre

2019-01-13 10:47:27
utrhira @uhtter

「Microservicesでサービスチームを分かれても、SREチームがデプロイ権限を持ってしまうと、結果的にボトルネックになってしまう。セルフサービス化のため、開発者がデプロイするためのサービス(Spinnakerとか)は用意してあげる。 #nwc_sre

2019-01-13 10:48:10
mizutani @m_mizutani

インフラの人は怖いと思われがち #nwc_sre

2019-01-13 10:48:49
神田 佳積 @kazumiks

それ、ITサービスの問題じゃね?メトリック値をどうするかに収束する気がするが。 #nwc_sre twitter.com/hiroga_cc/stat…

2019-01-13 10:49:45
ももたまこと @momota

マイクロサービス化に伴い、自律的チームがたくさん存在するようになるが、SREチームがデプロイなどに責任を持ってしまうとSREチームがボトルネックになってしまう。したがって、積極的に開発チームにSREの権限を移譲している。 #nwc_sre

2019-01-13 10:50:07
lacolaco👑 @laco2net

#nwc_sre 職能横断的なSREに何かお願いするとき、SREって社内のいろんなリアクティブな仕事を抱えているだろうって思って聞きづらい障壁はうまれがち

2019-01-13 10:50:26
Otsuka @mopin

"インフラエンジニアの意見は「正しくなりがち」" うまい言い回しだと思う。現場での懸念がすごくよくわかる。 #nwc_sre

2019-01-13 10:50:35
神田 佳積 @kazumiks

開発者に最終的には溶け込む。 #nwc_sre

2019-01-13 10:50:37
a-know | Daisuke Inoue @a_know

登壇者の方々が考える「SREとは」みたいなところが聞いてみたい。 #nwc_sre

2019-01-13 10:50:49
utrhira @uhtter

「マネージドが発達していくので、SREはチームとしての体から離れていくのが理想だと思う。 #nwc_sre

2019-01-13 10:50:54
神田 佳積 @kazumiks

よりリアリティが求められるサービスにSREは必要。特にクリティカルなものは。 #nwc_sre

2019-01-13 10:51:30
lacolaco👑 @laco2net

#nwc_sre そうなると.999にコミットできないSREは仕事が無くなりそう

2019-01-13 10:51:50
utrhira @uhtter

「99までは開発者だけでもなんとかなるけど、999からはSREとしての専門性を持っている人が求められるはず。完全に役割が消えることはない。 #nwc_sre

2019-01-13 10:52:11
██████████████████████ @motchang

クラウドのマネージドサービスが充実してきたことで、インフラの仕事が軽くなりみんなが SRE をやれるようになってきた #nwc_sre

2019-01-13 10:52:23
神田 佳積 @kazumiks

これは辛い。過去に起こされそうになったことがあるから尚更です。 #nwc_sre twitter.com/rela1470/statu…

2019-01-13 10:52:26
Jun Watanabe@rela @rela1470

朝3時に起こされてもよいアラートかレビューをしている #nwc_sre

2019-01-13 10:40:35
前へ 1 ・・ 4 5 7 次へ