ゆるSRE勉強会 #4 まとめ #yurusre (13ページ目)

あいさか @mist_dev

運用コストに明確なビジネスメトリクスを持っている会社さん、会場に数人くらい #yurusre

2024-02-22 20:50:50

taito @ts__0625

監視には金がかかる。なんで？ってのはわかるんだよな。ビジネスサイドには理解されん。それもわかる。 #yurusre

2024-02-22 20:51:23

かたいなか @katainaka0503

このパネルディスカッションの話ずっと聞いてたいなぁ。 #yurusre

2024-02-22 20:52:03

Yuji T @yujittttttt

grepで目トレース今でもやってるわ #yurusre

2024-02-22 20:52:19

waday @waday_x

「grep -i はもう嫌だ」 #yurusre

2024-02-22 20:52:59

西から来た馬づらの男 @beppu01

お金の話なので、説明していく必要ありますね #yurusre

2024-02-22 20:53:06

あんどぅ @integrated1453

CIに投資しないと競合他社にデプロイ頻度で負けるのと同じように、オブザーバビリティに投資しないと運用保守の品質が低下してユーザーが離れてしまうというロジックは持っておかないとな #yurusre

2024-02-22 20:53:24

maru @maruloop

質問しました「ポストモーテムの際にo11yツールを見ると十分兆候や原因がわかるのですが、実際の障害対応の時は経験とメトリクスの変化から、ベテランが問題を特定してしまうことが多いです。ベテランエンジニアの皆さんはあえて自重してメンバーに任せることもありますか？」 #yurusre

2024-02-22 20:53:34

西から来た馬づらの男 @beppu01

26個の質問溜まってる #yurusre

2024-02-22 20:54:31

irotoris@もう疲れちゃって全然動けなくてェ… @irotoris

オブザーバビリティサービスの料金が高いのって大量データを高速に処理・蓄積するタイプのバックエンドが必要になるからであって、運用レスなクソデカ高性能 DB を擁してると考えたら安いまである（が高いものは高い） #yurusre

2024-02-22 20:55:25

あんどぅ @integrated1453

インフラ費用、事業の売上に対して何%というコンセンサスはないけど、SREチームの努力目標として事業の売上に対するインフラ費用の割合を現状より増やさず継続的に減らすことで利益率を高めることに貢献する、という意識はしている #yurusre

2024-02-22 20:55:36

西から来た馬づらの男 @beppu01

『ベテランの技で解決』みたいな話あるかもですね #yurusre

2024-02-22 20:55:55

waday @waday_x

ドキッ #yurusre x.com/maruloop/statu…

2024-02-22 20:56:03

西から来た馬づらの男 @beppu01

思考のプロセス残す #yurusre

2024-02-22 20:57:03

Momo @mom0tomo

ベテランではなく「もっとも好奇心が強く、もっとも粘り強く、新しい分析ツールをもっとも使いこなす人」が障害が起こった時最も活躍する」という話、オブザーバビリティエンジニアリングに書いてあったけど、実際障害が起きると応急処置しなきゃいけないから難しかったりする #yurusre

2024-02-22 20:57:05

waday @waday_x

「障害が発生した時に何を考えて何を見たか、思考のプロレスを残すようにしている」素敵 #yurusre

2024-02-22 20:57:05

かたいなか @katainaka0503

障害対応の属人化、最近いろんな文脈で話に出てる気がする。 #yurusre

2024-02-22 20:57:07

izawa ryosuke @e_san_desuyo

障害対応の思考のプロセスを残す✍️ #yurusre

2024-02-22 20:57:18

あいさか @mist_dev

実際の障害対応の時にベテランエンジニアやりがち問題、どうしてるかグラフを全員で見て全員が兆候に気付けるという土壌を作る、障害対応自体はスピード重視でやって振り返る、障害対応の過程で何を見て何をしたかの思考のプロセスを書き残す、開発SREで週一同じグラフを見て議論、など #yurusre

2024-02-22 20:57:56

maru @maruloop

「日々のダッシュボード確認で一緒に見つける、ポストモーテムでキャッチアップする、思考をトレースできるように残しておく。止血は優先することが多い」 #yurusre x.com/maruloop/statu…

2024-02-22 20:57:57

Momo @mom0tomo

日常的な振り返りとダッシュボード眺める文化が大事なんだな #yurusre

2024-02-22 20:58:01

Ken Kato @kkato25

「パフォーマンスについてアプリケーションエンジニアとSREが定期的に確認する機会を設けている」なるほど #yurusre

2024-02-22 20:58:39

あんどぅ @integrated1453

ジュニアエンジニアでも落ち着いてo11yツールを見ていけば原因特定できるステップを、障害時はシニアエンジニアが勘と経験と度胸でステップを一足飛びに問題解決してしまうことはよくありますよね #yurusre x.com/maruloop/statu…

2024-02-22 20:58:43

Yuji T @yujittttttt

他の質問の回答も見たかったなあ #yurusre

2024-02-22 20:58:55

taito @ts__0625

昔、ポストモーテムの対応履歴をコンフルに結構ちゃんと残してました。あれは良かったけど、履歴残すのに時間がかかる。運用にリソースを割ける組織でしか実現できないのが悩み。 #yurusre

2024-02-22 20:59:09

いま話題のタグ