そもそもReliabilityについての開発がAgreement得られるようなマインドセットをステークホルダと共有せんとなあ・・・という気持ちに #SRETokyo
2017-09-25 20:59:43変更をどのぐらいのスピードでデプロイすべきか?理想的には全部同時にだけど、それはリスクがある。そのスピードもエラーバジェットをベースにして判断したらいい? #sretokyo
2017-09-25 20:55:57@yanoken_tus 外れ値が要約値を汚染しちゃう様な時によく登場しますね。平均をやめて中央値を使う時、みたいな。 #SRETokyo
2017-09-25 20:52:25可用性と実時間の対応関係、本の表が見やすいですね #SRETokyo landing.google.com/sre/book/chapt…
2017-09-25 20:52:13可用性とは? →99.9%の成功率 →成功とは? →正しいGETリクエスト、5分の間、Regionごとに #SRETokyo
2017-09-25 20:51:00GETはすぐにリロードとかでリクエストし直せるが POSTはもっとユーザにとってコストがかかるので 別で考える,へんなリクエストあるので"Validに限る". SLO 99.9 success rate for valid GET requests #SRETokyo
2017-09-25 20:49:33pagerの説明が流れてきてジェネレーションのギャップを今日も感じる #sretokyo
2017-09-25 20:49:06<SLOの例> 99.99%の可用性 過去90日 スライディングウィンドウ 可用性の定義が必要。 #SRETokyo
2017-09-25 20:47:03@freddiefujiwara #SRETokyo 澤田さんのスライドに少し出てましたが、継続的に計測可能で、ユーザー体験をうまく表現できて、できれば数は少ない方がいい、みたいな感じだったかと。
2017-09-25 20:47:01@newsons_nybbles がerror budgetの話をしてくれてます #sretokyo pic.twitter.com/NrDBW3TPE4
2017-09-25 20:46:11@SawadaTakeo SLOが達成できずリリースをフリーズした時に開発は進むので後でまとめてリリースされて信頼性が落ちるデメリットが有るという話ですが、開発者はテストを厚くするとか信頼性向上のための作業には参加されないのでしょうか? #SRETokyo
2017-09-25 20:46:11QAもQCDのAgreement必要だと思うがどうやって 決めるのがいいのか というかSREのSLIってどうやって決めてるんだろ #SRETokyo
2017-09-25 20:44:24pager、おそらく、ポケベルだと思います、beeperやpagerと呼ばれ、初期は鳴ったら指定の電話番号に連絡するという運用だったはず。 お医者さんとか、緊急時に連絡を受ける人が限られていた時代です。 #SRETokyo
2017-09-25 20:41:35SRE本は値段が高いので買うのを躊躇していたけど、これは読んでおいた方がよさそうだなぁ… #SRETokyo
2017-09-25 20:40:51