『止まらないシステムはないです。東証は1日止まりました』ITエンジニアが説明に使えるワードとして注目される「ありがとう。いい前例です」
上司『このシステムは止まらない?』 僕『止まらないシステムはないです。AWS、Google、Microsoft、東証、これらシステムも止まりました。いくらお金、人件費をかけても止まる時は止まります。ただ復旧に掛かる時間は最善します。ちなみに東証は1日止まりました。』 これで僕は1日の猶予を貰った。
2020-10-01 17:50:53「止まらないシステムはない」 当たり前のことなのだが、これをしばしば忘れがちなのだ。 twitter.com/taka29009/stat…
2020-10-02 20:20:11これは良い!話題になった事例があると説得が楽。 経営層なら絶対興味ある案件だったはずだし。 twitter.com/taka29009/stat…
2020-10-02 09:22:54「止まない雨はない」とかより1000000000000倍役に立つ言葉 twitter.com/taka29009/stat…
2020-10-02 12:39:27ありがとう。いい前例です
止まらないシステムを作るには動かすな
世の中の多くのシステム障害は、ワーストケースを回避したくて、あえて停止させたパターンも多いのなあ。 止まらないシステムって、凄い台風でも運転を続けるK急とかN日本鉄道とかと同じようなやばさがある。 twitter.com/taka29009/stat…
2020-10-02 12:43:01大手のクラウドでも基幹のミッションクリティカルなオンプレシステムでも止まる時は止まるよね。絶対に止まらないシステムなんて存在しない。無いものに時間と労力とお金を使うのはやめて止まる前提で業務とアーキテクチャを見直そう。何年も止まらないシステムは、当たり前じゃない。運が良いだけ。
2020-10-01 14:53:11止まったときの対応について
僕もよく言うやつ あと「避難訓練をするように、システム停止時の運用訓練も必要です」とも言ってる twitter.com/taka29009/stat…
2020-10-02 08:02:13@taka29009 無能SE「はい!わかりました!再起動して動かしますね〜!!」 →取引履歴が消滅 →顧客の財産が消滅 →損害賠償請求数億円
2020-10-02 12:57:42東証が1日貰った理由は基幹システムのアローヘッドを構成する300台以上のサーバを全て再起動するためなので、サーバ台数によっては1日かかる理由を詰められたら難しいかもしれない twitter.com/taka29009/stat…
2020-10-02 02:48:41ミッションクリティカルなシステムだから1日であって、そこまでのお手当をしていないシステムであれば数日、下手すると週間単位で復旧に時間が掛かる事なんてあるよね。作り直した方がましなケースとか。 twitter.com/taka29009/stat…
2020-10-02 17:03:30@Hatutuki_eno このようなシステムだと検証環境があってそっちで入念にテストしている気がします。本番環境を止めてのテストはなかなかできないと思いますので。
2020-10-02 12:31:44