KDDIで発生した通信サービスの障害はなぜ起きたのか

509
au @au_official

(7/3 12時現在) 長時間にわたりau携帯電話サービスがご利用しづらい事象が発生し、深くお詫び申し上げます。 news.kddi.com/important/news… 西日本エリアは11時頃に復旧作業終了、東日本エリアは17:30ごろに復旧作業終了予定です。ネットワーク試験の検証のうえで、本格再開時間を決定いたします。

2022-07-03 12:16:48
リンク news.kddi.com (7月3日 12時00分現在)au携帯電話サービスがご利用しづらい状況について KDDIのお知らせ一覧 (7月3日 12時00分現在)au携帯電話サービスがご利用しづらい状況について 2 users 147

通信障害が起こった経緯、KDDIへの質疑応答など

Munechika Nishida @mnishi41

西田宗千佳、フリーライター/ジャーナリスト。連絡はhttps://t.co/G3UTsqfenK もしくはSNS経由で。 小寺信良氏とメルマガ発行中。 https://t.co/McrLg4xnuV note版 https://t.co/blOm7qEpjV

https://t.co/jDZUs4PW1t

Munechika Nishida @mnishi41

髙橋社長:「輻輳制御をやりながらネットワークを起こして行くので、徐々に上げていく。「徐々に行なっていきます」という表現になる。

2022-07-03 11:29:01
Munechika Nishida @mnishi41

西日本エリア11時、というのは「作業は終わっている」が、そこからチェックしていって全体回復、という話になる……と。

2022-07-03 11:30:44
Munechika Nishida @mnishi41

なぜじんわり戻るのか、それがどういうことか、という理解を広げるのが重要、ということか。

2022-07-03 11:31:18
Munechika Nishida @mnishi41

Q:緊急通報ができないことは人命にも関わる。経営責任は? A:対応が優先。(そりゃそうよね)

2022-07-03 11:33:08
Munechika Nishida @mnishi41

緊急通報ができなかった問題はある。それは大きな課題だと思うが。

2022-07-03 11:34:42
Munechika Nishida @mnishi41

「輻輳を対応しながらサーバーを立ち上げるのが大変なのは理解している。ドコモの事例からも理解している。それを活かした設計を見直している。検証した上だが、そこがカバーできなかったのは、まだまだ甘いのではないか、と言われればその通り」

2022-07-03 11:37:35
Munechika Nishida @mnishi41

(やっぱり難しい課題だよね。いかにエスカレーションしないようにするかは……)

2022-07-03 11:38:03
Munechika Nishida @mnishi41

髙橋社長:「iPhoneとAndroidで症状が違っていた。iPhoneはデータが流れていた。Androidは機種によって違うが、音声が止まるとデータも止める仕様なので、繋がらない状況に」

2022-07-03 11:45:11
Munechika Nishida @mnishi41

業務用も個人むけと同じステータスで回復中、と。

2022-07-03 11:54:37
Munechika Nishida @mnishi41

髙橋社長:「楽天の話、VoLTEの交換機を別に構えているので、そこで影響が出たことはない。ただし輻輳制御でのトラフィック制限の影響は出て、楽天にご迷惑をおかけしている」

2022-07-03 12:02:08
リンク www.ntt.com 輻輳(ふくそう)とは?意味・定義 | ITトレンド用語 ||NTTコミュニケーションズ このページでは、「輻輳(ふくそう)」について解説しています。ITトレンド用語では、意外と知らないIT用語を中心に解説します。用語に関連するITソリューションも紹介中です! 5 users 56

VoLTE交換機での輻輳の発生について

V @voluntas

まとめ。ルーターの交換したが設定がおそらく間違っていた。それによりVoLTE 交換機での輻輳が発生した。輻輳が発生すると利用者側からの再送要求が行われる。それの影響で加入者データベースにも輻輳が発生した。その影響で加入者データベースと VoLTE 交換機でのデータの不一致が発生した。地獄だ。

2022-07-03 12:50:04
V @voluntas

iPhone は音声が繋がらなくてもデータは繋がる、Android は音声が繋がらないとデータが繋がらない端末もある。それとは別に輻輳制御を行ったため接続しづらくなった。トリガーはルーター交換による設定ミス(の可能性)輻輳発生。

2022-07-03 12:51:16
V @voluntas

時系列を見ると問題に気付いたタイミングが 1:50 で 2:00 には社長には連絡が言ってたとのことなので、エスカレーションは的確に行われていたし、むしろおかしいレベルで早いので現場判断がすごい。

2022-07-03 12:52:47
1 ・・ 4 次へ