コンピュータで「移行」とか「ハードウエア増設」とかやっていると「それを実現するためにはこれを先にしとかなければいけない」なんて事項が顕在化する。 で最終的ゴールは遠くなる。 「新たな障害の発生」もそんなことの一つ。... facebook.com/yasumaro/posts…
2019-04-27 00:19:04コンピュータで「移行」とか「ハードウエア増設」とかやっていると「それを実現するためにはこれを先にしとかなければいけない」なんて事項が顕在化する。 で最終的ゴールは遠くなる。 「新たな障害の発生」もそんなことの一つ。
2020-04-27 15:13:35現在使用しているディスクアレイの筐体は2TBのHDDまでしか認識しない。先日後継機種の「3TBも認識するモデル」を手に入れた。2TBのHDDから3TBに乗り換えればHDD数を減らせる。2TBモデルも3TBモデルもドライブ1台当たりの消費電力はそんなに変わらない。
2020-04-27 15:13:362TB × 11台 でRAID6 + ホットスワップ2台をすると 16TB利用できるけれど、 3TB HDDなら15TB のRAID6 + ホットスワップ2台を9台のHDDで実現できる。 2台のドライブの消費電力がセーブできるのなら初期投資=購入価格の差も運用コストがいつか抜く。
2020-04-27 15:13:36そんなことを考えながらRAIDカードを複数手配して、既存設備と干渉しないか、とか、中古手配だけれどちゃんと動くか、など評価試験をしていた。そんな最中に既存のRAIDアレイの一つで警報がでた。 pic.twitter.com/6eYhk1fq8R
2020-04-27 15:13:37こちらのRAIDアレイは750GB × 6台で、RAID5 + ホットスワップ1台を構成している。 その中の一台のドライブが故障したらしい。ホットスワップが直ちに代わって動きRAID5そのものは稼働中。 ホットスワップを用意していなかったら、RAID5の冗長なし、になっていただろう。 pic.twitter.com/xPRn5yTHnp
2020-04-27 15:13:38RAID5の冗長なし状態は「次にドライブが壊れるとデータを失う」「現在はライトスルーで書込みするからいつもより遅い」。それは歓迎しない。 でコンピュータを停止して障害の出ているディスクを交換し、その故障ディスクを作業PCで故障具合を調べてみた。 pic.twitter.com/jxaoKVRcsd
2020-04-27 15:13:39不良セクタが出ていてデータの書き込み読み出しができないところがあるようだ。 Scanned data : 715118 MB Damaged Blocks : 0.1 % Elapsed Time : 488:01 pic.twitter.com/gJorylo4LB
2020-04-27 15:13:40エラーの出たドライブは2011年に6台まとめて購入した。(2010年1月製) ロットも一緒。サーバで24時間365日動かして2013年に1台壊れ交換、今回が二度目。で他の5台を調べたら2010年のもの2台と2013年のものが「異状なし」で2010年のもの2台に「注意」が出た。 pic.twitter.com/Niylq28G7f
2020-04-27 15:13:41全て一緒に9年動かしたのだから、今大丈夫な3台のうち2010年ものも近いうちにエラーを出すだろう。 2TB のSASディスクを6台用意することにした。 pic.twitter.com/lJo25nztDs
2020-04-27 15:13:41