.@_hito_ さんのRAIDカードのこわい話を聞こう

25
hito @_hito_

RAIDカードのこわい話をしよう。

2012-09-29 19:57:50
hito @_hito_

RAID HBAのたぐいには、メーカーの事情でいろんな機能が搭載されたりする。ServeRAIDとかいう名前のアレには、「一度こわれたHDDのシリアルを記憶する」とゆー機能が搭載されたことがあった。

2012-09-29 19:58:25
hito @_hito_

しかし保守部門にはそーいう事情は知らされていなかったので、HDD壊れる→修理する→同じシリアルのものが同じ客先に出て、偶然おなじマシンにあたる→なにをどうしよーとも認識されねー、という呪いのイベントが生じたことがあった、らしい。人から聞いた話ということにしておく!

2012-09-29 20:00:08
hito @_hito_

また別の話。RAIDカードそのものにhot swap/auto rebuildが搭載されているにも関わらず、搭載するバックプレーンにSAF-TEがついていなかったので、完全に宝の持ち腐れ、みたいなブツがしばしば搭載されている。

2012-09-29 20:01:26
hito @_hito_

しかし最大の恐怖は、「すいませんこのエンクロージャはSAF-TE対応してますか」と保守部門に問い合わせると、「ナンデスカソレハ」という回答が返ってくることだ。

2012-09-29 20:01:55
hito @_hito_

また別の話。仮にCG社とでもしよう。CG社のHDDはロット単位での変な当たり外れが激しくて、「壊れたHDDのシリアルを見たら、どう見ても連番」みたいなことが良くある。

2012-09-29 20:03:55
hito @_hito_

いまいちなサーバーベンダーが調達した場合、同型番・同ロットでRAID1とかRAID6が組まれていることが良くある。このCG社のブツに当たった場合、何が起きるかとゆーと以下略な事態なわけだ。

2012-09-29 20:04:50
hito @_hito_

しかし真の恐怖は、「同時期にサーバーをたくさん調達すると、全部そーいう構成」ということで、なんつーかvolume faultが山のように生じることがある。

2012-09-29 20:05:21
hito @_hito_

だいたい保守部門とか営業部門がマヂで切れて生産部門を叩きなおして、そーいう生産が生じないよーにするわけだけど、外資系だと、生産部門のトップが変わるたびにもとに戻る。

2012-09-29 20:06:03
hito @_hito_

生産部門のVPが変わった直後は注意だ! やばいぞ!

2012-09-29 20:06:39
hito @_hito_

RAID用外付けエンクロージャは、ポートマルチプライヤ経由でたくさんのHDDが接続されることが多い。そして、特定のポートマルチプライヤの不良ステートに、「接続されているHDDの応答が来るまで待ってしまう」なんてのが存在してたりする。

2012-09-29 20:11:12
hito @_hito_

この構成でなにが起きるかっつーと、「HDDが一台死ぬと全HDDへのアクセスが死亡」である。

2012-09-29 20:11:36
hito @_hito_

台湾系の外付けRAIDの実装には、「SATAコマンドを複数ストリームに流すだけ」とゆー怖いRAID1実装が存在する。矛盾起きないのかなーと思って聞いたら、「ああ、ソースディスクにあるデータをディスティネーションにコピーするから大丈夫」とか言われた。

2012-09-29 20:15:49
hito @_hito_

……それ、ソースディスクにちゃんとデータが書かれていることはどうやって保証するんだろう、とか思ったものの、とりあえず面倒くさかったのでスルーしておいた。

2012-09-29 20:16:20
hito @_hito_

あと、そのチップにはbad block scrub的なものがついてなかった気がする。どうやってデータの完全性保証する気だ。

2012-09-29 20:17:16
hito @_hito_

とりあえずこんなもんで。もっと洒落にならない話は直接聞いてください。

2012-09-29 20:21:35
hito @_hito_

とりあえずこんなもんで。もっと洒落にならない話は直接聞いてください。

2012-09-29 20:21:35
羽月 @hanetsuki_y

そういえば某氏がddとfdiskは危険だから安易に勧めるべきではないと書いていたが、ddの代わりってなにがあるんだろう。

2012-09-29 20:32:40
hito @_hito_

@hanetsuki_y ddが必要な時点ではdd使うしかないっす。でもdd使わなくてもいいケースでddするのはアウト。

2012-09-29 20:34:17
MUROTA @reservoir

@_hito_ いまいちなサーバーベンダーと台湾系の外付けRAIDの組み合わせ怖い! と書きかけて液晶が滲んできました………

2012-09-29 21:49:30
hito @_hito_

@reservoir 大丈夫、Infortrendは入ってませんよ! もっと安いやつです!

2012-09-29 21:50:23