RAID HBAのたぐいには、メーカーの事情でいろんな機能が搭載されたりする。ServeRAIDとかいう名前のアレには、「一度こわれたHDDのシリアルを記憶する」とゆー機能が搭載されたことがあった。
2012-09-29 19:58:25しかし保守部門にはそーいう事情は知らされていなかったので、HDD壊れる→修理する→同じシリアルのものが同じ客先に出て、偶然おなじマシンにあたる→なにをどうしよーとも認識されねー、という呪いのイベントが生じたことがあった、らしい。人から聞いた話ということにしておく!
2012-09-29 20:00:08また別の話。RAIDカードそのものにhot swap/auto rebuildが搭載されているにも関わらず、搭載するバックプレーンにSAF-TEがついていなかったので、完全に宝の持ち腐れ、みたいなブツがしばしば搭載されている。
2012-09-29 20:01:26しかし最大の恐怖は、「すいませんこのエンクロージャはSAF-TE対応してますか」と保守部門に問い合わせると、「ナンデスカソレハ」という回答が返ってくることだ。
2012-09-29 20:01:55また別の話。仮にCG社とでもしよう。CG社のHDDはロット単位での変な当たり外れが激しくて、「壊れたHDDのシリアルを見たら、どう見ても連番」みたいなことが良くある。
2012-09-29 20:03:55いまいちなサーバーベンダーが調達した場合、同型番・同ロットでRAID1とかRAID6が組まれていることが良くある。このCG社のブツに当たった場合、何が起きるかとゆーと以下略な事態なわけだ。
2012-09-29 20:04:50しかし真の恐怖は、「同時期にサーバーをたくさん調達すると、全部そーいう構成」ということで、なんつーかvolume faultが山のように生じることがある。
2012-09-29 20:05:21だいたい保守部門とか営業部門がマヂで切れて生産部門を叩きなおして、そーいう生産が生じないよーにするわけだけど、外資系だと、生産部門のトップが変わるたびにもとに戻る。
2012-09-29 20:06:03RAID用外付けエンクロージャは、ポートマルチプライヤ経由でたくさんのHDDが接続されることが多い。そして、特定のポートマルチプライヤの不良ステートに、「接続されているHDDの応答が来るまで待ってしまう」なんてのが存在してたりする。
2012-09-29 20:11:12台湾系の外付けRAIDの実装には、「SATAコマンドを複数ストリームに流すだけ」とゆー怖いRAID1実装が存在する。矛盾起きないのかなーと思って聞いたら、「ああ、ソースディスクにあるデータをディスティネーションにコピーするから大丈夫」とか言われた。
2012-09-29 20:15:49……それ、ソースディスクにちゃんとデータが書かれていることはどうやって保証するんだろう、とか思ったものの、とりあえず面倒くさかったのでスルーしておいた。
2012-09-29 20:16:20@_hito_ いまいちなサーバーベンダーと台湾系の外付けRAIDの組み合わせ怖い! と書きかけて液晶が滲んできました………
2012-09-29 21:49:30