ストレージのよもやま話

ストレージについて語らせていただいたこと、教えていただいたことをまとめました。
2
satsukimasu @satsukimasu

EMサーバでブロケードスイッチやZFSストレージなどexadataとセットで導入されるインフラは管理出来るようにして頂きたいです。 #OracleTechNight

2018-01-17 20:12:45
gonsuke777 @ora_gonsuke777

@satsukimasu ZFS は Enterprise Manager ZFS Plug-in で出来るはずでっせ!彡(゚)(゚) oracle.com/technetwork/oe…

2018-01-17 20:17:22
ごごてぃ @gogotea3

RAIDはハードのバックアップであってデータのバックアップではないというのがなかなか広まらないな・・・

2018-02-10 12:05:24
Takeshi HASEGAWA @hasegaw

金融系のシステムは事故おきると金融庁への報告案件になるんだろうし、システム企画する人も稼働中の責任24時間とれるわけじゃないので、細かなサブシステムもオペレータは手順書対応なのでリスク排除のためなら多少金で殴ってでも同機能のサーバ複数配置やRAIDレベルもリスク低い方に倒すイメージ

2018-02-11 09:55:23
Hisao Tsujimura @hisaotsu

某社大変な思いをされたようですが、古い記事を置いておきます。 あなたのデータが消える時 oeob.sakura.ne.jp/blog/2015/10/2…あなたのデータが消えるとき/

2018-02-11 10:45:50
Hisao Tsujimura @hisaotsu

解析にはこちらがお役にたつかも。 ディスクの障害の追いかけ方 oeob.sakura.ne.jp/blog/2016/05/1…

2018-02-11 10:45:51
Hisao Tsujimura @hisaotsu

昔話になってしまうけど、同僚とは 1TB を超える辺りから、障害が発生した時に、データ再構築中に二次障害が起きる確率について話していました。そろそろ、RAID5 では怖いよね、と。そこで RAID6 もしくは、RAID10 推しだったわけですが、10TB が聞こえてくる中で、また再検討する時期なのかも。

2018-02-11 10:45:52
Hisao Tsujimura @hisaotsu

SSD でも HDD でも、再構築の速度が十分速くないと、再構築中に他の障害に出会ってしまう。感覚では 1TB を超える頃から条件は厳しかった。だからRAID6 や、RAID-Z2で切り抜けた。

2018-02-11 10:45:52
Hisao Tsujimura @hisaotsu

ストレージ側から物を言うと、「使わないディスクの障害はわからないから、ちゃんとメディアスキャンとかスクラブしてね」と申し上げたい。性能が落ちるからとメンテナンスせず、障害が起きてからミラーの両面で障害発覚、データロスというケースも見ているので。

2018-02-11 10:45:52
Hisao Tsujimura @hisaotsu

なんにしてもバックアップは大切、と言うお話でした。

2018-02-11 10:45:53
ごごてぃ @gogotea3

ローカルディスクでのRAIDで、RAID-10ってディスク無限に追加できるわけじゃないから、結構めんどくさいぞ。 LSI系だと8セット以上構成できないから、うかつに以下略

2018-02-11 12:00:14
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 弊社製品で言えば、ZFSはトリプルミラーが使えます。3面のミラーと言うことです。通常利用で、ちゃんと定期的に検査をしていただければ、実用にならないほどではないです。弊社内でもトリプルミラーを使っていますが、こちらは、ちょっと特殊な使い方です。

2018-02-11 17:50:42
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 1面切り離して、バックアップに使う使い方で、他に見かけたこともありませんし、推奨しているのを聞いたことはありません。(コスト的に高くつきますし)

2018-02-11 17:52:05
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 パリティを使う RAIDですと、RAID6相当まで準備されているのが普通で、ホットスペアなしでも、パリティが2本あるので、2本まで障害になってもデータの一貫性は担保できるようになっています。この組み方はスピードが遅くなりがちなので、実際には、RAID6を複数組んでストライプしたりします。

2018-02-11 17:54:54
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 RAID−5、RAID-6は数学的にはガロア体をベースにしているのですが、パリティディスクが増えると、たぶん計算量が増えて、性能影響が出ます。(ASICにでもすれば良いのでしょうが、実装が柔らかい間はちょっと)

2018-02-11 17:57:51
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 余談ですが、DVDなどお符号訂正に使われるリード・ソロモンなどもガロア体が背景にあるそうです。

2018-02-11 17:58:56
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 データの再構築については色々研究されています(大人の事情で詳細は省きます。)耐障害性を考えればおっしゃるとおりハードウェアを分けるべきですが、結局最後はコスト見合いと言うことです。データがアクセスできないと言うことでどれ位ビジネスに影響があるかを元に考えられるのが理想ですね。

2018-02-11 18:01:49
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 某 E社さんとか HD 社さんとか D 社さんとか P 社さんの経験談も聞いてみたいです。

2018-02-11 18:28:39
Hisao Tsujimura @hisaotsu

@ora_gonsuke777 色々難しいのもわかっていますが、最後の最後に、私に「物理の法則には逆らえない」と言わせないでください、とお願いしておきます。(チューニングでどうにもならない場合もあるんです、実際。)

2018-02-11 18:44:20
ごごてぃ @gogotea3

作れるよ 動くよ 動かし続けるよ は全然別

2018-02-25 17:34:14
Hisao Tsujimura @hisaotsu

RAID はピースオーダーあるからね……。

2018-03-09 21:38:11
Hisao Tsujimura @hisaotsu

「スラブ荷重計算しろっていったよね?」とかは老害のセリフになるのかな……床抜けても知らんぞ。

2018-03-10 19:14:56
Hisao Tsujimura @hisaotsu

個人的には某弊社の製品が UTC でログを取ってるのは各国のDSTがバラバラにはじまるせいだと思っている。

2018-03-28 23:24:12
Hisao Tsujimura @hisaotsu

ZFS Version 5 って、プールのバージョンなのかな? (OpenZFS ページを見ろと言われそう)#freebsdworkshop

2018-03-30 19:28:02
Hisao Tsujimura @hisaotsu

エンディアンのおはなし、興味深かったです。ZFS も内部でエンディアンの操作をしているところがあります。 #freebsdworkshop

2018-03-30 20:02:59