更新後の目標。以下のような点の向上 - データ保護・安全性 - サービス継続性 - サービスメニューの多様化 #gfarm2016
2016-12-09 16:35:57反省事項: silent data corruption によるデータ消失 → digest 整合性チェック体制を確立し、2週間以内にユーザー通知可能な体制の確立 → データ完全性チェックの自動化 #gfarm2016
2016-12-09 16:39:20初期の方が稼働率が高かった。 AICSの最初の3年は電源停止がなかった。ところが漏電のための全館ダウン発生し、2015年以降、年に一度設備点検することになった。 2013年、サーバが勝手にリブートする問題があった。(当初は原因不明だったがOSの問題だった) #gfarm2016
2016-12-09 16:47:572015年は設備点検や、silent data corruption 対策での整合性検査で停止が特に多かった。 #gfarm2016
2016-12-09 16:52:48現在の設備は、需要に対する資源の不足から完全二重化は途中でやめた。 次世代で完全二重化すると、これまでの停止ノード時間の81%、グラフの青い部分はサービス提供可能に #gfarm2016 pic.twitter.com/MYPgZnShlZ
2016-12-09 16:58:11現在の設備は、需要に対する資源の不足から完全二重化は途中でやめた。 次世代で完全二重化すると、これまでの停止ノード時間の81%、グラフの青い部分はサービス提供可能に #gfarm2016 pic.twitter.com/CTPGSKi8kQ
2016-12-09 17:00:28HPCI共用ストレージ新旧機材間のデータ移行も、なるべくサービスを継続したまま行なう方向で現在、検討中 #gfarm2016
2016-12-09 17:02:26クラウドの活用 HPCI共用ストレージとしてのサービス提供に、商用クラウドを利用できる部分があるか。 2017年度にサーベイを予定 #gfarm2016
2016-12-09 17:03:47@n_soda gfarm2016実況ありがとうございました。ストレージサービスの運用はやはり大変ですね。
2016-12-09 17:19:07