【新機能】作り忘れたまとめはありませんか?31日前まで期間指定してまとめが作れる高度な検索ができました。有料APIだからツイートの漏れはありません!
59
ログインして広告を非表示にする
動物 @mkhyt 2017-07-26 03:45:44
停電したああああああああああああああ
Yusuke Oda @odashi_t 2017-07-26 03:58:05
実験データ飛んだかも
動物 @mkhyt 2017-07-26 03:59:09
小規模計算機サーバで回してた計算はお亡くなりになった
動物 @mkhyt 2017-07-26 04:06:30
ほぼ大学の敷地内に落ちてたっぽい pic.twitter.com/llH2TvBK95
 拡大
Yusuke Oda @odashi_t 2017-07-26 04:07:40
実験データが飛んだので論文が遅れます
Yusuke Oda @odashi_t 2017-07-26 04:22:03
論文のデータが死んで_(:3 」∠ )_になってる
丸の内電気鼠(アローラのすがた) @caesar_wanya 2017-07-26 09:22:16
各研究室の教員が続々とサーバ室に集結している
Yusuke Oda @odashi_t 2017-07-26 14:05:52
データサーバがやられたらしい。
Yusuke Oda @odashi_t 2017-07-26 14:30:34
最近GPU回してやった実験が全部とんでる。ジャーナル終わった
Yusuke Oda @odashi_t 2017-07-26 14:41:37
学会にお詫びメール書いてる
Yusuke Oda @odashi_t 2017-07-26 15:03:17
思った以上に深刻だった(他の学生の報告) pic.twitter.com/8sgecJ3wOu
 拡大
Yusuke Oda @odashi_t 2017-07-26 15:10:13
投稿していたジャーナルは諦めて(もう一回実験しなおして、最悪再投稿)別の実験します。
Yusuke Oda @odashi_t 2017-07-26 15:20:40
涙も出てこないけど、とりあえず1000GPU時間返してほしい
Yusuke Oda @odashi_t 2017-07-26 15:22:26
1000で済まない気がする…
Yusuke Oda @odashi_t 2017-07-26 15:23:22
僕の論文はいいが、1000時間超GPUを動かした電気代はパアだな
Yusuke Oda @odashi_t 2017-07-26 15:34:48
今「復旧の目処が分からず、最悪2か月のデータが飛びます」と学会に報告したんだけど、メール送った後のタイミングでピカチュウ先生から「完全消滅です」という報告を貰いました。ありがとうございます。
丸の内電気鼠(アローラのすがた) @caesar_wanya 2017-07-26 15:39:42
ここ数年で一番のつらみかもしれない(ディスクが壊れて交換後RAID再構築中のサーバが雷で落ちてデータが2か月分飛んだ)
Yusuke Oda @odashi_t 2017-07-26 15:44:10
NAIST5年目にして一番やる気なくした。
丸の内電気鼠(アローラのすがた) @caesar_wanya 2017-07-26 15:45:20
RAIDは運用の冗長化であってバックアップとしては役に立たないというのがよくわかるな
残りを読む(9)

コメント

そむにうむ☆めぐるーまー@森山弘樹 夏コミ金曜西れ07b VTuberフィギュア化PJ推進中 @Somnium 2017-07-26 16:58:10
NAISTと聞くとナイトストライカーをつい思い出してしまいます。(^^;)
あっきぃ。@いろいろつぶやくやつ @akkiy_ya 2017-07-26 17:21:55
落ちた場所がとてもよろしくない・・・。
toge365 @toge365 2017-07-26 17:40:34
奈良やったんか。いずれにしても、日本弱すぎ。使えん。
空缶 @AkikanPHP 2017-07-27 06:26:58
わーお。出社したらバックアップ確認しよう。
Tadahiro Ishisaka @ishisaka 2017-07-27 06:57:04
そもそもなんでUPS付いていないの?
Tadahiro Ishisaka @ishisaka 2017-07-27 06:57:38
マーフィーの法則じゃなくて、単純にやることをやっていない。
Ikunao Sugiyama @Dursan 2017-07-27 07:16:27
鹿がケーブルをかじったのかと思った
SAKURA87@多摩丙丁督 @Sakura87_net 2017-07-27 07:26:53
どんなに対策しても止まるときは止まるし、UPSだって万能じゃないわけだから…。
Earwax @Earwax97409510 2017-07-27 08:28:47
ホームユースだと割と万能感有りますよね>UPS。 運用ミスというかぶら下げ過ぎを放置してたんじゃないかと思ったけどどうだろう。UPS自体がイカれてたとしたらそれはそれで地獄
親知らず @Boeq 2017-07-27 08:29:09
毎日テープドライブにバックアップが大正義やね
Earwax @Earwax97409510 2017-07-27 08:32:37
バックアップ方式もコストとの兼ね合いですよ。こんなに手間と容量食うなら2ヶ月分くらいスパッと諦める!という選択も採る時は採ります。 # その実務担当者の徒労感はパネェですが
権中納言明淳 @mtoaki 2017-07-27 08:39:14
そりゃまぁ好きに金と人が使えるなら割と理想に近いこともできるだろうけど、コストは青天井だし正常に動いてるうちは全く意味ないしなかなか難しかろう。出来る事はやってたけど運が悪かった。のでは。
BABA Motoharu @calc3 2017-07-27 09:07:44
RAID再構築中に落雷で停電してディスク死亡…
アルビレオ@炙りカルビ @albireo_B 2017-07-27 09:27:28
UPSは基本的に「停電時などでも稼動させておく」であって「それまでのデータが飛ばないようにする」ならバックアップ。データさえ残れば稼動の維持は必須ではない。この場合だとUPSでも効果はあったろうけどそれは結果論。まとめ内に「RAIDはバックアップのかわりにはならない」という話があるように、UPSもバックアップのかわりにはなりません
権中納言明淳 @mtoaki 2017-07-27 09:40:25
UPSも「安全にシャットダウンするための数分の猶予」が担保されるだけだし、RAID再構築中に作業をキャンセルして安全にシャットダウンできたかどうかはよくわからないな。
let's skeptic @lets_skeptic 2017-07-27 10:47:02
データ保全のためにはUPSでもRAIDでもなく、物理的な別媒体(そこらで売ってるUSB接続のHDDでもいい)へのバックアップをしましょうということです。
bun🍃 @bun3559 2017-07-27 11:28:51
UPSの目的は停電(瞬停)対策。雷対策になるわけない。RAIDはストレージ故障でシステム停止したくないものに使うのが目的で(システム稼働の冗長性の確保が目的)、データ保全が目的じゃない。そしてバックアップは、24時間以内に前日の状態に戻せればよしとすべき。
むつぎはじめ @Six_D 2017-07-27 11:35:08
なんだか知らんが胃が痛くなる話
上原 哲太郎/Tetsu. Uehara @tetsutalow 2017-07-27 12:40:47
UPSあったってなぁ、雷のサージでコントローラごと飛ぶことがあるんやで!(経験者)
琥珀@沼に落とされまくる @amber_violane 2017-07-27 12:43:35
怪談物語やめーや。背筋が凍るなんてレベルじゃねーよ
すぎむら45 @SugiTK 2017-07-27 12:51:39
お気の毒だ。。山奥だからなぁ。避雷針とかいろんな対策はあると思うんだけど、なんでもかんでも避けられるということではないんだね。
jpnemp @jpnemp 2017-07-27 13:43:51
albireo_B UPSは「停電時にシャットダウンまでの時間を稼ぐもの」であって、そのまま稼動させておくことは考えちゃダメですよー。今回の場合だと長時間(と言っても数分程度)の停電時には自動でシャットダウンする仕組みにしておけば、計算中のデータは破棄されても、少なくともRAIDのリビルドに失敗することはなかったはず(コントローラーごと吹っ飛んだらダメですが)。もちろんバックアップが一番大事なのはその通りですね……(自戒)
ayaqui@キュニコス派 @aya_qui 2017-07-27 14:00:30
バックアップは同じ場所にあったらダメです遠隔にしましょう、RAIDはバックアップじゃありません両方壊れる事ありますと言ってもなぜかRAIDに操を立てる人が多いんだよなあ。
fukkén GO @fukken 2017-07-27 18:56:15
RAID組んでたら慢心する気持ちは分からんでもないし、「バックアップしとくべきだった」なんて当人も言われる前から承知しているのだから、別にみんなで追撃しなくとも。人事を尽くしたとは言い難いが、相当な不運であった事は確かだし、まぁご愁傷様です。
Aki @Aki_8ara 2017-07-27 19:30:26
キャンパス内に落雷か。。直撃は火を噴かなかっただけマシな世界だからなあ。
統一教会の星 @cpw73XfxIvDa3X 2017-07-27 19:43:58
これが日本の最先端科学技術www
丸の内電気鼠(アローラのすがた) @caesar_wanya 2017-07-27 20:43:53
なんかバズってるようなので正しい情報を補足しますが、基盤システムは問題なく1研究室が運用している実験サーバ用ストレージが飛んだという話です。UPSは付いていましたが停電期間が長かったのでRAIDのリビルドが終わるのに足らず、結果として取ってあった2ヶ月前のスナップショットに戻ったということです
× 日本が好きだ。 @cv45ValleyForge 2017-07-27 22:05:56
毎日のバックアップも出来ないような大容量研究データって想像が付かない。
× 日本が好きだ。 @cv45ValleyForge 2017-07-27 22:06:02
毎日のバックアップも出来ないような無能研究員なら容易に想像が付く。
repunit @FlatSharp 2017-07-27 22:13:49
クラークの三法則思い出すのと、UPSの容量選定は正しかったのかと言う疑問が
ゆんま@PUB爺 @_yunma 2017-07-28 00:07:03
ナイトストライカー……は置いといて、ビリビリガードの電源タップにUPSでも駄目となると、こういった事態に備えて非常用発電設備を大学側に提案するしかないだろうなぁ……。 証券会社とかだとビル施設とは別に独自で非常用発電設備を用意してたりするし。
アルビレオ@炙りカルビ @albireo_B 2017-07-28 01:11:14
_yunma 大学内でも計算機センターのような施設ならともかく、研究室レベルで個別運用しているサーバーまでカバーする非常電源というのは非現実的だと思います
_ @wholescape 2017-07-28 13:15:46
奈良先端大が出来た1990年代ならともかく、今の時代だと計算サーバを研究室単位で動かすのは不意の電源断等による際の損失を考えると非現実的、と表現することも出来るのではないでしょうか。計算機センター側でデータセンターハウジング的な事(冷却と電源の集中管理)をしたほうがよいのでは…
tanaka @tanaka_jeonjung 2017-08-01 22:08:44
なんだ、一研究室の話か。

カテゴリーからまとめを探す

「システム管理・運用」に関連するカテゴリー

ログインして広告を非表示にする
ログインして広告を非表示にする