Gfarmシンポジウム2014

3
SODA Noriyuki @n_soda

Zabbix の監視がホスト単位であるため、数十台のgfsdを監視すると、この監視のための処理を起因に、gfmdへの大量アクセスが発生。 #gfarm2014

2014-12-16 15:33:40
SODA Noriyuki @n_soda

gfarm-zabbix 2.0: テンプレート「Gfarm代表クライアント」を導入して解決。サーバー監視は、全ホストから行なうのではなく、代表クライアントに基本的に集約。アクセス数もアラートメールの数も減る #gfarm2014

2014-12-16 15:34:40
SODA Noriyuki @n_soda

Gfarm Zabbixテンプレートは、Zabbixに同梱されているものと同じ。gfarm-zabbixパッケージ内で必要なテンプレートを完結させるために用意。Gfarm commonテンプレートは、Zabbixに同梱されているOS用テンプレートの部分集合 #gfarm2014

2014-12-16 15:36:15
SODA Noriyuki @n_soda

gfarm-zabbix: JLDG 環境 jldg.org/jldg/ で運用。gfmd 4台。gfsd 28台。データ5.0PB。ユーザ数100の環境。 #gfarm2014

2014-12-16 15:38:15
SODA Noriyuki @n_soda

gfarm-zabbix 2.1: 近日リリース。RHEL7 / CentOS 7 対応。マスターgfmdが、誤って複数起動していないかも監視項目として追加。Gfarm 2.5.8.13以上で動作。(既存のバージョンでは動かない) #gfarm2014

2014-12-16 15:39:42
SODA Noriyuki @n_soda

gfarm-zabbix 質疑: 問: 代表クライアントで障害が起きたら? 答: Zabbix Server で代表クライアントを動かすのがお勧め。 #gfarm2014

2014-12-16 15:40:08
SODA Noriyuki @n_soda

HPCI 共用ストレージの歩み: HPCIとは。以前は大学別で計算機センターを提供。現在: HPCI hpci-office.jp/pages/concept 全国で共通アカウントを用意して共同利用。シングルサインオン。 #gfarm2014

2014-12-16 15:47:35
SODA Noriyuki @n_soda

HPCI 共用ストレージ: 広域ファイルシステム。Gfarm を利用。物理容量21.5PB。複製数2で運用(ディレクトリ単位、ファイル単位でユーザーがカスタマイズ可能)。わりと容量が逼迫している。#gfarm2014

2014-12-16 15:48:15
鯉江 @koie

gfarm ってテープサポートあるのかな? #gfarm2014

2014-12-16 15:49:09
masa16 @masa16tanaka

@_ko1 たぶんHPCIに応募して採用された課題の人が使えるのだと思います hpci-office.jp

2014-12-16 15:52:06
SODA Noriyuki @n_soda

@koie お、こちらにいるんですか。図にあるテープアーカイブは、ユーザがログインして利用するノードについていて、Gfarmとの直接連係はありません。

2014-12-16 15:53:24
SODA Noriyuki @n_soda

HPCI 共用ストレージ: 資源提供機関は、東大、理研AICS、東工大。43課題。477ユーザー(実利用者数は半分くらい?)。総割り当て容量約11PB #gfarm2014

2014-12-16 15:54:26
SODA Noriyuki @n_soda

HPCI共用ストレージ: ファイルシステムノードが停止した場合などに、複製が自動的に増えることがある。今はレプリカ数の自動削減機能はないので、容量が逼迫した時に、この増えた複製を管理者側で消した #gfarm2014

2014-12-16 16:03:10
SODA Noriyuki @n_soda

HPCI共用ストレージ: 質問: 京などのスパコンからダイレクトにアクセスできるか? 答: 現在は計算ノードから直接アクセスできるようにはしてない。ログインノードからは直接アクセスできる #gfarm2014

2014-12-16 16:04:21
masa16 @masa16tanaka

宇宙物理と流体の課題が容量をたくさん使っているとのこと

2014-12-16 16:06:36
SODA Noriyuki @n_soda

HPCI 共用ストレージ: 最初は利用量が少なくて心配したが、杞憂だった。Gfarmの利用よりも、むしろGSI認証のところの敷居が高そう。(曽田注: 広域なので、HPCIのユーザー認証に、sharedsecretは使ってません) #gfarm2014

2014-12-16 16:09:49
SODA Noriyuki @n_soda

HPCI 共用ストレージ: gfarm2fs を内部的に呼び出すスクリプトを提供して、マウントしてもらって使っている。今から設計するのであれば、automount にするのだが… #gfarm2014

2014-12-16 16:13:59
SODA Noriyuki @n_soda

HPCI 共用ストレージ: SATAディスクは予想以上の信頼性。AICSの4800台のディスクで、障害発生は1月あたりヒト桁。落雷による停止はあった。ハードウェア障害より、ヒューマンエラーの方がむしろ危険 #gfarm2014

2014-12-16 16:18:05
SODA Noriyuki @n_soda

HPCI 共用ストレージ: オープンソースで国プロやってどうだったの?むしろオープンソースで良かった。マルチベンダーなので、ベンダー依存しないのは大事。CentOSのサーバーも使ってる。今のところ困ってない。結局は人(スキル)と体制(金) #gfarm2014

2014-12-16 16:22:53
SODA Noriyuki @n_soda

HPCI 共用ストレージ: EUのPRACE prace-ri.eu でも アメリカのXSEDE xsede.org も、共用ストレージに相当するデータ共有基盤は提供していない。HPCI 頑張ってる #gfarm2014

2014-12-16 16:29:11
masa16 @masa16tanaka

NICTサイエンスクラウド sc-web.nict.go.jp でのGfarm利活用 by村田さん@murata4stars #gfarm2014

2014-12-16 16:32:45
SODA Noriyuki @n_soda

NICT サイエンスクラウド: 東京と京都にストレージ。全国をレイヤ2接続。1年半前に、XFSの問題でデータ消失を経験。フロントエンドNASと使い分け。バックアップ用途や大きなデータを置く。#gfarm2014

2014-12-16 16:44:02
SODA Noriyuki @n_soda

NICT サイエンスクラウド: 2010年2月からGfarm利用。3PBくらい。ハードウェアは特に統一されておらず、必要に応じて随時ストレージを足している。 #gfarm2014

2014-12-16 16:44:17
SODA Noriyuki @n_soda

NICT サイエンスクラウド: Gfarm に対する Webインターフェースを独自に用意している (WSDBank)。レプリカがどのサイトに格納されているか。統計情報。 #gfarm

2014-12-16 16:47:42