Gfarmワークショップ2015

エンタープライズ Gfarm
1
SODA Noriyuki @n_soda
Gfarm ワークショップ 2015、ハッシュタグは #gfarm2015 oss-tsukuba.org/event/gw2015でいいかしら。
FUKAUMI Naoki @naobsd
"GfarmカーネルドライバとRDMAによる高速化" きになる
SODA Noriyuki @n_soda
Gfarm 2.5.8.5 データ完全性。ファイル破損を検知。ファイル全体の secure hash 値 (設定によって md5, sha1, sha256…) を計算してメタデータに保存。 #gfarm2015
Jun Ebihara @ebijun
@n_soda MD5の計算ってどうせ余ってるGPUとかでちゃっちゃとできないもんすかね。
SODA Noriyuki @n_soda
Gfarm の実装: gfmd:メタデータサーバ。更新はジャーナルへの書き込み完了を待って応答を返す。スレーブgfmdへ同期は、ジャーナルファイルを転送。クライアントへの返答は、同期スレーブへの転送完了後。ただし非同期スレーブの返答は待たない。#gfarm2015
SODA Noriyuki @n_soda
Gfarm の実装: gfsd I/O サーバ。データを保持する。メタデータは保持しないので、ファイルの改名・移動・chmod/chown などでは gfsd へアクセスしない。secure hash 計算もする #gfarm2015
SODA Noriyuki @n_soda
複製数維持: 足りなければ自動で増やす(gfarm-2.5.8から)。多過ぎれば自動で減らす機能は gfarm-2.6.5から(複製数維持、および自動で減らす機能は個別でオンオフできる) #gfarm2015
SODA Noriyuki @n_soda
自動マウントの例: ファイル /etc/auto.master「/gfarm /etc/auto.gfarm」、ファイル /etc/auto.gfarm「* -fstype=gfarm2fs,username=& :/etc/gfarm2.conf」#gfarm2015
SODA Noriyuki @n_soda
これで「ls /gfarm/XXX」で自動的にマウント #gfarm2015
SODA Noriyuki @n_soda
田中 昌宏(筑波大学)さんによる「Pwrake/Gfarmによるビッグデータ解析」 #gfarm2015
SODA Noriyuki @n_soda
ネットワークファイルシステムの比較。NFS、分散ファイルシステム、Gfarm ファイルシステム。 Gfarm は分散ファイルシステムだが、ローカルファイルのアクセス機能があるところが違う #gfarm2015
SODA Noriyuki @n_soda
Pwrake の構成: master と slave (pwake worker)。共有ファイルシステムとして Gfarm を使うと、データの実体を持つマシンにジョブをスケジュールする。#gfarm2015
SODA Noriyuki @n_soda
ローカルアクセスの向上: ローカルアクセスするようタスクを分割する際に、カットする辺の数を最小にするようなグラフ分割のアルゴリズムを使用。ローカリティ無考慮:ナイーブ:辺数最小 = 87.9 : 47.4 : 14.0 #gfarm2014
SODA Noriyuki @n_soda
電気通信大学の高橋一志さんによる「GfarmカーネルドライバとRDMAによる高速化」 #gfarm2015
SODA Noriyuki @n_soda
今はgfarm2fs(Linux の FUSE機能)経由でgfarmを利用している人が多い。gfarm2fsはカーネル←→ユーザーランド間のスイッチによるオーバーヘッドがある。というわけで、カーネル版を実装した。 #gfarm2015
SODA Noriyuki @n_soda
mount -t gfarm -o conf_path=/etc/gfarm2.conf,luser=gfarm /dev/gfarm /mnt/gfarm カーネルモジュールは linux デバイスとして見える。/dev/gfarm はそのデバイス名。#gfarm2015
SODA Noriyuki @n_soda
gfarm カーネルモジュールに Infiniband 経由の RDMA 機能を追加した。RDMA処理は、linux kernelのworkqueueを使って非同期実行。#gfarm2015
SODA Noriyuki @n_soda
質問: 現状のgfarmは、ユーザー権限ごとに別にマウントする必要があるが、単一のマウントで複数のユーザーからアクセスできるようにならないか? 答: 現状まだ。結構実装コストがかかる #gfarm2015
SODA Noriyuki @n_soda
理化学研究所 原田浩さんによる「HPCI共用ストレージによるGfarmの運用」 #gfarm2015
Takahiro Kitayama @kitayama_t
今これをやっているのか。/ 9月4日 Gfarmワークショップ2015(兵庫県) kokucheese.com/event/index/32…
SODA Noriyuki @n_soda
報道されたようなインシデントはあったけれど、Gfarmは最も安全な広域ファイルシステム(silent data corruptionがあったが、secure hashがついていたおかげで影響を限定できた) #gfarm2015
SODA Noriyuki @n_soda
原田さんの枠内で、AICSの秘密兵器 金山さんの発表。Zabbix を使った Gfarm の監視 #gfarm2015
SODA Noriyuki @n_soda
gfarm_zabbix と、zabbix 標準の template linux を組み合わせて使っている(現状の gfarm_zabbix だと被ってるところがあるので調整が)必要 #gfarm2015
残りを読む(3)

コメント

コメントがまだありません。感想を最初に伝えてみませんか?

ログインして広告を非表示にする
ログインして広告を非表示にする