<a class="info_title emj" href="https://togetter.com/li/163883" title="GlusterFS TL">GlusterFS TL

@Guutara すごーく、わかりますねw　kumofsはノードの追加/復旧時の一貫性維持のためだけに、マスタノードを追加しているくらいなので…。

2011-07-20 18:33:50

@frsyuki かれこれ丸4年になります。v1.3.7から現在までです。

2011-07-20 18:33:23

@keithseahus なんと4年ですか！かなり安定していそうですね。これはちょっと使ってみたくなります^^; 規模が気になるところですが、数十台/数百GBくらいでしょうか？

2011-07-20 18:39:10

@range2010 @keithseahus @frsyuki ということは、"Elastic Hash"はパス名から計算してるということでしょうか？大きなディレクトリ・ツリーをmvで動かすと何が起きるのでしょう？

2011-07-20 18:39:38

どうでもいいけどglusterfsのMLでmanu at NetBSD.orgを見かけますな。

2011-07-20 18:40:35

@frsyuki FUSE周りの不安定さがあったので、NFSがメインのプロトコルになってからは、大きく安定したと思います。とはいえ、まだ未成熟ですけれども。規模は、業務上の守秘義務があるので言えませんが、今動いているもので最大のものだと、1クラスタで25TB程になります。

2011-07-20 18:48:27

@keithseahus おぉ大きいですね！ありがとうございます。 FUSE は linux 2.6.3x でもだいぶ変更が入っているようですが、NFSで直アクセスした方が安定しそうですね。そもそもロックなどは避けた方が良さそうですし。

2011-07-20 18:55:53

v3.2.1ですが，distributed replicated volumeと，distributed striped volumeは不安定という印象で，distributed volumeとstriped volumeとreplicated volumeは問題なく動きました．

2011-07-20 19:13:32

@frsyuki FUSE周りの不安定さがあったので、NFSがメインのプロトコルになってからは、大きく安定したと思います。とはいえ、まだ未成熟ですけれども。規模は、業務上の守秘義務があるので言えませんが、今動いているもので最大のものだと、1クラスタで25TB程になります。

2011-07-20 18:48:27

来月くらいにリリース（予定）のGfarm-2.5だと、やっとこさDRBDに頼らないメタデータ分散がつく予定なんだけど、BBWCつきRAIDでの同期書き込み性能が1万～2万IOPS程度みたいで、新規作成は原理的にそれ未満のはず。Fusion-io使うともう1桁上へいきますかね？

2011-07-20 19:00:14

stub fileと呼ばれる0バイトのファイルが生成され、ポインタライクな役割をします。diskがfullの場合もこれが使われます。 RT @n_soda: @range2010 @keithseahus @frsyuki ということは、"Elastic Hash"はパス名から計

2011-07-20 18:56:33

"GlusterFS Technical FAQ" http://www.gluster.com/community/documentation/index.php/GlusterFS_Technical_FAQ

2011-07-20 18:58:25

@frsyuki FUSEの場合、ロックはglusterfsdが持っています。これだと、共有ロックとしての信頼性はありますが、障害時にロックが残るケースがあります。glusterfsdを再起動すればという話ですが、商用利用ではそんなことさせて貰えないのが現実です。

2011-07-20 19:01:14

メタデータ管理がないと言うことは、多少データがヘンなことになっても固まることは無いハズで、言い換えれば最悪でも一貫性を妥協すれば安定運用はしやすそうな印象。FUSEは確実に微妙なので、直NFSが本命か。

2011-07-20 19:02:31

Naoto MATSUMOTO @naoto_matsumoto

http://bit.ly/qfQsaP InfiniBandで変わるデータセンター内通信（後編）公開なう。

2011-07-20 19:04:23

@frsyuki また、FUSEだと対応していないシステムコールを上位のアプリが使いたいときに困りました。その点、NFSは良く出来ていると思います。ただ、当然ですが、独自実装のNFSサーバなので、nfslockは効きません。lockサービスのようなものも現時点ではありません。

2011-07-20 19:04:38

@n_soda 一旦すべてのディレクトリを消して，今度はfugaというディレクトリを作って，同じ名前の1MiBのファイルを10個作った場合，今度は先ほどとは別の場所にファイルの実体が作成されました．

2011-07-20 19:04:43

@keithseahus なるほど。分散FSでロックは基本的に危ないですし、やはり運用回避が必須になりそうな印象です。NFSはプロトコルが単純なので良いですね。あとは障害時の復旧手順さえ確立できれば、相当に良さそうな気がしてきました！（そこも難しそうですが

2011-07-20 19:08:23

@range2010 ありがとうございます。ファイル改名/移動時には、新しいパス名に対応するノード上に、実体を指すポインタができるだけで、実データをいつ動かすかは不明(動かないかも?)って感じなんですね。実ファイル数に比例するポインタができるのか、もっと少ないのかが気になります。

2011-07-20 19:13:49

@frsyuki @n_soda @nminoru_jp http://t.co/EdMXuhM 自分が1週間前ぐらいに測定した，GlusterFS v3.2.1の性能評価を公開してみました．簡単な測定ですが，よかったら参考にしてください．

2011-07-20 20:38:48