新定番!10年効く注目の技術 「分散ストレージ技術 GlusterFS」 #ljstudy
ファイル名だけでハッシュ値を計算するように変更して、ディレクトリ毎にハッシュレンジを分けることで、特定のブリックにファイルが偏るのを防いでいる。 #ljstudy
2012-07-25 19:38:24各ブリック/ディレクトリのハッシュレンジは、該当ディレクトリの「拡張属性」に記録される。 trusted.glusterfs.dht=... #ljstudy
2012-07-25 19:39:45後から追加した場合は、新規で作られたディレクトリから割り振りが行なわれる 再配置したいならリバランスコマンドで #ljstudy
2012-07-25 19:45:02既存ボリュームにブリックを追加すると、既存ディレクトリのハッシュレンジは維持されるが、新しいディレクトリを作ると新しいハッシュレンジが割り当てられる。Rebalance処理を実施すると既存ディレクトリも再配置される(ファイル移動するので重い)。 #ljstudy
2012-07-25 19:45:07既存ボリュームからブリックを削除するには、Remove処理を実施することでファイルを移動してハッシュレンジを再構築して、その後取り外せる。 #ljstudy
2012-07-25 19:45:54クライアントがハッシュのテーブルをメモリに持つらしいけど死ぬほどディレクトリが多い時とかどうなるんだろう。そこまで多くならない? #ljstudy
2012-07-25 19:46:03トランスレータ・モジュールという仕組みがあり、自作モジュールをGlusterFSに自由に差し込める。 #ljstudy
2012-07-25 19:47:294台用意しないと機能網羅できません。 RT @wenbose: やっぱ2台だとGlusterFSって検証難しいですかねぇ… #ljstudy
2012-07-25 19:48:21NFSマウント:GlusterFSデーモンは独自のNFSサーバ機能(NFSv3のみ)を提供している。分散ロック機能でNFSロック情報はノード間で共有される。マウント先のサーバがGlusterクライアントのように動くのでNFSマウント先は分散したほうがいい #ljstudy
2012-07-25 19:52:01GlusterFSのNFS機能って何に使うんだろ。結局GlusterFSってNFSみたいな関係でもあるんだし、サーバ間の動きは。ただクライアント:サーバの関係が多:多なだけで。 #ljstudy
2012-07-25 19:52:45よくある誤解:高速化する?→単一ファイルのアクセス性能は向上しない。多くのファイルを複数のサーバでアクセスを分散させれば、トータルで性能を引き出せる。 #ljstudy
2012-07-25 19:54:29Nativeプロトコル以外は1ホップ増えるけど不利か?→少数ファイルに書き込みアクセスする場合はNFSのほうが高速な場合もある。 #ljstudy
2012-07-25 19:55:49なるほどね、「NFSのキャッシュ機能を有効に使う為」なのかー…>GlusterFSのNFS機能 #ljstudy
2012-07-25 19:55:54ストライピングを利用したほうが高速?→1つの巨大なファイルを複数クライアントが同時アクセスする場合に有効な仕組み。多数のクライアントが異なるファイルへ同時アクセスする場合はストライピングしないほうが有利。 #ljstudy
2012-07-25 19:57:11http://t.co/j2o4YFxm ミニマムこんな感じかなー RT @htaira: 4台用意しないと機能網羅できません。 RT @wenbose: やっぱ2台だとGlusterFSって検証難しいですかねぇ… #ljstudy
2012-07-25 20:01:06