Google File System(GFS)が削除に適さない問題と、次世代分散ファイルシステムに関するつぶやきメモ

0
(・∀・)キムティ♪@荒浪一城 @kimtea

こうした問題は、アルゴリズムとデータ構造の本質的だからなぁ。(-ω-;)ウーン、難しい。

2010-01-11 15:52:27
かかしみねこ・x・” @gsminek

実装がないのは確かだし、ネットワーク越しでレイテンシは大きいわ、データの信頼性がないわ、通信路そのものも安定しない危険も大きいわ、で、従来のファイルシステムにはない検討事項も多い。し、使い回しによるセキュリティ的な話ももちろんある。最低でもスイープしないとまずくね?的な。

2010-01-11 15:53:38
かかしみねこ・x・” @gsminek

そこで付加される機能による速度劣化とサービスのレスポンスのバランスなんだろうな。リソースが少ない時代に付加機能が少なかったのはそのバランスをレスポンスにふってたからだし。

2010-01-11 15:55:28
かかしみねこ・x・” @gsminek

そういう意味では、ファイルシステムは粒度の荒い半構造データだから、半構造データをどう扱うか、という知見についてはファイルシステムの実装にかなりの部分含まれているんだろうなぁ。

2010-01-11 15:57:15
かかしみねこ・x・” @gsminek

あ、TLの誰かに「そういう意味では」禁止されてたきがするのに使っちゃったな。まあいいか。

2010-01-11 15:57:57
(・∀・)キムティ♪@荒浪一城 @kimtea

分散ファイルシステムと分散データストアがあるけど、どうなんでしょうか?

2010-01-11 16:00:10
かかしみねこ・x・” @gsminek

現在取り組んでいるプロジェクトでも、半構造データのハンドリングは重要なポイントをしめている。それは、メッセージングであり、ユーザ間のデータ共有であり、セッションデータのストレージである。データが必須だったり、アクセスコントロールが必要だったり、履歴が必要だったり。

2010-01-11 16:00:11
かかしみねこ・x・” @gsminek

サーバローカルだけでなく、サーバ間でその情報を連携したりすることも後々必要になる。そう考えるとESBとかバスだけあっても仕方がなくって、データをどういう風にストアするかという全体像があってはじめてESBなんて実装できるんじゃないかなぁ、と思う。

2010-01-11 16:02:46
(・∀・)キムティ♪@荒浪一城 @kimtea

ネットワークをインデックスのように使ってしまうのは、遅延させ解消できれば、ある意味最強だな

2010-01-11 16:02:58
かかしみねこ・x・” @gsminek

うえー。なんか大変だな。もっと世界を単純に扱いたいな。あー。いまさらだけどPaxosって合議プロトコルなんだ。なるほどね。Magiシステムを作るときに必要になる基礎技術か(そんな理解かよ)。

2010-01-11 16:07:02
(・∀・)キムティ♪@荒浪一城 @kimtea

(・∀・)ほう、 Splay trees Distributed fault-tolerant file systems でググるとでてくるな

2010-01-11 16:09:06
かかしみねこ・x・” @gsminek

Chubbyは、汎用のファイルシステム風のレプリケーションなわけだ。やっと見えてきた。APIがどんな感じで見えるかによるけど、DB側でレプリケーションすると粒度が細かすぎてコストがかかるから、AP側に引き寄せて制御してやれば大規模にも対応できそう、ってとこかな。

2010-01-11 16:11:04
かかしみねこ・x・” @gsminek

クラウドの基礎技術としてはあるべき研究だなぁ。ただ、エンタープライズの現場視点では、業務アプリチームの脆弱な開発力に余計な課題を持ち込みたくない、その部分はインフラでカバー、とかなりそうだな。そう、でも、本当にその単位のロックが必要なのか、という問題提起にはなるな。

2010-01-11 16:13:31
かかしみねこ・x・” @gsminek

結局、Webアプリケーションにおいて、ユーザインタラクションを求める限り、Submitボタンが押されてからレスポンスを返すまでを1トランザクションにするわけだから、それ以上細かい粒度のトランザクションやロックは必要ない、という暴論も吐ける。

2010-01-11 16:15:02
(・∀・)キムティ♪@荒浪一城 @kimtea

We developed the following applications using SPLAY: Chord and Pastry , two DHTs (0゚・∀・)wktk

2010-01-11 16:17:18
(・∀・)キムティ♪@荒浪一城 @kimtea

SPLAY can handle 5,500 nodes (500 on each host) without significant drop in performance OlogN か〆(._.)メモメモ

2010-01-11 16:19:31
かかしみねこ・x・” @gsminek

@kimtea そぼくなぎもーん。"(0゚・∀・)wktk" は通じるの?

2010-01-11 16:20:15
(・∀・)キムティ♪@荒浪一城 @kimtea

Windows Azure Google File System Chunk Chrod Pastry この単語にすべて反応してくれるものがなかったorz

2010-01-11 16:38:09
(・∀・)キムティ♪@荒浪一城 @kimtea

まあ、Azureはスケールしないから対象外か・・・

2010-01-11 16:39:01
(・∀・)キムティ♪@荒浪一城 @kimtea

逆に、Google File System Chunk Chrod Pastry ならばあるね(0゚・∀・)wktk

2010-01-11 16:39:37
(・∀・)キムティ♪@荒浪一城 @kimtea

そういえば、金融工学者フィッシャー・ブラックが届いた件

2010-01-11 16:48:09