分散データ技術再考のまとめ

jjug ccc 2013 fallの@masayhさんの発表のまとめ
1
くまぎ @kumagi

#jug_ccc に来た。目当ては @masayh さんのセッション「分散データ技術の再考」

2013-11-09 16:14:31
くまぎ @kumagi

Paxosの話、トランザクションの理論の話、最新事例の話 の3本立てだそうだ。 #jug_ccc

2013-11-09 16:15:44
kumagi @kumagi_bot

OLTPが高速になるに連れてラムダアーキテクチャは不要のものになっていくという主張 #jug_ccc

2013-11-09 16:17:47
kumagi @kumagi_bot

ハッシュタグは #jjug_ccc だった。「N-tierモデルはもうダメですね」

2013-11-09 16:21:51
kumagi @kumagi_bot

「2-Phase Commitはコーディネータの耐障害性がないのでクラウド時代には向かない。」そしてSpannerの2PCの話になるんですね。 #jjug_ccc

2013-11-09 16:22:45
kumagi @kumagi_bot

メモリがスタックするとアボートするシステム、H-Store…

2013-11-09 16:23:50
kumagi @kumagi_bot

2.75億IOPSが1ラックで出る、と。

2013-11-09 16:24:30
kumagi @kumagi_bot

「DCを跨る分散トランザクションができるかが今日の主要なテーマです」 #jjug_ccc

2013-11-09 16:26:52
kumagi @kumagi_bot

「最初に耐障害性、次にレイテンシ、最後にスケーラビリティ、この順番で追い求めて行かないと成功しません」 ほんまそれ #jjug_ccc

2013-11-09 16:27:52
kumagi @kumagi_bot

Paxosの話になった。でも僕(kumagi)個人ではRaftを知ってればもう頑張ってPaxosを追いかける必要は無いと思ってる #jjug_ccc

2013-11-09 16:28:59
kumagi @kumagi_bot

国内の分散システム研究、最初にスケーラビリティを求めてる事例ばっかりだから実用に向かない物ばかり。

2013-11-09 16:29:58
kumagi @kumagi_bot

耐障害性の話から定足数の話になった。W+R>N あとW>N/2 #jjug_ccc #ccc_r14

2013-11-09 16:33:45
kumagi @kumagi_bot

Paxosの説明が普通に行われているけれど、このPaxosが数ある分散合意プロトコルの間のどの位置にいるのかを先に説明する順序のほうが僕は好みだ。

2013-11-09 16:37:50
kumagi @kumagi_bot

「最初に過半数を取ったブロードキャストが勝ち」 「Paxosはprepare/acceptの2相から成っている」「prepareは読み込み acceptは書き込みフェーズとそれぞれ呼んでいる」 #jjug_ccc #ccc_r14

2013-11-09 16:39:50
kumagi @kumagi_bot

Paxosでリーダーを多数決で獲得するのは、マルチリーダーを許さないというPaxosのサブセットであって、Paxos全体の話として良いかちょっと疑問 #jjug_ccc #ccc_r14

2013-11-09 16:44:58
kumagi @kumagi_bot

Multi Paxosの話が混ざったような?あれ? #jjug_ccc #ccc_r14

2013-11-09 16:50:50
kumagi @kumagi_bot

ACIDの一貫性の話になった、まずは Serializability(CSR)から。 #jjug_ccc #ccc_r14

2013-11-09 16:53:18
kumagi @kumagi_bot

「コンシステンシというのは2種類あって、Strong ConsistencyとSerializabilityです」「耐障害性や可用性はStrong Consistencyで保証する」

2013-11-09 16:56:02
kumagi @kumagi_bot

スケジューラ・ロックマネージャの実装の話になった #jjug_ccc #ccc_r14

2013-11-09 16:57:02
kumagi @kumagi_bot

Snapshot Isolationの話になった。First Commiter Winsの話などしているけど他の選択肢の話をしないと納得しないと思う。Write Skewの説明は難しいとの理由で省かれた。

2013-11-09 16:59:40
kumagi @kumagi_bot

「Snapshot Isolationは今後のRDBではデフォルトになります」「スナップショットを取るタイミングはトランザクション開始時点とは限らないが、前のコミットが終わってないと読む事は許されない」#jjug_ccc #ccc_r14

2013-11-09 17:02:20
kumagi @kumagi_bot

Parallel snapshot isolation "Walter" とやらの話になった。 Transactional storage for geo-replicated system

2013-11-09 17:04:21
kumagi @kumagi_bot

時間切れでSpannerの話は延長戦。Spannerの論文にそんなこと書いてあったっけ?と首をかしげている。 #jjug_ccc #ccc_r14

2013-11-09 17:06:19
kumagi @kumagi_bot

複数のRDBの上の2PCの上にPaxosを載せる(MS, Oracle)か 複数のNoSQLの上のPaxosの上に2PCを載せる(Google)か。前者のほうが性能が出るようだとの見積り。 #jjug_ccc #ccc_r14

2013-11-09 17:09:59