丸の内MongoDB勉強会 #16

野村総合研究所さんを会場に行われました「丸の内MongoDB勉強会 #16」のTweetをまとめました。主にぼくがせこせこタイプしたものなので特に最後の方の質疑応答は拾いきれてない(記録が間違ってる)可能性があります。気づいた人コメント下さい。修正します。
1
Naruhiko Ogasawara @naru0ga

#mongonouchi オンメモリで処理できる程度にホットデータが小さければ、速度的には不安はない。十分に近い時間のログであればうれしい。

2014-03-19 20:29:49
Naruhiko Ogasawara @naru0ga

#mongonouchi Q.Mongo-Hadoopどうよ? A.昔はHDFSにはSPOFがあったので、MongoDBにデータを置いといてM-Hで処理するっていうのは良かった(今はHDFSのSPOFはない)。ただ、MongoDBに書き戻すのは面倒なこともある。

2014-03-19 20:32:07
Naruhiko Ogasawara @naru0ga

#mongonouchi 具体的にはMahoutみたいなHIVEにデータを直に載せるやつは、そのデータをBSONにすることが面倒。(……だったかな? 聞き間違いならごめんなさい

2014-03-19 20:34:24
Naruhiko Ogasawara @naru0ga

#mongonouchi HBaseの運用に自信があるなら直接HBaseにデータおいてもいいと思う。HBaseの運用よりMongoDBのコストが低いのであれば、MongoDBをデータコンテナにしてもいいんじゃないか

2014-03-19 20:36:45
Naruhiko Ogasawara @naru0ga

#mongonouchi Q.サイバーエージェントさんってMongoDB Enterprise使ってるんだっけ? A.確か使ってない。MongoDB Inc.の事例は顧客なのでEnterpriseのユーザー

2014-03-19 20:40:45
Naruhiko Ogasawara @naru0ga

#mongonouchi エンプラは高いけど買うケースとしては1.決済者が安心のために買いなさいというパターン、2.OSS版はAGPLなのでカスタマイズしたときソースコード公開とかを嫌うパターン、がある

2014-03-19 20:42:15

エンプラが高いという点ですが、MongoDB Inc.の価格表を見ればわかるとおりマシン並べた分だけコストがかかるんですよね。水平スケーリングで爆速じゃーいっていっておきながらそれは厳しいなあとは思います。あと、OSS版とエンプラ版は機能が少し違うんですよね、認証周りとか。

Naruhiko Ogasawara @naru0ga

#mongonouchi Q.サイジングどうするの? A.読み込みは一レコードのサイズxREADの頻度(Q/S)、あとはシャーディングでいける。WRITEはスケールしないので(プライマリにしか書けない)WRITEでキャップしたらサイズ的には打ち止めか

2014-03-19 20:44:37
Naruhiko Ogasawara @naru0ga

#mongonouchi Q.各ノードの性能差はどう考えるべき? A.ノード間の性能差は多少あってもいい。でもプライマリを固定するとMongoDBの旨みを失われるので、そういうシステム構成をしないほうがよい

2014-03-19 20:47:25
Naruhiko Ogasawara @naru0ga

#mongonouchi プライマリが重たい場合はREAD preferenceをうまくつかって逃してやるほうがいい

2014-03-19 20:49:27

ここ少し言葉足らずで、MongoDBの場合プライマリからもセカンダリからもデータをREADできるので(レプリケーション前の値を掴みたくなければプライマリから読む必要があるけど、そうじゃない場合も多い)、READはセカンダリからやってプライマリの負荷を下げるという意味ですね。

Naruhiko Ogasawara @naru0ga

#mongonouchi Q.コア数多いとうれしい? A.READはうれしい。WRITEはどうせ書き込み専用スレッドがキューを待ってるだけなのでコア数は意味がない

2014-03-19 20:50:18
ウィルソン @tyazu

事例以外にも基本からやって頂いたのでとっかかりに最適でした。ありがとうございました #mongonouchi

2014-03-19 23:58:47