RDBMSでコネクションプールが必要な理由、わからない。

あとで読むためまとめとく。勝手にメンテしてくれると嬉しい。
68
ハイパーむとう @masa_edw

RDBMSでコネクションプールが必要な理由、わからない。HTTPサーバで秒間数万リクエスト捌けるとかいう話を考えるとTCP/IPのセッションが重いというわけではないだろうし、権限のチェックとか?それこそキャッシュできないのって感じだし、何が重くなる要因なのだろう。

2013-09-04 09:23:11
V @voluntas

@masa_edw 逆に不要と思った理由に興味があります。

2013-09-04 09:26:25
Takayuki Shimizukawa @shimizukawa

@masa_edw コネクションプールが無い場合、使い終わったコネクションが即解放されない(解放まで多少遅延する)ので実際に使っているコネクションの数より多く存在する。その分メモリを圧迫して効率が悪い。っていう話は聞いたことがあるよ(要出典

2013-09-04 09:27:28
ハイパーむとう @masa_edw

@voluntas 現状で必要な状況は理解していますが、なぜそうなるのか理解していないということです。他にもたとえば、bitlyの呼び出しはコネクションプールを使うべきか?なぜ(べき、べきでない)のか?どういう要請でそうなのか?と言う問いに僕は答えられません。

2013-09-04 09:31:22
ハイパーむとう @masa_edw

@shimizukawa なんでHTTPサーバでそれが問題にならないんでしょうか?

2013-09-04 09:32:02
V @voluntas

@masa_edw サーバとクライアントは別世界というのが、一番簡単な話ですね。

2013-09-04 09:33:14
V @voluntas

@masa_edw 必要が無いパターンを考えると、リクエスト事に TCP を張る事になります。ということはリクエストで 1 スレッド使うとしたらその分だけスレッドを消費してしまいギャーとなる。というのがまず一つです。

2013-09-04 09:34:00
V @voluntas

@masa_edw 1つの TCP を使い回すという場合はすべてのリクエストに id を振って、戻りのレスポンスにも id を振り直して貰う必要があります。TCP が戻ってくる順番は「サーバの実装次第」になります。

2013-09-04 09:35:07
V @voluntas

@masa_edw つまるところコネクションプールは必要というよりは「仕方なく」使ってると言えば仕方なく使っています。さらに「サーバ側が」コネクションに耐えられない可能性も考慮する必要があります。

2013-09-04 09:35:45
V @voluntas

@masa_edw TCP のクライアントとサーバは動作が全く異なるため、HTTP サーバでコネクションプールを比較してはダメですね。listen して accepter で待つパターンと、connect するだけ、ではそもそも動きが違います。

2013-09-04 09:36:51
V @voluntas

@masa_edw 140 文字って説明するの難しいっすねw いかがでしょうか … つたない説明で恐縮です。

2013-09-04 09:37:55
Takayuki Shimizukawa @shimizukawa

Vの解説がわかりやすいので誰か魚拓を

2013-09-04 09:38:59
V @voluntas

@shimizukawa 即座に解放されないはあんまり関係ない(reuseaddr 使えば使い回せる)、それよりもそもそも1リクエスト事に張る仕組みだと通常の言語だとうまいこと行かないってのがあるね。

2013-09-04 09:39:11
V @voluntas

@shimizukawa pymysql + gevent とかだとコネクションプールなしでガンガン大量接続言ってるはず。あれが出来れば入らない場合も、ある。

2013-09-04 09:39:39
V @voluntas

@shimizukawa ただし大量に張って消すのはまぁ効率は悪いし「DB サーバ側を考慮出来てない」実装になる。張りすぎてDB サーバ落ちたら笑えないし。ということで「サーバのためにも」制限したコネクションプールを使いましょうという話。

2013-09-04 09:41:03
V @voluntas

@shimizukawa gevent + pymysql だとワーカが 1024 とかちゃんと設定出来る。ワーカー数がプロセスなのか、スレッドなのか、疑似スレッドなのか、でこれまた議論がわかれる。

2013-09-04 09:42:02
methane @methane

@shimizukawa @masa_edw SQLAlchemy の例で言えば、トランザクション中以外はプールにコネクションを返します。マルチスレッドなら並列で2つのリクエスト処理しつつ、1つのコネクションを交互に使うといったことも可能です。

2013-09-04 09:44:19
Takayuki Shimizukawa @shimizukawa

@voluntas なるほどー。以前Web+DBとかでも時々コネクションプール要・不要論が掲載されてて、コネクションプールしない方が速い、っていうのもあったけど、大量接続するときの話では無いんだろうな

2013-09-04 09:44:48
Yutaka Matsubara @mopemope

コネクションプールの件、マジかーと思ってみてる

2013-09-04 09:45:35
Yutaka Matsubara @mopemope

はー、ドライバ書いたら理解できるのでは??

2013-09-04 09:46:13
methane @methane

@shimizukawa @masa_edw プールがないと、1リクエスト中に何度も接続するのは非効率なので、トランザクション中でなくてもコネクションを張りっぱなしにすることが多く、並列するリクエストでシェアできない分同時接続数が増えてしまいます。

2013-09-04 09:46:15
Yoshi Yamaguchi @ymotongpoo

もぺさん見てるとほんとすげえと思うわ

2013-09-04 09:46:33
V @voluntas

@methane それだと、プールが無くても1リクエストで一番最初にコネクション張ってリクエスト終わりで閉じるって話もでてきちゃわないかな。ただし「レシーブブロック前提」な。

2013-09-04 09:48:42
1 ・・ 4 次へ