mixiがはまったmemcached(or libevent?)の問題を調べる人たち (7ページ目)

うちレッドブル届いてない…

2010-08-19 18:10:53

Shinji Tanaka @stanaka

あのエントリのは対症療法ですね。根治パッチはできているので、それの取り込まれ待ちかと RT @shigeyas: これ再発防止策じゃなくて、対症療法じゃね？ RT @naoto_matsumoto あふん～？ http://bit.ly/bppK2U

2010-08-19 19:11:29

@bulkneets 半分送りましょうかw

2010-08-19 20:16:52

@kzk_mover いえいえおかまいなく！

2010-08-19 20:21:27

twitter上の日本語での議論も、開発者の人が検索して翻訳して読んでたりするわけだから「僕の遅刻もメムキャッシュディー(検索よけ)が落ちたのが原因です」みたいなジョークはノイズ

2010-08-19 21:09:16

誰かmemcachedの問題の説明とパッチ、ML or IRCに投げないのかな(道端で人が倒れているけど誰が救急車呼ぶか問題)

2010-08-19 21:44:14

mixiのひとがやってんのかな

2010-08-19 21:44:29

パッチアレで合ってるんだったら、投げますが。手元では落ちてないのですけど。 RT @bulkneets: 誰かmemcachedの問題の説明とパッチ、ML or IRCに投げないのかな(道端で人が倒れているけど誰が救急車呼ぶか問題)

2010-08-19 21:45:18

@bulkneets なるほど、じゃあ説明とまあパッチもおまけで投げてみます

2010-08-19 21:52:20

Neal Sato @nealsato

@kzk_mover @bulkneets IRCではdormandoにevent_base_loopを抜ける事は報告してますが、もう少し詳細がわかったら連絡すると伝えてあります。

2010-08-19 21:53:56

よく見たら名前載ってた。有難うございます。で、パッチはどこだ？ RT @nealsato: 「mixi大規模障害についてその2」のエントリーをアップしました http://bit.ly/d3epia

2010-08-20 03:12:09

mixiのmemcachedの問題、徐々にリソースが枯渇していく類のものではないです。接続数上回っても通常はエラーを返すだけで終了はしない。接続数が不足してる時に、複数のスレッドから同時に実行されるとマズイ処理が「低確率で」同時に実行されて、それが原因で落ちる。

2010-08-20 12:50:50

Shinji Tanaka @stanaka

@nealsato 先ほどRedbull届きました！ありがとうごさいます！ http://yfrog.com/0moj4cj

2010-08-20 14:52:23

Neal Sato @nealsato

@stanaka Enjoy! 飲み過ぎに注意です（ｗ

2010-08-20 15:20:23

補足追記しました。「mixi大規模障害についてその2」 http://alpha.mixi.co.jp/blog/?p=2153

2010-08-20 15:45:39

あるスレッドがepoll_wait(epfd)してるときに、別のスレッドがepfdを更新したらどうなるんだろう

2010-08-20 17:09:41

memcachedの問題で排他制御が失敗する原因が判明しました! ネットワークI/Fが2つ以上ある場合に発生します

2010-08-20 18:03:35

複数のstatic connが生成されるがそれらが同じevent_baseを指してた workerが一つめのI/FをacceptOKにすると mainが動き出すが、workerは二つめのI/FをacceptOKにしようとして競合してました

2010-08-20 18:03:47

これでグッスリ眠れます

2010-08-20 18:03:54

s/複数のstatic conn/複数のstruct conn/

2010-08-20 18:07:13

do_accept_new_connsの中でI/F分ループしてて、1周目でupdate_event()した時点でmainがepoll始めます。これが問題。2周目のupdate_event()とmainのepoll_dispatch=>event_queue_insertがぶつかる

2010-08-20 19:14:12

I/Fが2個以上とはいえlo0があるから常に2個以上

2010-08-20 19:38:51