icon

これいみわからんくない?落とし穴やン

icon

いやマジでTCPレイヤーだと思わんかったわ

icon

じゃあちょっとメンテ入ります。バグるけどごめんね。

icon

うーん、これどうだろう・・・

icon

なんでこれでなおらないんだろう・・・

icon

なぜか再現しないから治ったかもしれん

icon

まだ単にユーザーが少ないだけの可能性があるので、みんなもうっちょっと発言してもらって良いですか

icon

え?やっぱり治ってないですか?

icon

再発した

icon

クソ

icon

あああああああああああああ

icon

ご協力ありがとうございました

icon

お手上げなので切り戻しを考えていますが多分数万円くらいの喪失が出ます

icon

損失

icon

きょうの対処で間違いなく発生頻度は抑えられたので、別に見当違いのことをしたわけではなさそうなんだけど、一方で根本原因ではなかったようですね・・・

icon

これ間違いなくRedisのバグとNode.jsのバグを引いてる

icon

そうじゃなかったらカーネルのTCPレイヤーのバグとしか思えん

icon

そんなわけないやろ

icon

test

icon

マジで何これ

icon

家のネット回線落ちてやばい

icon

streamingサーバーがARPテーブルのキャッシュ切れでRedisサーバーのARP解決を試みる
→その直後、1秒間くらいその宛先へのTCPが全部落ちる(なんで?)
→TCP FIN & 再Handshake
→Redis上は全てのSUBSCRIBE要求を1パケットに乗せて送る
→Redisの1リクエストで許容できる上限を超えてしまいRedisがブチキレる
→Streamingは拗ねて二度とRedisにSUBSCRIBE要求を送らない

icon

ARP解決のタイミングで落ちることは100%確定したので、
キャッシュを無限に残るようにすれば解決する気がするけど、
今日はもう寝ます。

icon

違う気がするな。streamingホストでredisのreplicaを動かして、unix socketで繋いだ方がいい気がする。

icon

信じられんのだけど5/5で再現してるから、このクラウド事業者のVPCがおかしくて、ARP解決(要するにブロードキャスト)がちゃんと通らんのかもしれん…

icon

負荷が低いと発生しないこともわかっている

icon

単に1分に1回落ちてるだけ説も考えたんだけど、100ms以内だからさすがに違うと思うんだよなあ

icon

ねむい

icon

福岡

Attach image
icon

え、ストライクウィッチーズの話してます??る