レースコンディションは週末を台無しにする

去年、フードデリバリーアプリでライダーが1週間に3回ダブルブッキングされた。2つの注文が同じ人にアサインされた。怒った顧客。返金。深夜2時にデバッグするオンコールエンジニア（私だ）。

バグはシンプルだった：2つのアプリサーバーが同じミリ秒でライダーが空いているか確認した。両方が「利用可能」を見た。両方が注文をアサインした。

これが古典的なレースコンディションであり、想像以上に多くのシステムを壊す。

ナイーブなアプローチ（やるな）

コードはこうなっていた：

妥当に見える。まず確認して、それから更新。問題は：別のサーバーがSELECTとUPDATEの間に同じSELECTを実行できること。両方が勝ったと思う。

このパターンは「check-then-act」と呼ばれ、並行システムでは設計上壊れている。

アトミック操作でこれを直す

解決策は確認と更新を単一のアトミック操作にすること：

行がすでに予約されていたら、影響された行はゼロ。利用可能だったら、1行更新。レースウィンドウなし。

影響された行数を確認しろ。ゼロなら、ライダーはすでに取られている — 別のを探せ。

分散ロック（もっと必要なとき）

単一のSQL文で足りないこともある。在庫を確認し、支払いを検証し、ストックを予約する — すべてアトミックに必要かもしれない。

ここで分散ロックの出番だ。RedisでSET key value NX PX 30000を使えば、有効期限付きのロックが得られる。ロックを取得し、作業をして、解放する。

NXフラグは「存在しない場合のみセット」を意味する — アトミックなcheck-and-set。

安全網としてのデータベース制約

適切なロックがあっても、データベース制約を追加しろ。最後の防衛線だ：

これでアプリケーションコードにバグがあっても、データベースがダブルブッキングを許さない。

パターン

一度しかアサインできない共有リソースがあるたびに：

別々の操作でcheck-then-actするな
WHERE条件付きのアトミック更新を使え
マルチステップ操作には分散ロックを追加しろ
バックアップとしてデータベース制約を追加しろ

ライダー問題はどこにでも現れる。決済処理。在庫管理。座席予約。イベントチケット。あらゆる希少リソース。

間違えると深夜2時にデバッグだ。正しくやれば夜通し眠れる。

check-then-actはアトミックではない。それがレッスンのすべてだ。

— blanho

これが古典的なレースコンディションであり、想像以上に多くのシステムを壊す。

ナイーブなアプローチ（やるな）

コードはこうなっていた：

妥当に見える。まず確認して、それから更新。問題は：別のサーバーがSELECTとUPDATEの間に同じSELECTを実行できること。両方が勝ったと思う。

このパターンは「check-then-act」と呼ばれ、並行システムでは設計上壊れている。

アトミック操作でこれを直す

解決策は確認と更新を単一のアトミック操作にすること：

行がすでに予約されていたら、影響された行はゼロ。利用可能だったら、1行更新。レースウィンドウなし。

影響された行数を確認しろ。ゼロなら、ライダーはすでに取られている — 別のを探せ。

分散ロック（もっと必要なとき）

単一のSQL文で足りないこともある。在庫を確認し、支払いを検証し、ストックを予約する — すべてアトミックに必要かもしれない。

ここで分散ロックの出番だ。RedisでSET key value NX PX 30000を使えば、有効期限付きのロックが得られる。ロックを取得し、作業をして、解放する。

NXフラグは「存在しない場合のみセット」を意味する — アトミックなcheck-and-set。

安全網としてのデータベース制約

適切なロックがあっても、データベース制約を追加しろ。最後の防衛線だ：

これでアプリケーションコードにバグがあっても、データベースがダブルブッキングを許さない。

パターン

一度しかアサインできない共有リソースがあるたびに：

別々の操作でcheck-then-actするな
WHERE条件付きのアトミック更新を使え
マルチステップ操作には分散ロックを追加しろ
バックアップとしてデータベース制約を追加しろ

ライダー問題はどこにでも現れる。決済処理。在庫管理。座席予約。イベントチケット。あらゆる希少リソース。

間違えると深夜2時にデバッグだ。正しくやれば夜通し眠れる。

check-then-actはアトミックではない。それがレッスンのすべてだ。

— blanho

レースコンディションは週末を台無しにする

ナイーブなアプローチ（やるな）

アトミック操作でこれを直す

分散ロック（もっと必要なとき）

安全網としてのデータベース制約

パターン

Related Posts

分散システムが壊れる理由

データベーストランザクション：あなたの知識はおそらく間違っている

UUIDをデフォルトにするな

レースコンディションは週末を台無しにする

ナイーブなアプローチ（やるな）

アトミック操作でこれを直す

分散ロック（もっと必要なとき）

安全網としてのデータベース制約

パターン

Related Posts

分散システムが壊れる理由

分散システムが壊れる理由

データベーストランザクション：あなたの知識はおそらく間違っている

データベーストランザクション：あなたの知識はおそらく間違っている

UUIDをデフォルトにするな

UUIDをデフォルトにするな

分散システムが壊れる理由

データベーストランザクション：あなたの知識はおそらく間違っている

UUIDをデフォルトにするな