APIをスケールする方法（頭おかしくならずに）

APIは問題なく動く。ステージングの負荷も処理。そしてローンチ、バイラル、10,000ユーザーが同時に叩く。レスポンスタイムがスパイク。エラーがカスケード。データベースが悲鳴。

これはスケーリングが直感に反するから起きる。

まず：ボトルネックを知れ

推測するな。測定しろ。

APIはCPUバウンド？I/Oバウンド？メモリバウンド？解決策は劇的に異なる。

ほとんどのWeb APIはI/Oバウンド。待ちに時間使ってる—データベース、外部API、ファイルシステム。これは良いニュース。I/Oバウンドな問題には既知の解決策がある。

キャッシング：明らかな最初のステップ

最速のデータベースクエリは、決して実行しないクエリ。

積極的にキャッシュ。短いTTLで始める。鮮度要件を理解したら延長。

水平スケーリング

垂直スケーリング（大きいサーバー）は限界がある。水平スケーリング（多いサーバー）が本当の成長。

要件：

ステートレスAPI（セッションはメモリじゃなくRedis）
前にロードバランサー
不健全なインスタンスを除外するヘルスチェック
CPU/メモリベースのオートスケーリング

データベース：本当のボトルネック

APIはスケールする。データベースはできる？

コネクションプーリング — 接続を開くのは高価。プールを準備しておく。PostgresにはPgBouncer。これだけでスループット2倍になることも。

リードレプリカ — プライマリが書き込み、レプリカが読み取り。ほとんどのアプリは90%以上が読み取り。

欠けてるインデックス — しばしばボトルネック全体。

非同期処理

すべてをリクエスト中にやる必要はない。

すぐリターン。バックグラウンドで処理。ユーザーは待たない。

レート制限

行儀の悪い1クライアントがAPI全体を落とすべきじゃない。

APIキーあたり毎分100リクエスト。超えたら429。Redisで簡単。

操作順序

可観測性追加 — 見えないものは最適化できない
明らかなもの最適化 — 欠けたインデックス、N+1クエリ
キャッシング追加 — クイックウィン
水平スケーリング — より多くのボックス
非同期処理 — 重い仕事をキューに
データベーススケーリング — リードレプリカ、コネクションプーリング
シャーディング — 他の全部が足りないときだけ

ステップ7に飛ぶな。ほとんどは必要ない。

スケーリングは1つの技術じゃない。ラダーだ。一歩ずつ登れ。

— blanho

これはスケーリングが直感に反するから起きる。

まず：ボトルネックを知れ

推測するな。測定しろ。

APIはCPUバウンド？I/Oバウンド？メモリバウンド？解決策は劇的に異なる。

キャッシング：明らかな最初のステップ

最速のデータベースクエリは、決して実行しないクエリ。

積極的にキャッシュ。短いTTLで始める。鮮度要件を理解したら延長。

水平スケーリング

垂直スケーリング（大きいサーバー）は限界がある。水平スケーリング（多いサーバー）が本当の成長。

要件：

ステートレスAPI（セッションはメモリじゃなくRedis）
前にロードバランサー
不健全なインスタンスを除外するヘルスチェック
CPU/メモリベースのオートスケーリング

データベース：本当のボトルネック

APIはスケールする。データベースはできる？

コネクションプーリング — 接続を開くのは高価。プールを準備しておく。PostgresにはPgBouncer。これだけでスループット2倍になることも。

リードレプリカ — プライマリが書き込み、レプリカが読み取り。ほとんどのアプリは90%以上が読み取り。

欠けてるインデックス — しばしばボトルネック全体。

非同期処理

すべてをリクエスト中にやる必要はない。

すぐリターン。バックグラウンドで処理。ユーザーは待たない。

レート制限

行儀の悪い1クライアントがAPI全体を落とすべきじゃない。

APIキーあたり毎分100リクエスト。超えたら429。Redisで簡単。

操作順序

可観測性追加 — 見えないものは最適化できない
明らかなもの最適化 — 欠けたインデックス、N+1クエリ
キャッシング追加 — クイックウィン
水平スケーリング — より多くのボックス
非同期処理 — 重い仕事をキューに
データベーススケーリング — リードレプリカ、コネクションプーリング
シャーディング — 他の全部が足りないときだけ

ステップ7に飛ぶな。ほとんどは必要ない。

スケーリングは1つの技術じゃない。ラダーだ。一歩ずつ登れ。

— blanho

APIをスケールする方法（頭おかしくならずに）

まず：ボトルネックを知れ

キャッシング：明らかな最初のステップ

水平スケーリング

データベース：本当のボトルネック

非同期処理

レート制限

操作順序

Related Posts

分散システムが壊れる理由

データベーストランザクション：あなたの知識はおそらく間違っている

ほとんどの開発者が欠いてるパフォーマンス直感

APIをスケールする方法（頭おかしくならずに）

まず：ボトルネックを知れ

キャッシング：明らかな最初のステップ

水平スケーリング

データベース：本当のボトルネック

非同期処理

レート制限

操作順序

Related Posts

分散システムが壊れる理由

分散システムが壊れる理由

データベーストランザクション：あなたの知識はおそらく間違っている

データベーストランザクション：あなたの知識はおそらく間違っている

ほとんどの開発者が欠いてるパフォーマンス直感

ほとんどの開発者が欠いてるパフォーマンス直感

分散システムが壊れる理由

データベーストランザクション：あなたの知識はおそらく間違っている

ほとんどの開発者が欠いてるパフォーマンス直感