Capacity planning и scalability

Capacity planning отвечает, какой объём нагрузки система выдержит при заданных условиях. Scalability проверяет, растёт ли пропускная способность при добавлении ресурсов и где появляется следующий bottleneck.

Что важно понять

  • Текущий предел throughput при приемлемой latency и error rate.
  • Запас до прогнозного пика и сезонных всплесков.
  • Вертикальное и горизонтальное масштабирование.
  • Зависимости, которые не масштабируются вместе с приложением: DB, cache, external API.

Рабочий порядок

  1. Снимите baseline на текущей конфигурации.
  2. Увеличивайте нагрузку ступенями и фиксируйте точку насыщения.
  3. Измените ресурс или количество инстансов и повторите тест.
  4. Сравните стоимость масштаба с приростом полезной пропускной способности.

Что отдавать команде

  • Capacity table.
  • Scalability comparison.
  • Рекомендации по ресурсам и лимитам.

Частые провалы

  • Экстраполировать результат одной точки до любого трафика.
  • Масштабировать приложение, когда bottleneck в базе.
  • Не учитывать лимиты внешних провайдеров.

Практика

Проведите два запуска: один инстанс API и два инстанса. Сравните throughput, p95 и DB connections. Если throughput не вырос, ищите общий bottleneck.