Capacity planning и scalability
Capacity planning отвечает, какой объём нагрузки система выдержит при заданных условиях. Scalability проверяет, растёт ли пропускная способность при добавлении ресурсов и где появляется следующий bottleneck.
Что важно понять
- Текущий предел throughput при приемлемой latency и error rate.
- Запас до прогнозного пика и сезонных всплесков.
- Вертикальное и горизонтальное масштабирование.
- Зависимости, которые не масштабируются вместе с приложением: DB, cache, external API.
Рабочий порядок
- Снимите baseline на текущей конфигурации.
- Увеличивайте нагрузку ступенями и фиксируйте точку насыщения.
- Измените ресурс или количество инстансов и повторите тест.
- Сравните стоимость масштаба с приростом полезной пропускной способности.
Что отдавать команде
- Capacity table.
- Scalability comparison.
- Рекомендации по ресурсам и лимитам.
Частые провалы
- Экстраполировать результат одной точки до любого трафика.
- Масштабировать приложение, когда bottleneck в базе.
- Не учитывать лимиты внешних провайдеров.
Практика
Проведите два запуска: один инстанс API и два инстанса. Сравните throughput, p95 и DB connections. Если throughput не вырос, ищите общий bottleneck.