Окружение, monitoring и метрики нагрузки
Нагрузочный тест без monitoring почти бесполезен: вы узнаете, что пользователю медленно, но не поймёте почему. Нужны метрики приложения, инфраструктуры, базы, очередей, внешних сервисов и самого генератора нагрузки.
Что важно понять
- Сопоставимость окружения с production: ресурсы, конфигурация, данные.
- Метрики сервиса: latency percentiles, errors, saturation, thread pools.
- Инфраструктура: CPU, memory, disk, network, containers, autoscaling.
- DB/queues/cache: slow queries, locks, connections, lag, hit rate.
Рабочий порядок
- Проверьте, что генератор нагрузки не стал bottleneck.
- Настройте dashboards и алерты до запуска.
- Зафиксируйте версии, конфигурации и объём данных.
- Собирайте timestamps, чтобы связать графики между системами.
Что отдавать команде
- Environment readiness checklist.
- Dashboard для теста.
- Снимок конфигурации и ограничений окружения.
Частые провалы
- Сравнивать тестовый стенд с production без поправки на ресурсы.
- Не мониторить генератор нагрузки.
- Не фиксировать изменения конфигурации между запусками.
Практика
Перед запуском составьте список метрик для API, DB, cache и generator. Если метрику негде посмотреть, тест лучше отложить.