Производительность CARS_API#
В данном разделе представлены значения результатов тестирования CARS_API для разных конфигураций оборудования сервера.
Инструкция AVX2 процессора обязательна при выполнении вычислений на мощностях процессора.
Рекомендуется устанавливать процессор с набором инструкций: AVX512, VNNI. При наличии данных инструкций инференс нейросетей значительно меньше по времени, за счет чего увеличивается количество запросов (RPS), которые успевает обрабатывать CARS API.
Конфигурация сервера#
Эффективность распознавания атрибутов ТС и ГРЗ зависит от параметров входного изображения:
- Размер изображения;
- Количество бит на один цвет.
Тестирование проводилось для изображений, имеющих следующие характеристики:
- Разрешение изображения ТС: 500х439 px;
- Разрешение изображения ГРЗ: 117x33 px;
- Формат исходных изображений: jpeg.
Таблица 52. Параметры тестового сервера
| № | Параметр | Значение |
|---|---|---|
| 1 | CPU | Model name: Intel(R) Xeon(R) Gold 6240R CPU, Thread(s) per core: 2, Core(s) per socket: 24, Socket(s): 2 |
| 2 | Частота CPU | 2.40GHz |
| 3 | Оперативная память | 394Gb |
| 4 | Видеопамять | 15360MiB |
| 5 | Операционная система | CentOS 8 |
Измерения производительности CARS_API представлены для нескольких типов ускорителей.
Таблица 53. Описание параметров ускорителей при тестировании
| Параметр | Описание |
|---|---|
| AVX2 | Запуск CARS_API на сервере с CPU c поддержкой инструкций AVX512 и VNNI |
| GPU | Запуск CARS_API на сервере с GPU |
Обратите внимание! Поддержка работы на GPU
Работа на GPU поддерживается только на видеокартах NVIDIA с установленными драйверами и NVIDIA Container Toolkit. Вам нужно установить драйверы NVIDIA и NVIDIA Container Toolkit. Подробную инструкцию по установке можно найти на официальном сайте NVIDIA.
GPU-карты ниже Turing-архитектуры и старше Ada-архитектуры не поддерживаются.
Представленные в настоящем руководстве значения являются средними величинами, полученными по итогам проведения не менее 100 экспериментов. В экспериментах по определению атрибутов ТС и ГРЗ, перечисленных в таблице ниже, использовались все доступные ядра центрального процессора.
Результаты проведения тестирования производительности#
Тестирование проводилось с использованием следующих классификаторов:
- featured_vehicle_type;
- vehicle_orientation_v1;
- detailed_vehicle_color;
- detailed_vehicle_emergency_v2;
- special_transport_type;
- public_transport_type;
- vehicle_axles;
- car_brand_model_v2;
- grz_all_countries.
Запрос /classify для классификаторов#
Таблица 54. Результаты тестирования для запроса /classify
| Параметр | AVX2 | GPU |
|---|---|---|
| RPS (transactions/s) | 18.84 | 32.31 |
| Response time (ms) | 424.34 | 247.43 |
Запрос /detector с параметром cars, /detector с параметром grz и /classify для классификаторов#
Таблица 55. Результаты тестирования для запроса /detector с параметром cars, /detector с параметром grz и /classify для классификаторов
| Параметр | AVX2 | GPU |
|---|---|---|
| Total RPS (transactions/s) | 40.24 | 74.75 |
| Total CARS Response time (ms) | 198.33 | 106.89 |
| Classify RPS (transactions/s) | 13.45 | 24.96 |
| Classify CARS Response time (ms) | 428.63 | 193.35 |
| Detect car RPS (transactions/s) | 13.46 | 24.95 |
| Detect car CARS Response time (ms) | 99.08 | 82.02 |
| Detect grz RPS (transactions/s) | 13.48 | 24.98 |
| Detect grz CARS Response time (ms) | 67.34 | 45.30 |