Бөлісу құралы:


Выбор домена для проекта «Пользовательское визуальное распознавание»

В этом руководстве показано, как выбрать домен для проекта в службе Пользовательское визуальное распознавание.

На вкладке Параметры проекта на веб-портале Пользовательского визуального распознавания можно выбрать домен модели для проекта. Вы хотите выбрать домен, который ближе всего к вашему сценарию использования. Если для доступа к службе «Пользовательское визуальное распознавание» используется клиентская библиотека или REST API, при создании проекта потребуется указать идентификатор домена. Список идентификаторов доменов можно получить с помощью Get Domains. Или используйте приведенную ниже таблицу.

Домены классификации изображений

Домен Характер использования
Общие сведения Рассчитан на самые разные задачи классификации изображений. Если никакие другие домены не подходят или вы не знаете, какой домен выбрать, выберите один из доменов General. Идентификатор: ee85a74c-405e-4adc-bb47-ffa8ca0c9f31
General [A1] Оптимизированы для повышения точности благодаря сравнимому времени вывода как в случае домена General. Рекомендуется для больших наборов данных или более сложных пользовательских сценариев. Этому домена требуется дополнительное время обучения. Идентификатор: a8e3c40f-fb4a-466f-832a-5e457ae4a344
General [A2] Оптимизировано для повышенной точности с более быстрым временем вывода, чем домены General[A1] и General. Рекомендовано для большинства наборов данных. Этому домену требуется меньше времени обучения, чем доменам General[A1] и General. Идентификатор: 2e37d7fb-3a54-486a-b4d6-cfc369af0018
Food Рассчитан для фотографий блюд, которые будут отображаться в меню ресторана. Если вы хотите классифицировать фотографии отдельных фруктов или овощей, используйте домен Food. Идентификатор: c151d5b5-dd07-472a-acc8-15d29dea8518
Landmarks Рассчитан на распознавание естественных и искусственных ориентиров. Этот домен работает лучше всего, когда ориентир четко виден на фотографии. Этот домен работает, даже если ориентир немного заслоняют люди. Идентификатор: ca455789-012d-4b50-9fec-5bb63841c793
Розничная торговля Рассчитан на изображения из каталогов товаров и торговых веб-сайтов. Если требуется высокая точность при распознавании таких объектов, как платья, брюки и рубашки, следует использовать этот домен. Идентификатор: b30a91ae-e3c1-4f73-a81e-c270bff27c39
Домены Compact Оптимизированы для ограничений классификации в режиме реального времени на пограничных устройствах.

Примечание.

Домены General[A1] и General[A2] можно использовать для широкого набора сценариев и они оптимизированы для точности. Используйте модель General[A2], чтобы улучшить скорость вывода и сократить время обучения. Для больших наборов данных может потребоваться использовать домены General[A1] для визуализации с лучшей точностью, чем у доменов General [A2], хотя это требует больше времени на обучение и вывод. Модель General требует больше времени на вывод, чем General [a1] и General [a2].

Домены обнаружения объектов

Домен Характер использования
Общие сведения Рассчитан на самые разные задачи обнаружения объектов. Если не подходит ни один из других доменов или вы не уверены, какой домен выбрать, выбирайте General. Идентификатор: da2e3a8a-40a5-4171-82f4-58522f70fbc1
General [A1] Оптимизированы для повышения точности благодаря сравнимому времени вывода как в случае домена General. Рекомендованы для более точного определения местоположения региона, больших наборов данных или более сложных пользовательских сценариев. Этому домену требуется дополнительное время обучения, а результаты не детерминированные: предполагается, что разница в значении +-1 % средней точности (mAP) с теми же предоставленными данными обучения. Идентификатор: 9c616dff-2e7d-ea11-af59-1866da359ce6
Логотип Оптимизировано для поиска марочных логотипов в изображениях. Идентификатор: 1d8ffafe-ec40-4fb2-8f90-72b3b6cecea4
Продукты на полках Оптимизировано для обнаружения и классификации продуктов на полках. Идентификатор: 3780a898-81c3-4516-81ae-3a139614e1f3
Домены Compact Оптимизированы для ограничений обнаружения объектов в режиме реального времени на пограничных устройствах.

Домены Compact

Модели, созданные доменами Compact, можно экспортировать для локального запуска. В API общедоступной предварительной версии службы «Пользовательское визуальное распознавание» 3.4 можно получить список экспортируемых платформ для компактных доменов, вызвав API-интерфейс GetDomains.

Все перечисленные ниже домены поддерживают экспорт в форматах ONNX, TensorFlow,TensorFlowLite, TensorFlow.js, CoreML, и VAIDK, за исключением того, что General (Compact) домен обнаружения объектов не поддерживает VAIDK.

Производительность модели зависит от выбранного домена. В таблице ниже указываются размеры моделей и время вывода с ЦП Intel для настольных ПК и NVidia GPU [1]. Эти числа не включают предварительную и последующую обработку.

Задача Домен Идентификатор Размер модели Время вывода ЦП Время вывода GPU
Классификация Общее (компактно) 0732100f-1a38-4e49-a514-c9b44c697ab5 6 МБ 10 мс 5 мс
Классификация General (compact) [S1] (Общий (компактный)) [S1] a1db07ca-a19a-4830-bae8-e004a42dc863 43 МБ 50 мс 5 мс
Обнаружение объектов Общее (компактно) a27d5ca5-bb19-49d8-a70a-fec086c47f5b 45 МБ 35 мс 5 мс
Обнаружение объектов General (compact) [S1] (Общий (компактный)) [S1] 7ec2ac80-887b-48a6-8df9-8b1357765430 14 МБ 27 мс 7 мс

Примечание.

Для обнаружения объектов общего (компактного) домена требуется специальная логика после обработки. Дополнительные сведения см. в примере сценария в экспортированном ZIP-пакете. Если необходима модель без логики постобработки, используйте General (compact) [S1].

Внимание

Нет никакой гарантии, что экспортированные модели дают точно тот же результат, что и API-интерфейс прогнозирования в облаке. Небольшая разница в реализации выполняющейся платформы или предварительной обработки может привести к увеличению разницы в выходных данных модели. Подробные сведения о логике предварительной обработки см. в этом документе.

[1] процессор Intel Xeon E5-2690 и NVIDIA Tesla M60

Следующие шаги

Следуйте краткому руководству, чтобы приступить к созданию и обучению проекта Пользовательского визуального распознавания.