Выбор домена для проекта «Пользовательское визуальное распознавание»
В этом руководстве показано, как выбрать домен для проекта в службе Пользовательское визуальное распознавание.
На вкладке Параметры проекта на веб-портале Пользовательского визуального распознавания можно выбрать домен модели для проекта. Вы хотите выбрать домен, который ближе всего к вашему сценарию использования. Если для доступа к службе «Пользовательское визуальное распознавание» используется клиентская библиотека или REST API, при создании проекта потребуется указать идентификатор домена. Список идентификаторов доменов можно получить с помощью Get Domains. Или используйте приведенную ниже таблицу.
Домены классификации изображений
Домен | Характер использования |
---|---|
Общие сведения | Рассчитан на самые разные задачи классификации изображений. Если никакие другие домены не подходят или вы не знаете, какой домен выбрать, выберите один из доменов General. Идентификатор: ee85a74c-405e-4adc-bb47-ffa8ca0c9f31 |
General [A1] | Оптимизированы для повышения точности благодаря сравнимому времени вывода как в случае домена General. Рекомендуется для больших наборов данных или более сложных пользовательских сценариев. Этому домена требуется дополнительное время обучения. Идентификатор: a8e3c40f-fb4a-466f-832a-5e457ae4a344 |
General [A2] | Оптимизировано для повышенной точности с более быстрым временем вывода, чем домены General[A1] и General. Рекомендовано для большинства наборов данных. Этому домену требуется меньше времени обучения, чем доменам General[A1] и General. Идентификатор: 2e37d7fb-3a54-486a-b4d6-cfc369af0018 |
Food | Рассчитан для фотографий блюд, которые будут отображаться в меню ресторана. Если вы хотите классифицировать фотографии отдельных фруктов или овощей, используйте домен Food. Идентификатор: c151d5b5-dd07-472a-acc8-15d29dea8518 |
Landmarks | Рассчитан на распознавание естественных и искусственных ориентиров. Этот домен работает лучше всего, когда ориентир четко виден на фотографии. Этот домен работает, даже если ориентир немного заслоняют люди. Идентификатор: ca455789-012d-4b50-9fec-5bb63841c793 |
Розничная торговля | Рассчитан на изображения из каталогов товаров и торговых веб-сайтов. Если требуется высокая точность при распознавании таких объектов, как платья, брюки и рубашки, следует использовать этот домен. Идентификатор: b30a91ae-e3c1-4f73-a81e-c270bff27c39 |
Домены Compact | Оптимизированы для ограничений классификации в режиме реального времени на пограничных устройствах. |
Примечание.
Домены General[A1] и General[A2] можно использовать для широкого набора сценариев и они оптимизированы для точности. Используйте модель General[A2], чтобы улучшить скорость вывода и сократить время обучения. Для больших наборов данных может потребоваться использовать домены General[A1] для визуализации с лучшей точностью, чем у доменов General [A2], хотя это требует больше времени на обучение и вывод. Модель General требует больше времени на вывод, чем General [a1] и General [a2].
Домены обнаружения объектов
Домен | Характер использования |
---|---|
Общие сведения | Рассчитан на самые разные задачи обнаружения объектов. Если не подходит ни один из других доменов или вы не уверены, какой домен выбрать, выбирайте General. Идентификатор: da2e3a8a-40a5-4171-82f4-58522f70fbc1 |
General [A1] | Оптимизированы для повышения точности благодаря сравнимому времени вывода как в случае домена General. Рекомендованы для более точного определения местоположения региона, больших наборов данных или более сложных пользовательских сценариев. Этому домену требуется дополнительное время обучения, а результаты не детерминированные: предполагается, что разница в значении +-1 % средней точности (mAP) с теми же предоставленными данными обучения. Идентификатор: 9c616dff-2e7d-ea11-af59-1866da359ce6 |
Логотип | Оптимизировано для поиска марочных логотипов в изображениях. Идентификатор: 1d8ffafe-ec40-4fb2-8f90-72b3b6cecea4 |
Продукты на полках | Оптимизировано для обнаружения и классификации продуктов на полках. Идентификатор: 3780a898-81c3-4516-81ae-3a139614e1f3 |
Домены Compact | Оптимизированы для ограничений обнаружения объектов в режиме реального времени на пограничных устройствах. |
Домены Compact
Модели, созданные доменами Compact, можно экспортировать для локального запуска. В API общедоступной предварительной версии службы «Пользовательское визуальное распознавание» 3.4 можно получить список экспортируемых платформ для компактных доменов, вызвав API-интерфейс GetDomains.
Все перечисленные ниже домены поддерживают экспорт в форматах ONNX, TensorFlow,TensorFlowLite, TensorFlow.js, CoreML, и VAIDK, за исключением того, что General (Compact) домен обнаружения объектов не поддерживает VAIDK.
Производительность модели зависит от выбранного домена. В таблице ниже указываются размеры моделей и время вывода с ЦП Intel для настольных ПК и NVidia GPU [1]. Эти числа не включают предварительную и последующую обработку.
Задача | Домен | Идентификатор | Размер модели | Время вывода ЦП | Время вывода GPU |
---|---|---|---|---|---|
Классификация | Общее (компактно) | 0732100f-1a38-4e49-a514-c9b44c697ab5 |
6 МБ | 10 мс | 5 мс |
Классификация | General (compact) [S1] (Общий (компактный)) [S1] | a1db07ca-a19a-4830-bae8-e004a42dc863 |
43 МБ | 50 мс | 5 мс |
Обнаружение объектов | Общее (компактно) | a27d5ca5-bb19-49d8-a70a-fec086c47f5b |
45 МБ | 35 мс | 5 мс |
Обнаружение объектов | General (compact) [S1] (Общий (компактный)) [S1] | 7ec2ac80-887b-48a6-8df9-8b1357765430 |
14 МБ | 27 мс | 7 мс |
Примечание.
Для обнаружения объектов общего (компактного) домена требуется специальная логика после обработки. Дополнительные сведения см. в примере сценария в экспортированном ZIP-пакете. Если необходима модель без логики постобработки, используйте General (compact) [S1].
Внимание
Нет никакой гарантии, что экспортированные модели дают точно тот же результат, что и API-интерфейс прогнозирования в облаке. Небольшая разница в реализации выполняющейся платформы или предварительной обработки может привести к увеличению разницы в выходных данных модели. Подробные сведения о логике предварительной обработки см. в этом документе.
[1] процессор Intel Xeon E5-2690 и NVIDIA Tesla M60
Следующие шаги
Следуйте краткому руководству, чтобы приступить к созданию и обучению проекта Пользовательского визуального распознавания.