Распознавание лиц

Статья
02/14/2024

В этой статье объясняются концепции и операции распознавания лиц, а также лежащие в их основе структуры данных. В целом распознавание лиц — это процесс проверки или идентификации лиц своими лицами. Распознавание лиц важно в реализации сценария идентификации, который предприятия и приложения могут использовать для проверки того, что пользователь (удаленный) является тем, кто они утверждают.

Вы можете легко и быстро опробовать возможности распознавания лиц с помощью Vision Studio.

Попробовать Vision Studio

Операции распознавания лиц

Внимание

Доступ к службе "Распознавание лиц" ограничен на основе соответствия требованиям и критериев использования для реализации поддержки наших принципов ответственного ИИ. Служба "Распознавание лиц" доступна только для клиентов и партнеров, управляемых корпорацией Майкрософт. Используйте форму приема Распознавания лиц, чтобы подать заявку на доступ. Дополнительные сведения см. на странице с ограниченным доступом для лиц.

Создание и обучение PersonGroup

Чтобы сохранить набор людей для сопоставления, необходимо создать PersonGroup или LargePersonGroup. Группы PersonGroup хранят объекты Person, каждый из которых представляет отдельного человека и содержит набор данных о лицах, относящихся к этому человеку.

Операция Train подготавливает набор данных для использования при сравнении данных о лицах.

Идентификация

Операция Identify принимает один или несколько идентификаторов исходных лиц (из объекта DetectedFace или PersistedFace) и PersonGroup или LargePersonGroup. Он возвращает список объектов Person, к которым может принадлежать каждое исходное лицо. Возвращенные объекты Person обертываются как объекты-кандидаты, которые имеют значение достоверности прогноза.

Проверка

Операция Verify принимает один идентификатор лица (из объекта DetectedFace или PersistedFace) и объект Person. Она определяет, принадлежит ли лицо тому же человеку. Проверка является сопоставлением "один к одному" и может использоваться в качестве окончательной проверки результатов вызова API идентификации. Однако также можно передать PersonGroup, к которой принадлежит кандидат Person, для повышения производительности API.

В операциях распознавания используются в основном следующие структуры данных. Эти объекты хранятся в облаке, и на них можно ссылаться по строкам их идентификаторов. Строки идентификаторов всегда уникальны в пределах подписки, но поля имен могут дублироваться.

См. руководство по структурам данных распознавания лиц.

Требования к входным данным

Воспользуйтесь следующими советами, чтобы убедиться, что ваши входные изображения дают наиболее точные результаты распознавания:

Поддерживаемые форматы входных изображений: JPEG, PNG, GIF (первый кадр), BMP.
Размер изображения не должен превышать 6 МБ.

Некоторые лица могут быть не распознаны из-за композиции фотографий, таких как:
- Образы с экстремальным освещением, например серьезное появление.
- Препятствия, закрывающие один или оба глаза.
- Различия в типе волос или растительности на лице.
- Изменения внешности лица из-за возраста.
- Экстремальная выражения лица.

Атрибут можно использовать qualityForRecognition в операции обнаружения лиц при использовании применимых моделей обнаружения в качестве общего руководства о том, является ли изображение достаточным качеством для попытки распознавания лиц. Для сценариев идентификации рекомендуется использовать только "high" качественные изображения для регистрации пользователей и качества "medium" .

Следующие шаги

Теперь, когда вы знакомы с концепциями распознавания лиц, напишите сценарий, который идентифицирует лица по обученной PersonGroup.

Краткое руководство по распознаванию лиц