Поделиться через


Распознавание лиц

В этой статье объясняются концепции и операции распознавания лиц, а также лежащие в их основе структуры данных. В целом распознавание лиц — это процесс проверки или идентификации лиц своими лицами. Распознавание лиц важно в реализации сценария идентификации, который предприятия и приложения могут использовать для проверки того, что пользователь (удаленный) является тем, кто они утверждают.

Операции распознавания лиц

Внимание

Доступ к службе "Распознавание лиц" ограничен на основе соответствия требованиям и критериев использования для реализации поддержки наших принципов ответственного ИИ. Служба "Распознавание лиц" доступна только для клиентов и партнеров, управляемых корпорацией Майкрософт. Используйте форму приема Распознавания лиц, чтобы подать заявку на доступ. Дополнительные сведения см. на странице с ограниченным доступом для лиц.

Создание и обучение PersonGroup

Чтобы сохранить набор людей для сопоставления, необходимо создать PersonGroup или LargePersonGroup. Группы PersonGroup хранят объекты Person, каждый из которых представляет отдельного человека и содержит набор данных о лицах, относящихся к этому человеку.

Операция Train подготавливает набор данных для использования при сравнении данных о лицах.

Идентификация

Операция Identify принимает один или несколько идентификаторов исходных лиц (из объекта DetectedFace или PersistedFace) и PersonGroup или LargePersonGroup. Он возвращает список объектов Person, к которым может принадлежать каждое исходное лицо. Возвращенные объекты Person обертываются как объекты-кандидаты, которые имеют значение достоверности прогноза.

Проверка

Операция Verify принимает один идентификатор лица (из объекта DetectedFace или PersistedFace) и объект Person. Она определяет, принадлежит ли лицо тому же человеку. Проверка является сопоставлением "один к одному" и может использоваться в качестве окончательной проверки результатов вызова API идентификации. Однако также можно передать PersonGroup, к которой принадлежит кандидат Person, для повышения производительности API.

В операциях распознавания используются в основном следующие структуры данных. Эти объекты хранятся в облаке, и на них можно ссылаться по строкам их идентификаторов. Строки идентификаторов всегда уникальны в пределах подписки, но поля имен могут дублироваться.

См. руководство по структурам данных распознавания лиц.

Требования к входным данным

Воспользуйтесь следующими советами, чтобы убедиться, что ваши входные изображения дают наиболее точные результаты распознавания:

  • Поддерживаемые форматы входных изображений: JPEG, PNG, GIF (первый кадр), BMP.
  • Размер изображения не должен превышать 6 МБ.
  • Некоторые лица могут быть не распознаны из-за композиции фотографий, таких как:
    • Образы с экстремальным освещением, например серьезное появление.
    • Препятствия, закрывающие один или оба глаза.
    • Различия в типе волос или растительности на лице.
    • Изменения внешности лица из-за возраста.
    • Экстремальная выражения лица.
  • Атрибут можно использовать qualityForRecognition в операции обнаружения лиц при использовании применимых моделей обнаружения в качестве общего руководства о том, является ли изображение достаточным качеством для попытки распознавания лиц. Для сценариев идентификации рекомендуется использовать только "high" качественные изображения для регистрации пользователей и качества "medium" .

Следующие шаги

Теперь, когда вы знакомы с концепциями распознавания лиц, напишите сценарий, который идентифицирует лица по обученной PersonGroup.