Распознавание лиц
В этой статье объясняются концепции и операции распознавания лиц, а также лежащие в их основе структуры данных. В целом распознавание лиц — это процесс проверки или идентификации лиц своими лицами. Распознавание лиц важно в реализации сценария идентификации, который предприятия и приложения могут использовать для проверки того, что пользователь (удаленный) является тем, кто они утверждают.
Операции распознавания лиц
Внимание
Доступ к службе "Распознавание лиц" ограничен на основе соответствия требованиям и критериев использования для реализации поддержки наших принципов ответственного ИИ. Служба "Распознавание лиц" доступна только для клиентов и партнеров, управляемых корпорацией Майкрософт. Используйте форму приема Распознавания лиц, чтобы подать заявку на доступ. Дополнительные сведения см. на странице с ограниченным доступом для лиц.
Создание и обучение PersonGroup
Чтобы сохранить набор людей для сопоставления, необходимо создать PersonGroup или LargePersonGroup. Группы PersonGroup хранят объекты Person, каждый из которых представляет отдельного человека и содержит набор данных о лицах, относящихся к этому человеку.
Операция Train подготавливает набор данных для использования при сравнении данных о лицах.
Идентификация
Операция Identify принимает один или несколько идентификаторов исходных лиц (из объекта DetectedFace или PersistedFace) и PersonGroup или LargePersonGroup. Он возвращает список объектов Person, к которым может принадлежать каждое исходное лицо. Возвращенные объекты Person обертываются как объекты-кандидаты, которые имеют значение достоверности прогноза.
Проверка
Операция Verify принимает один идентификатор лица (из объекта DetectedFace или PersistedFace) и объект Person. Она определяет, принадлежит ли лицо тому же человеку. Проверка является сопоставлением "один к одному" и может использоваться в качестве окончательной проверки результатов вызова API идентификации. Однако также можно передать PersonGroup, к которой принадлежит кандидат Person, для повышения производительности API.
Структуры связанных данных
В операциях распознавания используются в основном следующие структуры данных. Эти объекты хранятся в облаке, и на них можно ссылаться по строкам их идентификаторов. Строки идентификаторов всегда уникальны в пределах подписки, но поля имен могут дублироваться.
См. руководство по структурам данных распознавания лиц.
Требования к входным данным
Воспользуйтесь следующими советами, чтобы убедиться, что ваши входные изображения дают наиболее точные результаты распознавания:
- Поддерживаемые форматы входных изображений: JPEG, PNG, GIF (первый кадр), BMP.
- Размер изображения не должен превышать 6 МБ.
- Некоторые лица могут быть не распознаны из-за композиции фотографий, таких как:
- Образы с экстремальным освещением, например серьезное появление.
- Препятствия, закрывающие один или оба глаза.
- Различия в типе волос или растительности на лице.
- Изменения внешности лица из-за возраста.
- Экстремальная выражения лица.
- Атрибут можно использовать
qualityForRecognition
в операции обнаружения лиц при использовании применимых моделей обнаружения в качестве общего руководства о том, является ли изображение достаточным качеством для попытки распознавания лиц. Для сценариев идентификации рекомендуется использовать только"high"
качественные изображения для регистрации пользователей и качества"medium"
.
Следующие шаги
Теперь, когда вы знакомы с концепциями распознавания лиц, напишите сценарий, который идентифицирует лица по обученной PersonGroup.