Поделиться через


Обнаружение лиц, атрибуты и входные данные

Внимание

Доступ к службе "Распознавание лиц" ограничен на основе соответствия требованиям и критериев использования для реализации поддержки наших принципов ответственного ИИ. Служба "Распознавание лиц" доступна только для клиентов и партнеров, управляемых корпорацией Майкрософт. Используйте форму приема Распознавания лиц, чтобы подать заявку на доступ. Дополнительные сведения см. на странице с ограниченным доступом для лиц.

Внимание

Прогноз атрибутов лица осуществляется с помощью статистических алгоритмов. Они не всегда точны. Будьте внимательны, когда принимаете решения, основываясь на данных атрибутах. Пожалуйста, воздержаться от использования этих атрибутов для защиты от спуфингов. Вместо этого рекомендуется использовать обнаружение Распознавания лиц в реальном времени. Дополнительные сведения см. в руководстве по обнаружению активности лиц.

В этой статье объясняются основные понятия, связанные с определением лиц и данными их атрибутов. Определение лиц — это процесс, который позволяет найти лица людей на изображении и при необходимости с их помощью получить различные сведения.

Api обнаружения используется для обнаружения лиц на изображении. Чтобы приступить к работе с REST API или клиентским пакетом SDK, следуйте краткому руководству по службе распознавания лиц. Кроме того, более подробные инструкции см. в разделе Вызов API распознавания.

Границы лица

Каждое обнаруженное лицо соответствует полю faceRectangle в ответе. Этот набор пиксельных координат левой и верхней сторон, а также ширины и высоты распознанного лица. С помощью этих координат можно получить сведения о расположении лица и его размере. В ответе API лица расположены в списке по размеру — от наибольшего к наименьшему.

Попробуйте возможности обнаружения лиц быстро и легко с помощью Azure AI Vision Studio.

Идентификатор лица

Идентификатор лица — это строка уникального идентификатора для каждого распознанного лица на изображении. Идентификатор лица требует утверждения ограниченного доступа, к которому можно применить, заполнив форму приема. Дополнительные сведения см. на странице "Ограниченный доступ к API распознавания лиц". Вы можете запросить идентификатор лица в вызове API обнаружения .

Ориентиры лица

Ориентиры лица — это ряд легко распознаваемых точек на лице, например зрачки глаз или кончик носа. По умолчанию используются 27 предопределенных точек ориентиров. На следующем рисунке изображены все 27 точек:

Схема лица со всеми 27 ориентирами, помеченными.

Координаты точек получают в пикселях.

Модель Detection_03 в настоящее время имеет наиболее точное определение ориентира. Глаза и зрачки ориентиры, которые она возвращает достаточно точно, чтобы обеспечить отслеживание взгляда лица.

Атрибуты

Внимание

Корпорация Майкрософт отставила или ограничена возможностями распознавания лиц, которые можно использовать для вывода эмоциональных состояний и атрибутов личности, которые, если неправильно используются, могут подвергать людей стереотипиям, дискриминации или несправедливому отказу в обслуживании. Отставные возможности — это эмоции и пол. Ограниченные возможности : возраст, улыбка, волосы, волосы и макияж. По электронной почте API распознавания лиц Azure, если у вас есть ответственный вариант использования, который будет использовать любую из ограниченных возможностей. Дополнительные сведения об этом решении см. здесь.

Атрибуты — это набор функций, которые при необходимости могут быть обнаружены API обнаружения . Можно распознать следующие атрибуты:

  • Аксессуары: указывает, имеет ли данное лицо аксессуары. Этот атрибут возвращает возможные аксессуары, включая голову, очки и маску, с оценкой достоверности от нуля до одного для каждой аксессуары.

  • Размытие: указывает на размытость лица на изображении. Этот атрибут предоставляет значение от нуля до единицы и определяет уровень размытия: низкий, средний или высокий.

  • Экспозиция: указывает на экспозицию лица на изображении. Этот атрибут возвращает значение от нуля до одного и неформального рейтинга under Exposure, good Exposure или over Exposure.

  • Очки: указывает, имеет ли данное лицо очки. Возможные значения: NoGlasses, ReadingGlasses, Sunglasses и Плавать Гоггли.

  • Позу головы: указывает ориентацию лица в трехмерном пространстве. Этот атрибут описывается углами крена, рыскания и тангажа в градусах, которые определяются в соответствии с правилом правой руки. Порядок трех углов — отката до 180 градусов, а диапазон значений каждого угла составляет от -180 градусов до +180 градусов. Трехмерная ориентация лица оценивается по порядку углами крена, рыскания и тангажа. Для сопоставления углов см. следующую диаграмму:

    Схема головы с полем, рулоном и осями, помеченными.

    Дополнительные сведения об использовании этих значений см. в разделе "Использование атрибута HeadPose".

  • Маска: указывает, носит ли лицо маску. Этот атрибут возвращает сведения о возможном типе маски, а также логическое значение, которое определяет, закрывает ли маска нос и рот.

  • Шум: указывает визуальный шум, обнаруженный на изображении лица. Этот атрибут возвращает значение от нуля до одного, а неформальный рейтинг — низкий, средний или высокий.

  • Occlusion: указывает, есть ли объекты, блокирующие части лица. Этот атрибут возвращает логическое значение для eyeOccluded, foreheadOccluded и mouthOccluded.

  • QualityForRecognition: указывает общее качество изображения, чтобы определить, является ли изображение, используемое в обнаружении, достаточное качество для попытки распознавания лиц. Значение атрибута — неформальная оценка: низкое, среднее или высокое качество. Для определения сценариев идентификации рекомендуется использовать только высококачественные изображения, а качество — по сравнению с средним значением.

    Примечание.

    Доступность каждого атрибута зависит от указанной модели обнаружения. Атрибут QualityForRecognition также зависит от модели распознавания, так как в настоящее время она доступна только при использовании сочетания моделей обнаружения detection_01 или detection_03, а также модели распознавания recognition_03 или recognition_04.

Требования к входным данным

Воспользуйтесь следующими советами, чтобы убедиться, что ваши входные изображения дают наиболее точные результаты распознавания:

  • Поддерживаемые форматы входных изображений: JPEG, PNG, GIF (первый кадр), BMP.
  • Размер изображения не должен превышать 6 МБ.
  • Минимальный размер лица, которое может быть распознано, составляет 36 x 36 пикселей в изображении с размером не более 1920 x 1080 пикселей. На изображениях с размером более 1920 x 1080 пикселей распознаваемые лица имеют пропорционально больший размер. Уменьшение размера лица может привести к тому, что некоторые лица не будут обнаружены, даже если они больше минимального размера лица.
  • Максимальный размер распознаваемого лица составляет 4096 х 4096 пикселей.
  • Лица, не входящие в диапазон размера от 36 x 36 до 4096 x 4096 пикселей, не будут распознаны.

Входные данные с информацией о ориентации

Некоторые входные изображения с форматом JPEG могут содержать сведения о ориентации в метаданных файла с обменным форматом изображений (EXIF). Если ориентация EXIF доступна, изображения автоматически поворачиваются на правильную ориентацию перед отправкой для обнаружения лиц. Прямоугольник лица, ориентиры и позы головы для каждого обнаруженного лица оцениваются на основе повернутого изображения.

Чтобы правильно отобразить прямоугольную рамку вокруг лица и ориентиры, необходимо убедиться в том, что изображение повернуто правильно. Большинство средств визуализации изображений автоматически поворачивают изображение в соответствии с его ориентацией EXIF по умолчанию. Для других средств может потребоваться применить поворот с помощью собственного кода. В следующих примерах показана прямоугольная рамка вокруг лица на повернутом изображении (слева) и в неповернутом изображении (справа).

Снимок экрана: два изображения лиц с поворотом и без них.

Входные видео

Если вы обнаруживаете лица из видеопотока, вы можете улучшить производительность, изменив определенные параметры на видеокамере:

  • Сглаживание. Многие видеокамеры обладают эффектом сглаживания. Эту функцию следует отключить, если это возможно, так как она создает размытие между кадрами и понижает четкость изображения.

  • Скорость спуска: более быстрая скорость затвора уменьшает объем движения между кадрами и делает каждый кадр более понятным. Мы рекомендуем установить для скорости затвора частоту 1/60 секунды или выше.

  • Угол затвора: некоторые камеры указывают угол затвора вместо скорости затвора. При возможности следует использовать нижний угол затвора, что приводит к более четкому видеокадру.

    Примечание.

    Датчик камеры с нижним углом затвора получает меньше света в каждом кадре, поэтому изображение темнее. Необходимо определить правильный уровень использования.

Следующий шаг

Теперь, когда вы уже знакомы с основными понятиями о функции определения лиц, узнайте, как написать сценарий, который поможет вам распознать лица на определенном изображении.