Поделиться через


Обнаружение лиц, атрибуты и входные данные

Внимание

Доступ к службе "Распознавание лиц" ограничен на основе соответствия требованиям и критериев использования для реализации поддержки наших принципов ответственного ИИ. Служба "Распознавание лиц" доступна только для клиентов и партнеров, управляемых корпорацией Майкрософт. Используйте форму приема Распознавания лиц, чтобы подать заявку на доступ. Для получения дополнительной информации см. страницу Ограниченный доступ.

Внимание

Атрибуты лица прогнозируются статистическими алгоритмами. Они не всегда точны. Будьте внимательны, когда принимаете решения, основываясь на данных атрибутах. Воздержаться от использования этих атрибутов для защиты от спуфингов. Вместо этого рекомендуется использовать обнаружение Распознавания лиц в реальном времени. Дополнительные сведения см. в руководстве по обнаружению активности лиц.

В этой статье объясняются основные понятия, связанные с определением лиц и данными их атрибутов. Распознавание лиц — это процесс поиска лиц людей на изображении и, при необходимости, возвращающий различные виды данных, относящихся к лицам.

Вы используете Detect API, чтобы обнаружить лица на изображении. Чтобы приступить к работе с REST API или клиентским пакетом SDK, следуйте краткому руководству по службе распознавания лиц. Кроме того, подробное руководство см. в разделе "Вызов API обнаружения".

Прямоугольник лица

Каждое обнаруженное лицо соответствует полю faceRectangle в ответе. Это набор координат в пикселях для левой, верхней точек, ширины и высоты распознанного лица. С помощью этих координат можно получить сведения о расположении лица и его размере. В ответе API лица расположены в списке по размеру — от наибольшего к наименьшему.

Попробуйте возможности обнаружения лиц быстро и легко с помощью Azure AI Vision Studio.

Идентификатор лица

Идентификатор лица — это строка уникального идентификатора для каждого распознанного лица на изображении. Face ID требует одобрения для ограниченного доступа, которое можно получить, заполнив форму запроса. Дополнительные сведения см. на странице "Ограниченный доступ к API распознавания лиц". Вы можете запросить идентификатор лица в вызове API обнаружения .

Контрольные точки лица

Ориентиры лица — это ряд легко распознаваемых точек на лице, например зрачки глаз или кончик носа. По умолчанию используются 27 предопределенных точек ориентиров. На следующем рисунке изображены все 27 точек:

Схема лица с обозначением всех 27 точек.

Координаты точек возвращаются в единицах пикселей.

Модель Detection_03 в настоящее время имеет наиболее точное определение ориентира. Ориентиры глаза и зрачка, которые возвращаются достаточно точно, чтобы обеспечить отслеживание направления взгляда на лице.

Атрибуты

Внимание

Корпорация Майкрософт отказалась от или ограничила возможности распознавания лиц, которые можно использовать для выявления эмоциональных состояний и атрибутов личности, что, в случае неправильного использования, может подвергнуть людей стереотипам, дискриминации или несправедливому отказу в предоставлении услуг. Устаревшие возможности — это эмоции и гендер. Ограниченные возможности: возраст, улыбка, растительность на лице, волосы и макияж. Напишите команде лицевой системы Azure, если у вас есть ответственный вариант использования, который может быть использован с любыми из ограниченных возможностей. Дополнительные сведения об этом решении см. здесь.

Атрибуты — это набор функций, которые при необходимости могут быть обнаружены API обнаружения . Можно распознать следующие атрибуты:

  • Аксессуары: указывает, имеет ли данное лицо аксессуары. Этот атрибут возвращает возможные аксессуары, включая головные уборы, очки и маску, с уровнем уверенности от нуля до одного для каждого аксессуара.

  • Размытие: указывает на размытость лица на изображении. Этот атрибут предоставляет значение от нуля до единицы и неформальную оценку: низкий, средний или высокий.

  • Экспозиция: указывает на экспозицию лица на изображении. Этот атрибут возвращает значение от нуля до одного и неформальную оценку underExposure, goodExposure или overExposure.

  • Очки: указывает, имеет ли данное лицо очки. Возможные значения: Без очков, Очки для чтения, Солнечные очки и Плавательные очки.

  • Позу головы: указывает ориентацию лица в трехмерном пространстве. Этот атрибут описывается углами крена, тангажа и рыскания, выраженными в градусах, которые определяются в соответствии с правилом правой руки. Порядок трех углов — крен, рыскание, тангаж, и диапазон значений каждого угла составляет от -180 градусов до +180 градусов. Трехмерная ориентация лица оценивается по порядку углами крена, рыскания и тангажа. Для сопоставления углов см. следующую диаграмму:

    Схема головы с обозначенными осями тангажа, крена и рыскания.

    Дополнительные сведения об использовании этих значений см. в разделе "Использование атрибута HeadPose".

  • Маска: указывает, носит ли лицо маску. Этот атрибут возвращает сведения о возможном типе маски, а также логическое значение, которое определяет, закрывает ли маска нос и рот.

  • Шум: указывает визуальный шум, обнаруженный на изображении лица. Этот атрибут возвращает значение от нуля до одного, а неформальный рейтинг — низкий, средний или высокий.

  • Occlusion: указывает, есть ли объекты, блокирующие части лица. Этот атрибут возвращает логическое значение для закрытых глаз, закрытого лба и закрытого рта.

  • QualityForRecognition: указывает общее качество изображения, чтобы определить, является ли изображение, используемое в обнаружении, достаточное качество для попытки распознавания лиц. Значение — неофициальная оценка: низкий, средний или высокий уровень. Для регистрации пользователей рекомендуется использовать только высококачественные изображения, а для сценариев идентификации рекомендуется качество не ниже среднего.

    Примечание.

    Доступность каждого атрибута зависит от указанной модели обнаружения. Атрибут QualityForRecognition также зависит от модели распознавания, так как в настоящее время она доступна только при использовании сочетания моделей обнаружения detection_01 или detection_03, а также модели распознавания recognition_03 или recognition_04.

Требования к входным данным

Воспользуйтесь следующими советами, чтобы убедиться, что ваши входные изображения дают наиболее точные результаты распознавания:

  • Поддерживаемые форматы входных изображений: JPEG, PNG, GIF (первый кадр), BMP.
  • Размер изображения не должен превышать 6 МБ.
  • Минимальный размер лица, которое может быть распознано, составляет 36 x 36 пикселей в изображении с размером не более 1920 x 1080 пикселей. На изображениях с размером более 1920 x 1080 пикселей минимальный размер лица пропорционально больше. Уменьшение размера лица может привести к тому, что некоторые лица не будут обнаружены, даже если они больше минимального размера лица.
  • Максимальный размер распознаваемого лица составляет 4096 х 4096 пикселей.
  • Лица, не входящие в диапазон размера от 36 x 36 до 4096 x 4096 пикселей, не будут распознаны.

Входные данные с информацией о ориентации

Некоторые входные изображения с форматом JPEG могут содержать сведения о ориентации в метаданных файла с обменным форматом изображений (EXIF). Если ориентация EXIF доступна, изображения автоматически поворачиваются на правильную ориентацию перед отправкой для обнаружения лиц. Прямоугольник лица, ключевые точки и положение головы для каждого обнаруженного лица оцениваются на основе повернутого изображения.

Чтобы правильно отобразить прямоугольную рамку вокруг лица и ориентиры, необходимо убедиться в том, что изображение повернуто правильно. Большинство средств визуализации изображений автоматически поворачивают изображение в соответствии с его ориентацией EXIF по умолчанию. Для других инструментов, возможно, потребуется применить поворот с использованием вашего собственного кода. В следующих примерах показан прямоугольник лица на повернутом изображении (слева) и на неповернутом изображении (справа).

Снимок экрана двух изображений лиц с поворотом и без поворота.

Видеовход

Если вы обнаруживаете лица из видеопотока, вы можете улучшить производительность, изменив определенные параметры на видеокамере:

  • Сглаживание. Многие видеокамеры обладают эффектом сглаживания. Эту функцию следует отключить, если это возможно, так как она создает размытие между кадрами и понижает четкость изображения.

  • Скорость спуска: более быстрая скорость затвора уменьшает объем движения между кадрами и делает каждый кадр более понятным. Мы рекомендуем установить для скорости затвора частоту 1/60 секунды или выше.

  • Угол затвора: некоторые камеры указывают угол затвора вместо скорости затвора. При возможности следует использовать нижний угол затвора, что приводит к более четкому видеокадру.

    Примечание.

    Датчик камеры с нижним углом затвора получает меньше света в каждом кадре, поэтому изображение темнее. Необходимо определить правильный уровень использования.

Следующий шаг

Теперь, когда вы уже знакомы с основными понятиями о функции определения лиц, узнайте, как написать сценарий, который поможет вам распознать лица на определенном изображении.