Deteção de rosto, atributos e dados de entrada

Artigo
11/15/2023

Atenção

O acesso ao serviço presencial é limitado com base em critérios de elegibilidade e uso, a fim de apoiar nossos princípios de IA responsável. O serviço Face só está disponível para clientes e parceiros geridos pela Microsoft. Use o formulário de admissão de Reconhecimento Facial para solicitar acesso. Para obter mais informações, consulte a página Acesso limitado Face.

Importante

Os atributos faciais são previstos através do uso de algoritmos estatísticos. Podem nem sempre ser precisas. Tenha cuidado ao tomar decisões com base em dados de atributos. Por favor, evite usar esses atributos para anti-falsificação. Em vez disso, recomendamos o uso da deteção de vivacidade facial. Para obter mais informações, consulte Tutorial : Detetar vivacidade em rostos.

Este artigo explica os conceitos de deteção de rosto e dados de atributos faciais. A deteção de rosto é o processo de localizar rostos humanos em uma imagem e, opcionalmente, retornar diferentes tipos de dados relacionados ao rosto.

Use a API Face - Detect para detetar rostos em uma imagem. Para começar a usar a API REST ou um SDK de cliente, siga um início rápido. Ou, para obter um guia mais detalhado, consulte Chamar a API de deteção.

Retângulo facial

Cada face detetada corresponde a um faceRectangle campo na resposta. Este é um conjunto de coordenadas de pixel para a esquerda, topo, largura e altura da face detetada. Usando essas coordenadas, você pode obter a localização e o tamanho do rosto. Na resposta da API, os rostos são listados em ordem de tamanho, do maior para o menor.

Experimente os recursos de deteção de rosto de forma rápida e fácil usando o Vision Studio.

Experimente o Vision Studio

ID do rosto

O ID do rosto é uma cadeia de caracteres de identificador exclusivo para cada face detetada em uma imagem. O Face ID requer aprovação de acesso limitado, que você pode solicitar preenchendo o formulário de admissão. Para obter mais informações, consulte a página Acesso limitado Face. Você pode solicitar um ID facial em sua chamada Face - Detect API.

Pontos de referência do rosto

Pontos de referência faciais são um conjunto de pontos fáceis de encontrar em um rosto, como as pupilas ou a ponta do nariz. Por predefinição, existem 27 pontos de referência predefinidos. A figura a seguir mostra todos os 27 pontos:

A face diagram with all 27 landmarks labeled

As coordenadas dos pontos são retornadas em unidades de pixels.

O modelo Detection_03 atualmente tem a deteção de marco mais precisa. Os pontos de referência do olho e da pupila que ele retorna são precisos o suficiente para permitir o rastreamento do olhar do rosto.

Atributos

Atenção

A Microsoft aposentou os recursos de reconhecimento facial que podem ser usados para tentar inferir estados emocionais e atributos de identidade que, se usados indevidamente, podem sujeitar as pessoas a estereótipos, discriminação ou negação injusta de serviços. Estes incluem capacidades que predizem emoção, sexo, idade, sorriso, pelos faciais, cabelo e maquilhagem. Leia mais sobre esta decisão aqui.

Os atributos são um conjunto de recursos que podem ser detetados opcionalmente pela API Face - Detect. Os seguintes atributos podem ser detetados:

Acessórios. Indica se o rosto dado tem acessórios. Esse atributo retorna possíveis acessórios, incluindo headwear, óculos e máscara, com pontuação de confiança entre zero e um para cada acessório.
Desfoque. A desfocagem do rosto na imagem. Esse atributo retorna um valor entre zero e um e uma classificação informal de baixo, médio ou alto.
Exposição. A exposição do rosto na imagem. Esse atributo retorna um valor entre zero e um e uma classificação informal de underExposure, goodExposure ou overExposure.
Óculos. Se o rosto dado tem óculos. Os valores possíveis são NoGlasses, ReadingGlasses, Sunglasses e Swimming Goggles.
Pose de cabeça. A orientação do rosto no espaço 3D. Este atributo é descrito pelos ângulos de rolagem, bocejo e passo em graus, que são definidos de acordo com a regra da mão direita. A ordem dos três ângulos é roll-yaw-pitch, e o intervalo de valores de cada ângulo é de -180 graus a 180 graus. A orientação 3D da face é estimada pelos ângulos de rolo, bocejo e passo em ordem. Consulte o diagrama a seguir para mapeamentos angulares:

Para obter mais informações sobre como usar esses valores, consulte o guia de instruções da pose de cabeça.
Máscara. Indica se o rosto está usando máscara. Esse atributo retorna um possível tipo de máscara e um valor booleano para indicar se o nariz e a boca estão cobertos.
Ruído. O ruído visual detetado na imagem do rosto. Esse atributo retorna um valor entre zero e um e uma classificação informal de baixo, médio ou alto.
Oclusão. Indica se há objetos bloqueando partes do rosto. Este atributo retorna um valor booleano para eyeOccluded, foreheadOcclud, e mouthOccluded.
QualityForRecognition A qualidade geral da imagem em relação a se a imagem que está sendo usada na deteção é de qualidade suficiente para tentar o reconhecimento facial. O valor é uma classificação informal de baixo, médio ou alto. Apenas imagens de "alta" qualidade são recomendadas para inscrição de pessoas, e qualidade igual ou superior a "média" é recomendada para cenários de identificação.

Nota

A disponibilidade de cada atributo depende do modelo de deteção especificado. O atributo QualityForRecognition também depende do modelo de reconhecimento, pois atualmente só está disponível quando se usa uma combinação de detection_01 ou detection_03 de modelo de deteção e recognition_03 ou recognition_04 de modelo de reconhecimento.

Requisitos de entrada

Use as seguintes dicas para garantir que suas imagens de entrada forneçam os resultados de deteção mais precisos:

Os formatos de imagem de entrada suportados são JPEG, PNG, GIF (o primeiro quadro), BMP.
O tamanho do arquivo de imagem não deve ser maior que 6 MB.

O tamanho mínimo detetável da face é de 36 x 36 pixels em uma imagem que não é maior do que 1920 x 1080 pixels. Imagens com mais de 1920 x 1080 pixels têm um tamanho mínimo de rosto proporcionalmente maior. Reduzir o tamanho do rosto pode fazer com que alguns rostos não sejam detetados, mesmo que sejam maiores do que o tamanho mínimo detetável do rosto.
O tamanho máximo detetável do rosto é de 4096 x 4096 pixels.
Rostos fora da faixa de tamanho de 36 x 36 a 4096 x 4096 pixels não serão detetados.

Dados de entrada com informações de orientação:

Algumas imagens de entrada com formato JPEG podem conter informações de orientação em metadados EXIF (Exchangeable image file format). Se a orientação EXIF estiver disponível, as imagens são automaticamente giradas para a orientação correta antes de serem enviadas para deteção facial. O retângulo facial, os pontos de referência e a pose da cabeça para cada rosto detetado são estimados com base na imagem girada.

Para exibir corretamente o retângulo facial e os pontos de referência, você precisa se certificar de que a imagem está girada corretamente. A maioria das ferramentas de visualização de imagem gira automaticamente a imagem de acordo com sua orientação EXIF por padrão. Para outras ferramentas, talvez seja necessário aplicar a rotação usando seu próprio código. Os exemplos a seguir mostram um retângulo facial em uma imagem girada (esquerda) e uma imagem não girada (direita).

Two face images with and without rotation

Entrada de vídeo

Se estiver a detetar rostos a partir de um feed de vídeo, poderá melhorar o desempenho ajustando determinadas definições na sua câmara de vídeo:

Suavização: Muitas câmeras de vídeo aplicam um efeito de suavização. Você deve desativar isso se puder, porque cria um desfoque entre quadros e reduz a clareza.
Velocidade do obturador: Uma velocidade do obturador mais rápida reduz a quantidade de movimento entre quadros e torna cada quadro mais claro. Recomendamos velocidades do obturador de 1/60 segundo ou mais rápidas.
Ângulo do obturador: Algumas câmaras especificam o ângulo do obturador em vez da velocidade do obturador. Se possível, deve utilizar um ângulo do obturador mais baixo. Isso resulta em quadros de vídeo mais claros.

Nota

Uma câmara com um ângulo do obturador mais baixo receberá menos luz em cada fotograma, pelo que a imagem ficará mais escura. Você precisará determinar o nível certo a ser usado.

Próximos passos

Agora que você está familiarizado com os conceitos de deteção de rosto, aprenda a escrever um script que deteta rostos em uma determinada imagem.

Chamar a API de deteção