얼굴 감지 및 특성

주의

Face 서비스 액세스는 책임 있는 AI 원칙을 지원하기 위해 자격 및 사용 기준에 따라 제한됩니다. Face 서비스는 Microsoft 관리 고객 및 파트너만 사용할 수 있습니다. 얼굴 인식 접수 양식을 사용하여 액세스를 적용합니다. 자세한 내용은 Face 제한된 액세스 페이지를 참조하세요.

이 문서에서는 얼굴 감지 및 얼굴 특성 데이터의 개념을 설명합니다. 얼굴 감지는 이미지에서 사람 얼굴을 찾고 필요에 따라 여러 종류의 얼굴 관련 데이터를 반환하는 프로세스입니다.

얼굴 - 감지 API를 사용하여 이미지에서 얼굴을 감지합니다. REST API 또는 클라이언트 SDK 사용을 시작하려면 빠른 시작을 따릅니다. 또는 자세한 가이드는 감지 API 호출을 참조하세요.

얼굴 사각형

각 감지된 얼굴은 응답의 faceRectangle 필드에 해당합니다. 이는 감지된 얼굴의 왼쪽, 위쪽, 너비, 높이에 대한 픽셀 좌표 세트입니다. 이 좌표를 사용하여 얼굴의 위치와 크기를 확인할 수 있습니다. API 응답에서 얼굴은 가장 큰 크기에서 가장 작은 크기 순으로 나열됩니다.

Vision Studio를 사용하여 빠르고 쉽게 얼굴 감지 기능을 사용해 보세요.

Face ID(얼굴 ID)

얼굴 ID는 이미지에서 감지된 각 얼굴에 대한 고유 식별자 문자열입니다. Face ID에는 제한된 액세스 승인이 필요하며, 이 승인은 유입 양식을 작성하여 신청할 수 있습니다. 자세한 내용은 Face 제한된 액세스 페이지를 참조하세요. 얼굴 - 감지 API 호출에서 얼굴 ID를 요청할 수 있습니다.

얼굴 이정표

얼굴 이정표는 눈동자나 코끝과 같이 얼굴에서 찾기 쉬운 지점의 집합입니다. 기본적으로 27개의 이정표 지점이 사전 정의되어 있습니다. 다음 그림은 27개의 지점을 모두 보여줍니다.

27개의 이정표에 모두 레이블이 지정되어 있는 얼굴 다이어그램

지점의 좌표는 픽셀 단위로 반환됩니다.

Detection_03 모델에는 현재 가장 정확한 랜드마크 검색 기능이 있습니다. 반환하는 눈과 동공 랜드마크는 얼굴의 시선 추적을 가능하게 할 만큼 충분히 정확합니다.

특성

주의

Microsoft는 오용될 경우 고정관념, 차별 또는 불공정한 서비스 거부의 대상이 될 수 있는 감정 상태 및 ID 특성을 유추하는 데 사용할 수 있는 얼굴 인식 기능을 사용 중지할 예정입니다. 여기에는 감정, 성별, 나이, 미소, 수염, 헤어 및 메이크업을 예측하는 기능이 포함됩니다. 기존 고객은 2023년 6월 30일까지 이러한 기능의 사용을 중단하기 전에 사용 중지해야 합니다. 여기에서 이 결정에 대해 자세히 알아봅니다.

특성은 얼굴 - 감지 API를 이용하여 선택적으로 감지할 수 있는 특징의 집합입니다. 다음과 같은 특성이 감지될 수 있습니다.

  • Accessories. 지정된 얼굴에 액세서리가 있는지 여부입니다. 이 특성은 각 액세서리에 대해 0과 1 사이의 신뢰도 점수를 사용하여 모자, 안경 및 마스크를 비롯한 가능한 액세서리를 반환합니다.

  • 연령. 특정 얼굴의 예상 연령입니다.

  • 흐리게. 이미지에 있는 얼굴의 흐릿함입니다. 이 특성은 0과 1 사이의 값을 반환하고 낮음, 보통, 높음의 비공식적 등급을 반환합니다.

  • 감정. 지정된 얼굴에 대한 감지 신뢰도를 포함하는 감정의 목록입니다. 신뢰도 점수가 정규화되어 모든 감정에 대한 점수를 합산하면 1이 됩니다. 반환되는 감정은 행복, 슬픔, 중립, 분노, 경멸, 혐오, 놀라움, 두려움입니다.

  • 노출. 이미지에 있는 얼굴의 노출입니다. 이 특성은 0과 1 사이의 값을 반환하고 underExposure, goodExposure, overExposure의 비공식적 등급을 반환합니다.

  • 수염. 지정된 얼굴에 대한 수염의 존재 여부 예상 및 길이입니다.

  • 성별. 지정된 얼굴의 예상 성별입니다. 가능한 값은 male, female, genderless입니다.

  • 안경. 지정된 얼굴에 안경이 있는지 여부입니다. 가능한 값은 NoGlasses, ReadingGlasses, Sunglasses, SwimmingGoggles입니다.

  • 머리카락. 얼굴의 머리카락 유형입니다. 이 특성은 머리카락이 보이는지 여부, 대머리가 감지되는지 여부, 감지된 머리카락 색상을 보여 줍니다.

  • 머리 포즈. 3D 공간에서의 얼굴 방향입니다. 이 특성은 오른쪽 규칙에 따라 정의되는 롤, 요 및 피치 각도(도)로 설명됩니다. 세 각도의 순서는 롤-요-피치이며 각 각도의 값 범위는 -180~180도입니다. 얼굴의 3D 방향은 롤, 요 및 피치 각도의 순서로 추정됩니다. 각도 매핑에 대해서는 다음 다이어그램을 참조하세요.

    레이블이 지정된 피치, 롤, 요 축이 있는 머리

    이러한 값을 사용하는 방법에 관한 자세한 내용은 머리 포즈 방법 가이드를 참조하세요.

  • 화장. 얼굴에 화장을 했는지 여부입니다. 이 특성은 eyeMakeup 및 lipMakeup에 대한 부울 값을 반환합니다.

  • 마스크. 얼굴이 마스크를 쓰고 있는지 여부입니다. 이 특성은 가능한 마스크 형식과 코와 입이 가려졌는지 여부를 나타내는 부울 값을 반환합니다.

  • 노이즈. 얼굴 이미지에서 감지된 시각적 노이즈입니다. 이 특성은 0과 1 사이의 값을 반환하고 낮음, 보통, 높음의 비공식적 등급을 반환합니다.

  • 폐색. 얼굴의 일부를 가리고 있는 개체가 있는지 여부입니다. 이 특성은 eyeOccluded, foreheadOccluded, mouthOccluded에 대한 부울 값을 반환합니다.

  • 미소. 지정된 얼굴의 미소 표현입니다. 이 값은 미소가 전혀 없는 경우의 0에서 활짝 웃는 경우의 1 사이입니다.

  • QualityForRecognition 검색에 사용되는 이미지의 품질이 얼굴 인식을 시도하기에 충분한지 여부와 관련된 전체 이미지 품질입니다. 값은 낮음, 중간 또는 높음의 비공식 등급입니다. 개인 등록에는 "높은" 품질 이미지만 권장되며 식별 시나리오에는 "중간" 이상의 품질이 권장됩니다.

    참고

    각 특성의 가용성은 지정된 검색 모델에 따라 다릅니다. QualityForRecognition 특성은 현재 검색 모델 detection_01 또는 detection_03과 인식 모델 recognition_03 또는 recognition_04의 조합을 사용할 때만 사용할 수 있으므로 인식 모델에 따라 다릅니다.

중요

얼굴 특성은 통계 알고리즘 사용을 통해 예측됩니다. 항상 정확하지는 않을 수 있습니다. 특성 데이터를 기준으로 결정을 내릴 때는 주의해야 합니다.

입력 데이터

다음과 같은 팁을 사용하여 입력 이미지가 가장 정확한 감지 결과를 제공하는지 확인합니다.

  • 지원되는 입력 이미지 형식은 JPEG, PNG, GIF(첫 번째 프레임), BMP입니다.
  • 이미지 파일 크기는 6MB를 넘지 않아야 합니다.
  • 감지 가능한 최소 얼굴 크기는 1920 x 1080 픽셀보다 크지 않은 이미지에서 36 x 36 픽셀입니다. 1920 x 1080 픽셀보다 큰 이미지에서는 최소 얼굴 크기가 비례하여 더 큽니다. 얼굴 크기를 줄이면 얼굴이 감지 가능한 최소 얼굴 크기보다 크더라도 일부 얼굴이 감지되지 않을 수 있습니다.
  • 감지 가능한 최대 얼굴 크기는 4096 x 4096 픽셀입니다.
  • 36 x 36 ~ 4096 x 4096 픽셀의 크기 범위를 벗어나는 얼굴은 감지되지 않습니다.
  • 다음과 같은 기술적인 문제로 인해 일부 얼굴이 인식되지 않을 수 있습니다.
    • 극단적인 조명(예: 심한 역광)이 있는 이미지
    • 한쪽 또는 양쪽 눈을 가리는 장애물
    • 머리카락 유형 또는 수염의 차이
    • 나이로 인한 얼굴 외모의 변화
    • 극단적인 표정

방향 정보가 포함된 입력 데이터:

JPEG 형식의 일부 입력 이미지에는 Exif(이미지 파일 형식) 메타데이터의 방향 정보가 포함될 수 있습니다. Exif 방향을 사용할 수 있는 경우 얼굴 감지를 위해 보내기 전에 이미지가 자동으로 올바른 방향으로 회전됩니다. 회전된 이미지를 기반으로 감지된 각 얼굴에 대한 얼굴 사각형, 랜드마크 및 머리 포즈가 추정됩니다.

얼굴 사각형과 랜드마크을 올바르게 표시하려면 이미지가 올바르게 회전하는지 확인해야 합니다. 대부분의 이미지 시각화 도구는 기본적으로 Exif 방향에 따라 이미지를 자동으로 회전합니다. 다른 도구의 경우 사용자 고유의 코드를 사용하여 회전을 적용해야 할 수 있습니다. 다음 예제에서는 회전된 이미지(왼쪽)와 회전되지 않은 이미지(오른쪽)의 얼굴 사각형을 보여줍니다.

회전이 있거나 없는 두 개의 얼굴 이미지

동영상 입력

비디오 피드에서 얼굴을 감지하는 경우 비디오 카메라의 특정 설정을 조정하여 성능을 향상시킬 수 있습니다.

  • 다듬기: 많은 비디오 카메라가 다듬기 효과를 적용합니다. 프레임 사이를 흐리게 만들고 선명도를 낮추기 때문에 가능하면 이 기능을 꺼야 합니다.

  • 셔터 속도: 더 빠른 셔터 속도는 프레임 사이의 동작의 양을 줄이고 각 프레임을 더 선명하게 만듭니다. 셔터 속도는 1/60 또는 더 빠르게 권장합니다.

  • 셔터 각도: 일부 카메라는 셔터 속도 대신 셔터 각도를 지정합니다. 가능하면 더 낮은 셔터 각도를 사용해야 합니다. 이렇게 하면 비디오 프레임이 더 선명해집니다.

    참고

    셔터 각도가 더 낮은 카메라는 각 프레임에서 조명을 덜 받아서 이미지가 더 어두워집니다. 올바른 수준을 결정해서 사용해야 합니다.

다음 단계

이제 얼굴 감지 개념에 익숙해졌으므로 지정된 이미지에서 얼굴을 감지하는 스크립트를 작성하는 방법을 알아봅니다.