관찰된 사람 감지 및 일치하는 얼굴 인사이트 가져오기
관찰된 사람 감지, 일치하는 얼굴, 감지된 의류
Important
얼굴 식별, 사용자 지정 및 유명인 인식 기능 액세스는 책임 있는 AI 원칙을 지원하기 위해 자격 및 사용 기준에 따라 제한됩니다. 얼굴 식별, 사용자 지정 및 유명인 인식 기능은 Microsoft 관리 고객 및 파트너만 사용할 수 있습니다. 얼굴 인식 접수 양식을 사용하여 액세스를 적용합니다.
관찰된 사람 감지 및 일치하는 얼굴은 미디어 파일에서 자동으로 사람을 감지하고 일치합니다. 관찰된 사람 감지 및 일치하는 얼굴을 설정하여 사람, 의류 및 외모의 정확한 기간에 대한 인사이트를 표시할 수 있습니다.
웹 포털에서 결과 인사이트는 인사이트 탭의 분류된 목록에 표시되고, 탭에는 각 사용자의 썸네일과 해당 ID가 포함됩니다. 사람의 썸네일을 클릭하면 일치하는 사람(사람 인사이트의 해당 얼굴)이 표시됩니다. 인사이트는 사람의 썸네일 ID, 파일에 나타나는 시간 비율, Wiki 링크(유명인인 경우) 및 신뢰 수준을 포함하는 JSON 파일의 분류된 목록에서도 생성됩니다.
관찰된 사람 감지, 의류 감지 및 일치하는 얼굴 사용 사례
- 예를 들어, 프로모션 및 예고편을 만들 때 특정 유명인에 대한 인사이트를 얻기 위해 조직 보관에서 일치하는 사람들을 심층 검색하여 효율성을 개선시킵니다.
- 뉴스 또는 스포츠 에이전시의 축구 경기 기록 보관소에서 빨간 셔츠를 입은 사람을 검색하는 등 특집 기사를 만들 때 효율성이 개선되었습니다.
- 감지된 동일 인물의 ID를 사용하여 비디오에서 특정인의 모습에 대한 법정 증거와 같은 긴 비디오의 요약본을 만듭니다.
- 고객이 쇼핑가에서 통로를 이동하는 방법 또는 결제 대기줄에서 소비하는 시간과 같은 시간별 추세를 알아보고 분석합니다.
고급 ->Video + 오디오 인덱싱 사전 설정을 선택하여 파일을 인덱싱할 때 일치하는 얼굴 및 감지된 의류 기능을 사용할 수 있습니다.
웹 포털을 사용하여 인사이트 JSON 보기
비디오를 업로드하고 인덱싱한 후에는 웹 포털을 사용하여 JSON 형식으로 인사이트를 다운로드할 수 있습니다.
- 라이브러리 탭을 선택합니다.
- 작업할 미디어를 선택합니다.
- 다운로드 및 인사이트(JSON)를 선택합니다. JSON 파일이 새 브라우저 탭에서 열립니다.
- 예제 응답에 설명된 키 쌍을 찾습니다.
API 사용
예제 응답
"observedPeople": [
{
"id": 1,
"thumbnailId": "d09ad62e-e0a4-42e5-8ca9-9a640c686596",
"clothing": [
{
"id": 1,
"type": "sleeve",
"properties": {
"length": "short"
}
},
{
"id": 2,
"type": "pants",
"properties": {
"length": "short"
}
}
],
"matchingFace": {
"id": 1310,
"confidence": 0.3819
},
"instances": [
{
"adjustedStart": "0:00:34.8681666",
"adjustedEnd": "0:00:36.0026333",
"start": "0:00:34.8681666",
"end": "0:00:36.0026333"
},
{
"adjustedStart": "0:00:36.6699666",
"adjustedEnd": "0:00:36.7367",
"start": "0:00:36.6699666",
"end": "0:00:36.7367"
},
{
"adjustedStart": "0:00:37.2038333",
"adjustedEnd": "0:00:39.6729666",
"start": "0:00:37.2038333",
"end": "0:00:39.6729666"
}
]
}
]
Important
모든 VI 기능에 대한 투명도 참고 개요를 읽는 것이 중요합니다. 각 인사이트에는 자체의 투명성 메모도 있습니다.
관찰된 사람 감지 및 일치하는 얼굴 노트
- 일반적으로는 작게 표시되는 사람은 감지되지 않습니다(최소 사람 높이는 100픽셀).
- 최대 프레임 크기는 FHD(전체 고화질)입니다.
- 낮은 품질의 비디오(예: 어두운 조명 조건)는 검색 결과에 영향을 줄 수 있습니다.
- 권장 프레임 속도는 최소 30FPS입니다.
- 권장 비디오 입력은 단일 프레임에 최대 10명의 사람을 포함해야 합니다. 이 기능은 단일 프레임에서 더 많은 사람을 감지할 수 있지만 한 프레임에서 최대 10명의 사람을 검색한 감지 결과의 신뢰도가 가장 높습니다.
- 비슷한 옷을 입은 사람: (예: 유니폼을 입은 사람, 스포츠 경기의 선수) 동일한 ID 번호를 가진 동일한 사람으로 감지될 수 있습니다.
- 방해 – 장애물(장면/자체 또는 다른 사람에 의한 장애물)이 있는 오류가 있을 수 있습니다.
- 포즈: 다른 포즈(후면/앞)로 인해 트랙이 분할될 수 있습니다.
- 의류 감지는 사람 신체의 가시성에 따라 달라지므로 사람이 완전히 보이면 정확도가 더 높습니다. 사람이 옷을 입고 없을 때 오류가 있을 수 있습니다. 이 시나리오 또는 가시성이 좋지 않는 다른 시나리오에서는 긴 바지, 스커트 또는 드레스와 같은 결과가 제공될 수 있습니다.
관찰된 사람 감지 및 일치하는 얼굴 구성 요소
구성 요소 | 정의 |
---|---|
원본 파일 | 사용자는 인덱싱을 위해 원본 파일을 업로드합니다. |
감지 | 관찰된 사람과 해당 옷을 검색하기 위해 미디어 파일을 추적합니다. 예를 들어, 긴 소매 셔츠, 드레스 또는 긴 바지. 감지하려면 사람의 전체 상반신이 미디어에 표시되어야 합니다. |
로컬 그룹화 | 식별된 관찰된 얼굴은 로컬 그룹으로 필터링됩니다. 사람이 두 번 이상 감지되면 이 사람에 대해 관찰된 얼굴 인스턴스가 더 많이 만들어집니다. |
일치 및 분류 | 관찰된 사람 인스턴스는 얼굴과 일치합니다. 알려진 유명 인사가 있는 경우 관찰된 사람에게는 이름이 지정됩니다. 관찰된 사람 인스턴스는 얼마든지 동일한 얼굴에 일치시킬 수 있습니다. |
신뢰도 가치 | 관찰된 각 사람의 예상 신뢰 수준은 0에서 1 사이의 범위로 계산됩니다. 신뢰도 점수는 결과의 정확도에 대한 확실성을 나타냅니다. 예를 들어 82% 확실성은 0.82 점수로 표시됩니다. |