다음을 통해 공유


관찰된 사람의 추천 의류 사용

Azure AI Video Indexer 고급 비디오 설정을 사용하여 비디오를 인덱싱할 때 관찰된 사람의 추천 의류를 볼 수 있습니다. 인사이트는 인물의 좌표, 타임스탬프, 장면 프레임 등 주요 인물이 눈에 띄게 등장하고 명확하게 보이는 비디오 내 순간을 제공합니다. 이러한 인사이트를 통해 관련 의류 광고가 시청되는 비디오 내 특정 시간과 일치하는 고품질 비디오 내 상황별 광고가 가능해집니다.

이 문서에서는 추천 의류 인사이트를 보는 방법과 추천 의류 이미지의 순위를 지정하는 방법에 대해 설명합니다.

소개 비디오 보기

추천 의류 인사이트를 보고 사용하는 방법을 설명하는 다음 짧은 비디오를 볼 수 있습니다.

추천 의료 인사이트는 고급 옵션 -> 고급 비디오 또는 고급 비디오 + 오디오 사전 설정(비디오 + 오디오 인덱싱 아래)을 선택하여 파일을 인덱싱할 때 사용할 수 있습니다. 표준 인덱싱에는 이 인사이트가 포함되지 않습니다.

이 스크린샷은 인덱싱 비디오 옵션을 나타냅니다.

추천 의류 이미지는 비디오의 주요 순간, 인물이 등장하는 시간, 텍스트 기반 감정, 오디오 이벤트 등 몇 가지 요인에 따라 순위가 매겨집니다. 인사이트는 장면당 가장 높은 순위의 프레임을 비공개로 설정하므로 비디오 전체에서 장면당 상황에 맞는 광고를 제작할 수 있습니다. JSON 파일은 비디오의 장면 시퀀스에 따라 순위가 지정되며, 각 장면은 결과적으로 최고 등급 프레임을 갖습니다.

참고 항목

추천 의류 인사이트는 아티팩트 파일에서만 볼 수 있으며 해당 인사이트는 Azure AI Video Indexer 웹 사이트에 없습니다.

  1. 오른쪽 위 모서리에서 아티팩트 zip 파일을 다운로드하려면 다운로드 ->아티팩트(ZIP)를 선택합니다.
  2. featuredclothing.zip을(를) 여십시오.

.zip 파일에는 다음 두 개체가 포함됩니다.

  • featuredclothing.map.json - 파일에는 다음 속성이 있는 각 추천 의류의 인스턴스가 포함되어 있습니다.

    • id – 순위 인덱스("id": 1가 가장 중요한 의류임).
    • confidence – 추천 의류의 점수입니다.
    • frameIndex – 의류의 최고 프레임.
    • timestamp – frameIndex에 해당합니다.
    • opBoundingBox – 사람의 경계 상자입니다.
    • faceBoundingBox – 감지된 경우 사람의 얼굴 경계 상자입니다.
    • fileName – 의류의 최고 프레임이 저장되는 곳입니다.
    • sceneID - 장면이 나타나는 장면입니다.

    "sceneID": 1가 포함된 추천 의류의 예입니다.

    "instances": [
      	{
        		"confidence": 0.07,
    			"faceBoundingBox": {},
    			"fileName": "frame_100.jpg",
        		"frameIndex": 100,
        		"opBoundingBox": {
            			"x": 0.09062,
            			"y": 0.4,
    				"width": 0.11302,
            			"height": 0.59722
    				},
       			 "timestamp": "0:00:04",
        		"personName": "Observed Person #1",
        		"sceneId": 1
      	}
    
  • featuredclothing.frames.map – 이 폴더에는 featuredclothing.map.json의 각 인스턴스에 있는 fileName 속성에 해당하는 추천 의류가 표시된 최상의 프레임 이미지가 포함되어 있습니다.

제한 사항 및 가정

품질이 낮거나 관련성이 낮은 이미지의 잘못된 감지 효과를 피하거나 완화하기 위해 추천 의류의 제한 사항에 유의해야 합니다. 

  • 추천 의류의 전제 조건은 관찰된 인물 인사이트에서 그 옷을 입은 사람을 찾을 수 있다는 것입니다.
  • 추천 의류를 입은 사람의 얼굴이 감지되지 않으면 결과에 얼굴 경계 상자가 포함되지 않습니다.
  • 비디오에 등장하는 사람이 둘 이상의 의상을 입는 경우 알고리즘은 최고의 의상을 하나의 추천 의류 이미지로 선택합니다.
  • 포즈를 취할 때 트랙은 가장 자주 전면에 나타나는 관찰된 사람들을 처리하도록 최적화되어 있습니다.
  • 사람들이 겹칠 때 잘못된 검색이 발생할 수 있습니다.
  • 흐릿한 사람을 포함하는 프레임은 낮은 품질의 결과를 얻기 쉽습니다.

자세한 내용은 관찰된 사람의 제한 사항을 참조하세요.