다음을 통해 공유


개체 검색 인사이트 가져오기

개체 감지

Azure AI Video Indexer는 자동차, 핸드백, 배낭, 랩톱 등의 비디오에서 개체를 검색합니다.

지원되는 개체

  • airplane
  • 사과
  • backpack
  • 바나나
  • 야구 글러브
  • bed
  • bench
  • 자전거
  • boat
  • book
  • 브로콜리
  • 버스
  • 케이크
  • 차량
  • 당근
  • 휴대 전화
  • 의자
  • clock
  • 컴퓨터 마우스
  • 소파
  • 식탁
  • donut
  • fire hydrant
  • 포크
  • 프리스비
  • 드라이어
  • 핸드백
  • 핫도그
  • Keyboard
  • 노트북
  • 전자레인지
  • 오토바이
  • 컴퓨터 마우스
  • 넥타이
  • orange
  • 오븐
  • parking meter
  • 피자
  • 화분
  • sandwich
  • scissors
  • sink(싱크)
  • 스케이트보드
  • 스키
  • 스노보드
  • 숟가락
  • 스포츠 공
  • stop sign
  • 옷가방
  • 서핑 보드
  • 테디 베어
  • 테니스 라켓
  • 토스터
  • 화장실
  • 칫솔
  • traffic light
  • 학습(train)
  • umbrella
  • 꽃병
  • 와인 잔

웹 포털을 사용하여 인사이트 JSON 보기

비디오를 업로드하고 인덱싱한 후에는 웹 포털을 사용하여 JSON 형식으로 인사이트를 다운로드할 수 있습니다.

  1. 라이브러리 탭을 선택합니다.
  2. 작업할 미디어를 선택합니다.
  3. 다운로드 및 인사이트(JSON)를 선택합니다. JSON 파일이 새 브라우저 탭에서 열립니다.
  4. 예제 응답에 설명된 키 쌍을 찾습니다.

API 사용

  1. 비디오 인덱스 가져오기 요청을 사용합니다. 을 전달하는 &includeSummarizedInsights=false것이 좋습니다.
  2. 예제 응답에 설명된 키 쌍을 찾습니다.

예제 응답

검색되고 추적된 개체는 다운로드 한 insights.json 파일의 "검색된 개체" 아래에 표시됩니다. 고유 개체가 감지될 때마다 ID가 지정됩니다. 해당 개체도 추적됩니다. 즉, 모델에서 감지된 개체가 프레임으로 돌아가도록 감시합니다. 이렇게 하면 다른 인스턴스가 시작 및 종료 시간이 다른 개체의 인스턴스에 추가됩니다.

이 예제에서는 첫 번째 자동차가 감지되었고 첫 번째 개체도 감지되었으므로 ID가 1로 지정되었습니다. 그런 다음, 다른 자동차가 감지되었고 23번째 개체가 감지되었으므로 ID가 23으로 지정되었습니다. 나중에 첫 번째 자동차가 다시 나타나고 다른 인스턴스가 JSON에 추가되었습니다. 결과 JSON은 다음과 같습니다.

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]
Key 정의
ID 미디어 파일에서 감지된 개체의 ID 증분 수
Type 개체 형식(예: 자동차)
ThumbnailID 개체의 단일 감지를 나타내는 GUID
displayName VI 포털 환경에 표시할 이름
WikiDataID WikiData 구조의 고유 식별자
인스턴스 추적된 모든 인스턴스 목록
신뢰 개체 감지 신뢰도를 나타내는 0~1 사이의 점수
adjustedStart 편집기를 사용할 때 조정된 비디오 시작 시간
adjustedEnd 편집기를 사용할 때 조정된 비디오 종료 시간
start 개체가 프레임에 표시되는 시간
end 개체가 프레임에 더 이상 표시되지 않는 시간

구성 요소

개체 검색에 대한 구성 요소가 정의되지 않았습니다.

투명성 메모

Important

모든 VI 기능에 대한 투명도 참고 개요를 읽는 것이 중요합니다. 각 인사이트에는 자체의 투명성 메모도 있습니다.

  • 표준 및 고급 처리를 위해 프레임당 최대 20개의 검색과 클래스당 35개의 트랙이 있습니다.
  • 개체 크기는 프레임의 90%를 초과해서는 안 됩니다. 프레임의 상당 부분에 걸쳐 일관되게 확장되는 매우 큰 개체는 인식되지 않을 수 있습니다.
  • 작거나 흐릿한 개체는 감지하기 어려울 수 있습니다. 누락되거나 잘못 분류될 수 있습니다(와인 잔, 컵).
  • 일시적이고 매우 적은 프레임에 나타나는 개체는 인식되지 않을 수 있습니다.
  • 개체 감지의 정확도에 영향을 줄 수 있는 다른 요인으로는 저조도 조건, 카메라 동작 및 폐색이 있습니다.
  • Azure AI Video Indexer는 실제 개체만 지원합니다. 애니메이션 또는 CGI는 지원되지 않습니다. 컴퓨터에서 생성된 그래픽(예: 뉴스 스티커)은 이상한 결과를 생성할 수 있습니다.
  • 바인더, 브로슈어 및 기타 서면 자료는 "책"으로 감지되는 경향이 있습니다.

샘플 코드

VI에 대한 모든 샘플 보기