개체 검색 인사이트 가져오기

아티클
07/26/2024

Important

Azure Media Services 사용 중지로 인한 Azure Video Indexer 콘텐츠 마이그레이션 마감일이 지났습니다. 자세한 내용은 사용 중지 가이드를 참조하세요.

개체 감지

Azure AI Video Indexer는 자동차, 핸드백, 배낭, 랩톱 등의 비디오에서 개체를 검색합니다.

지원되는 개체

airplane
사과
backpack
바나나
야구 글러브
bed
bench
자전거
boat
book
병
볼
브로콜리
버스
케이크

차량
당근
휴대 전화
의자
clock
컴퓨터 마우스
소파
컵
식탁
donut
fire hydrant
포크
프리스비

드라이어
핸드백
핫도그
Keyboard
연
칼
노트북
전자레인지
오토바이
컴퓨터 마우스
넥타이
orange
오븐
parking meter
피자
화분

sandwich
scissors
sink(싱크)
스케이트보드
스키
스노보드
숟가락
스포츠 공
stop sign
옷가방
서핑 보드
테디 베어

테니스 라켓
토스터
화장실
칫솔
traffic light
학습(train)
umbrella
꽃병
와인 잔

웹 포털을 사용하여 인사이트 JSON 보기

비디오를 업로드하고 인덱싱한 후에는 웹 포털을 사용하여 JSON 형식으로 인사이트를 다운로드할 수 있습니다.

라이브러리 탭을 선택합니다.
작업할 미디어를 선택합니다.
다운로드 및 인사이트(JSON)를 선택합니다. JSON 파일이 새 브라우저 탭에서 열립니다.
예제 응답에 설명된 키 쌍을 찾습니다.

API 사용

비디오 인덱스 가져오기 요청을 사용합니다. 을 전달하는 &includeSummarizedInsights=false것이 좋습니다.
예제 응답에 설명된 키 쌍을 찾습니다.

예제 응답

검색되고 추적된 개체는 다운로드 한 insights.json 파일의 "검색된 개체" 아래에 표시됩니다. 고유 개체가 감지될 때마다 ID가 지정됩니다. 해당 개체도 추적됩니다. 즉, 모델에서 감지된 개체가 프레임으로 돌아가도록 감시합니다. 이렇게 하면 다른 인스턴스가 시작 및 종료 시간이 다른 개체의 인스턴스에 추가됩니다.

이 예제에서는 첫 번째 자동차가 감지되었고 첫 번째 개체도 감지되었으므로 ID가 1로 지정되었습니다. 그런 다음, 다른 자동차가 감지되었고 23번째 개체가 감지되었으므로 ID가 23으로 지정되었습니다. 나중에 첫 번째 자동차가 다시 나타나고 다른 인스턴스가 JSON에 추가되었습니다. 결과 JSON은 다음과 같습니다.

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]

Key	정의
ID	미디어 파일에서 감지된 개체의 ID 증분 수
Type	개체 형식(예: 자동차)
ThumbnailID	개체의 단일 감지를 나타내는 GUID
displayName	VI 포털 환경에 표시할 이름
WikiDataID	WikiData 구조의 고유 식별자
인스턴스	추적된 모든 인스턴스 목록
신뢰	개체 감지 신뢰도를 나타내는 0~1 사이의 점수
adjustedStart	편집기를 사용할 때 조정된 비디오 시작 시간
adjustedEnd	편집기를 사용할 때 조정된 비디오 종료 시간
start	개체가 프레임에 표시되는 시간
end	개체가 프레임에 더 이상 표시되지 않는 시간

구성 요소

개체 검색에 대한 구성 요소가 정의되지 않았습니다.

투명성 메모

Important

모든 VI 기능에 대한 투명도 참고 개요를 읽는 것이 중요합니다. 각 인사이트에는 자체의 투명성 메모도 있습니다.

표준 및 고급 처리를 위해 프레임당 최대 20개의 검색과 클래스당 35개의 트랙이 있습니다.
개체 크기는 프레임의 90%를 초과해서는 안 됩니다. 프레임의 상당 부분에 걸쳐 일관되게 확장되는 매우 큰 개체는 인식되지 않을 수 있습니다.
작거나 흐릿한 개체는 감지하기 어려울 수 있습니다. 누락되거나 잘못 분류될 수 있습니다(와인 잔, 컵).
일시적이고 매우 적은 프레임에 나타나는 개체는 인식되지 않을 수 있습니다.
개체 감지의 정확도에 영향을 줄 수 있는 다른 요인으로는 저조도 조건, 카메라 동작 및 폐색이 있습니다.
Azure AI Video Indexer는 실제 개체만 지원합니다. 애니메이션 또는 CGI는 지원되지 않습니다. 컴퓨터에서 생성된 그래픽(예: 뉴스 스티커)은 이상한 결과를 생성할 수 있습니다.
바인더, 브로슈어 및 기타 서면 자료는 "책"으로 감지되는 경향이 있습니다.

샘플 코드

VI에 대한 모든 샘플 보기

다음을 통해 공유