개체 검색 인사이트 가져오기

아티클
10/09/2024

개체 감지

Azure AI Video Indexer는 자동차, 핸드백, 배낭, 랩톱 등의 비디오에서 개체를 검색합니다.

지원되는 개체

airplane
사과
backpack
바나나
야구 글러브
bed
bench
자전거
boat
book
병
볼
브로콜리
버스
케이크

차량
당근
휴대 전화
의자
clock
컴퓨터 마우스
소파
컵
식탁
donut
fire hydrant
포크
프리스비

드라이어
핸드백
핫도그
Keyboard
연
칼
노트북
전자레인지
오토바이
컴퓨터 마우스
넥타이
orange
오븐
parking meter
피자
화분

sandwich
scissors
sink(싱크)
스케이트보드
스키
스노보드
숟가락
스포츠 공
stop sign
옷가방
서핑 보드
테디 베어

테니스 라켓
토스터
화장실
칫솔
traffic light
학습(train)
umbrella
꽃병
와인 잔

웹 포털을 사용하여 인사이트 JSON 보기

비디오를 업로드하고 인덱싱한 후에는 웹 포털을 사용하여 JSON 형식으로 인사이트를 다운로드할 수 있습니다.

라이브러리 탭을 선택합니다.
작업할 미디어를 선택합니다.
다운로드 및 인사이트(JSON)를 선택합니다. JSON 파일이 새 브라우저 탭에서 열립니다.
예제 응답에 설명된 키 쌍을 찾습니다.

API 사용

비디오 인덱스 가져오기 요청을 사용합니다. 을 전달하는 &includeSummarizedInsights=false것이 좋습니다.
예제 응답에 설명된 키 쌍을 찾습니다.

예제 응답

검색되고 추적된 개체는 다운로드 한 insights.json 파일의 "검색된 개체" 아래에 표시됩니다. 고유 개체가 감지될 때마다 ID가 지정됩니다. 해당 개체도 추적됩니다. 즉, 모델에서 감지된 개체가 프레임으로 돌아가도록 감시합니다. 이렇게 하면 다른 인스턴스가 시작 및 종료 시간이 다른 개체의 인스턴스에 추가됩니다.

이 예제에서는 첫 번째 자동차가 감지되었고 첫 번째 개체도 감지되었으므로 ID가 1로 지정되었습니다. 그런 다음, 다른 자동차가 감지되었고 23번째 개체가 감지되었으므로 ID가 23으로 지정되었습니다. 나중에 첫 번째 자동차가 다시 나타나고 다른 인스턴스가 JSON에 추가되었습니다. 결과 JSON은 다음과 같습니다.

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]

Key	정의
ID	미디어 파일에서 감지된 개체의 ID 증분 수
Type	개체 형식(예: 자동차)
ThumbnailID	개체의 단일 감지를 나타내는 GUID
displayName	VI 포털 환경에 표시할 이름
WikiDataID	WikiData 구조의 고유 식별자
인스턴스	추적된 모든 인스턴스 목록
신뢰	개체 감지 신뢰도를 나타내는 0~1 사이의 점수
adjustedStart	편집기를 사용할 때 조정된 비디오 시작 시간
adjustedEnd	편집기를 사용할 때 조정된 비디오 종료 시간
start	개체가 프레임에 표시되는 시간
end	개체가 프레임에 더 이상 표시되지 않는 시간

구성 요소

개체 검색에 대한 구성 요소가 정의되지 않았습니다.

투명성 메모

Important

모든 VI 기능에 대한 투명도 참고 개요를 읽는 것이 중요합니다. 각 인사이트에는 자체의 투명성 메모도 있습니다.

표준 및 고급 처리를 위해 프레임당 최대 20개의 검색과 클래스당 35개의 트랙이 있습니다.
개체 크기는 프레임의 90%를 초과해서는 안 됩니다. 프레임의 상당 부분에 걸쳐 일관되게 확장되는 매우 큰 개체는 인식되지 않을 수 있습니다.
작거나 흐릿한 개체는 감지하기 어려울 수 있습니다. 누락되거나 잘못 분류될 수 있습니다(와인 잔, 컵).
일시적이고 매우 적은 프레임에 나타나는 개체는 인식되지 않을 수 있습니다.
개체 감지의 정확도에 영향을 줄 수 있는 다른 요인으로는 저조도 조건, 카메라 동작 및 폐색이 있습니다.
Azure AI Video Indexer는 실제 개체만 지원합니다. 애니메이션 또는 CGI는 지원되지 않습니다. 컴퓨터에서 생성된 그래픽(예: 뉴스 스티커)은 이상한 결과를 생성할 수 있습니다.
바인더, 브로슈어 및 기타 서면 자료는 "책"으로 감지되는 경향이 있습니다.

샘플 코드

VI에 대한 모든 샘플 보기

다음을 통해 공유