다음을 통해 공유


Azure AI Video Indexer 인사이트

Important

Azure Media Services 사용 중지로 인한 Azure Video Indexer 콘텐츠 마이그레이션 마감일이 지났습니다. 자세한 내용은 사용 중지 가이드를 참조하세요.

비디오가 인덱싱되면 Azure AI Video Indexer는 30개 이상의 AI 모델을 실행하여 비디오 및 오디오 콘텐츠를 분석하고, 대본, OCR(광학 문자 인식 요소), 얼굴, 토픽, 감정 등을 비롯한 비디오 인사이트를 포함하는 JSON을 생성합니다. 각 인사이트 유형에는 비디오에 인사이트가 표시되는 시기를 표시하는 시간 범위의 인스턴스가 포함됩니다.

인사이트 테이블의 링크를 사용하여 웹 포털에서 각 인사이트 JSON 응답을 가져오고 API를 사용하는 방법을 알아봅니다.

Insights

인사이트 설명
오디오 효과 감지 오디오 효과 감지는 음향 이벤트를 감지하고 웃음, 군중 반응, 경보 및/또는 사이렌과 같은 범주로 분류합니다.
얼굴 검색 얼굴 감지는 미디어 파일에서 얼굴을 감지한 다음 유사한 얼굴의 인스턴스를 그룹으로 집계합니다. 얼굴 감지 인사이트는 썸네일과 각 얼굴의 이름 또는 ID를 포함하는 JSON 파일에서 분류된 목록으로 생성됩니다. 웹 포털에서 얼굴의 썸네일을 선택하면 사람의 이름(인식된 경우), 사람이 나타나는 비디오의 백분율 및 유명인인 경우 사람의 전기와 같은 정보가 표시됩니다. 영상에서 그 사람이 등장하는 인스턴스 사이를 스크롤할 수도 있습니다.
키워드 추출 키워드 추출은 미디어 파일에 설명된 다양한 키워드에 대한 인사이트를 검색합니다. 단일 언어 및 다 언어 미디어 파일 모두에서 인사이트를 추출합니다.
레이블 식별 레이블 식별은 미디어 파일의 동영상 장면에 나타나는 선글라스 또는 수영과 같은 작업과 같은 시각적 개체를 식별하는 Azure AI Video Indexer AI 기능입니다. 많은 레이블 식별 범주가 있으며 일단 추출되면 레이블 식별 인스턴스가 Insights 탭에 표시되고 50개 이상의 언어로 번역될 수 있습니다. 레이블을 클릭하면 미디어 파일의 인스턴스가 열리고 이전 재생 또는 다음 재생을 선택하여 더 많은 인스턴스를 볼 수 있습니다.
미디어 전사, 번역 및 언어 식별 전사, 번역 및 언어 식별은 미디어 파일의 음성을 감지, 전사 및 번역하여 50개 이상의 언어로 변환합니다.
명명된 엔터티 명명된 엔터티 추출은 NLP(자연어 처리)를 사용하여 미디어 파일의 오디오 및 이미지에 표시되는 위치, 사람 및 브랜드에 대한 인사이트를 추출합니다. 명명된 엔터티 추출 인사이트는 전사 및 OCR(광학 문자 인식)을 사용합니다.
물체 감지 Azure AI Video Indexer는 자동차, 핸드백, 배낭, 랩톱 등의 비디오에서 개체를 검색합니다.
OCR OCR은 미디어 파일의 그림, 도로 표지판 및 제품과 같은 이미지에서 텍스트를 추출하여 인사이트를 만듭니다.
포스트 프로덕션: 클래퍼 보드 감지 클래퍼 보드 감지는 촬영 중에 사용되는 클래퍼 보드를 감지하여 클래퍼 보드에서 검색된 정보를 메타데이터(예: 프로덕션, 롤, 장면, 테이크 등)로 제공합니다. 클래퍼 보드는 파일을 업로드하고 인덱싱할 때 웹 포털 고급 설정에서 선택할 수 있는 포스트 프로덕션 인사이트의 일부입니다.
포스트 프로덕션: 디지털 패턴 디지털 패턴 검색은 촬영 중에 사용되는 색 막대를 검색합니다. 디지털 패턴은 파일을 업로드하고 인덱싱할 때 웹 포털 고급 설정 에서 선택할 수 있는 포스트 프로덕션 인사이트의 일부입니다.
텍스트 기반 감정 감지 감정 감지는 비디오의 대본 줄에서 감정을 감지합니다. 각 문장은 분노, 두려움, 기쁨, 슬픈, 다른 감정이 감지되지 않은 경우 없음으로 감지 할 수 있습니다.
토픽 유추 토픽 유추는 기록된 오디오에서 파생된 유추된 인사이트, 시각적 텍스트의 OCR 콘텐츠 및 Video Indexer 얼굴 인식 모델을 사용하여 비디오에서 인식된 유명인을 만듭니다.