인덱싱 구성 가이드
기본 인덱싱 설정을 사용하거나 조정할 수 있습니다. 생성된 인사이트, 비용 및 성능에 영향을 주는 언어, 인덱싱, 사용자 지정 모델 및 스트리밍 설정을 선택할 수 있습니다.
이 문서에서는 각 옵션에 대해 설명합니다. API 사용에 대해 Azure AI Video Indexer 웹 사이트를 사용할 때도 동일한 옵션이 적용됩니다(API 가이드 참조). 대용량 인덱스를 생성할 때는 대규모 가이드를 따릅니다.
기본 설정
기본적으로 Azure AI Video Indexer는 다음과 같이 구성됩니다.
- 원본 언어: 영어
- 개인 정보: 개인 정보
- 오디오 및 비디오 설정: 표준
- 스트리밍 품질: 단일 비트 전송률
동영상 소스 언어
동영상에서 말하는 언어를 알고 있는 경우. 동영상 소스 언어 목록에서 언어를 선택합니다. 동영상 언어가 확실하지 않은 경우. 단일 언어 자동 검색을 선택합니다. Azure AI Video Indexer는 LID(언어 식별)를 사용하여 비디오 언어를 검색하고 검색된 언어로 전사 및 인사이트를 생성합니다.
비디오에 여러 언어가 포함되어 있고 어떤 언어가 있는지 확실하지 않은 경우 다중 언어 자동 검색을 선택합니다. 이 경우 비디오를 업로드하고 인덱싱할 때 MLID(다중 언어) 검색이 적용됩니다.
비디오의 언어가 다를 때 자동 검색은 유용한 옵션이지만 LID 또는 MLID를 사용할 때 고려해야 할 두 가지 사항이 있습니다.
- LID/MLID는 Azure AI Video Indexer에서 지원하는 모든 언어를 지원하지 않습니다.
- 비디오의 적절한 언어를 미리 선택하면 전사 품질이 더 높습니다.
언어 지원 및 지원되는 언어에 대해 자세히 알아봅니다.
개인 정보 보호
이 옵션을 사용하면 Azure AI Video Indexer 계정의 사용자 또는 링크가 있는 모든 사용자만 인사이트에 액세스할 수 있는지 여부를 결정할 수 있습니다.
인덱싱 옵션
기본 인덱싱 설정을 사용하는 경우 각 오디오 및 비디오 인덱싱 옵션의 가격이 다르게 책정될 수 있습니다. 자세한 내용은 Azure AI Video Indexer 가격 책정을 참조하세요.
다음은 제공된 인사이트에 대한 세부 정보가 포함된 인덱싱 형식 옵션입니다. 인덱스 형식을 수정하려면 고급 설정을 선택합니다.
참고 항목
OCR(광학 문자 인식)은 여러 가지 인사이트 유형과 함께 사용됩니다.
고급 설정
오디오 전용
- 기본: 오디오만(동영상 무시)을 사용하여 인사이트를 인덱싱하고 추출하며 전사, 번역, 출력 캡션 및 자막 형식 지정(선택 자막)과 같은 인사이트를 제공합니다.
- 표준: 오디오만(비디오 무시)을 사용하여 인사이트를 인덱싱하고 추출하며 전사, 번역, 출력 캡션 및 자막 서식 지정(선택 자막), 자동 언어 감지, 정서, 키워드, 명명된 엔터티(브랜드, 위치, 사람), 감정, 화자, 주제 추출 및 텍스트 콘텐츠 조정과 같은 인사이트를 제공합니다.
- 고급: 오디오만(비디오 무시)을 사용하여 인사이트를 인덱싱하고 추출하며 전사, 번역, 출력 캡션 및 자막 서식 지정(선택 자막), 자동 언어 감지, 오디오 이벤트 검색, 정서, 키워드, 명명된 엔터티(브랜드, 위치, 사람), 감정, 화자, 주제 추출 및 텍스트 콘텐츠 조정과 같은 인사이트를 제공합니다.
비디오 전용
- 기본: 비디오 전용(오디오 무시)을 사용하여 인사이트를 인덱싱하고 추출하며 레이블, 개체 감지, OCR, 장면(키프레임 및 샷) 및 검은색 프레임 검색과 같은 인사이트를 제공합니다.
- 표준: 비디오만(오디오 무시)을 사용하여 인사이트를 인덱싱하고 추출하며 레이블(OCR), 명명된 엔터티(OCR - 브랜드, 위치, 사람), OCR, 사람, 장면(키프레임 및 샷), 검은색 프레임, 시각적 콘텐츠 조정 및 토픽 추출(OCR)과 같은 인사이트를 제공합니다.
- 고급: 비디오만 사용하여 인사이트 인덱싱 및 추출(오디오 무시) 및 다음 인사이트 제공: 레이블(OCR), 일치하는 사람, 명명된 엔터티(OCR - 브랜드, 위치, 사람), OCR, 관찰된 사람, 사람, 장면(키프레임 및 샷), 클래퍼 보드 감지, 디지털 패턴 감지, 주요 의류 인사이트, 텍스트 없는 슬레이트 감지, 텍스트 로고 감지, 검은색 프레임, 시각적 con텐트 모드ration 및 주제 추출(OCR).
오디오 및 동영상
- 기본: 오디오 및 비디오를 사용하여 인사이트를 인덱싱하고 추출하며, 전사, 번역, 출력 캡션 및 자막 서식 지정(선택 자막), 개체 감지, OCR, 장면(키프레임 및 샷), 검은색 프레임 등의 인사이트를 제공합니다.
- 표준: 오디오 및 비디오를 사용하여 인사이트를 인덱싱하고 추출하며 전사, 번역, 출력 캡션 및 자막 서식 지정(선택 자막), 자동 언어 감지, 정서, 키워드, 명명된 엔터티(브랜드, 위치, 사람), OCR, 장면(키프레임 및 샷), 블랙 프레임, 시각적 콘텐츠 조정, 사람, 감정, 화자, 주제 추출 및 텍스트 콘텐츠 조정과 같은 인사이트를 제공합니다.
- 고급: 오디오 및 비디오를 사용하여 인사이트를 인덱싱하고 추출하며, 전사, 번역, 출력 캡션 및 자막 서식 지정(선택 자막), 자동 언어 감지, 텍스트 구성텐트 모드ration, 오디오 이벤트 감지, 감정, 키워드, 일치하는 사람, 명명된 엔터티(브랜드, 위치, 사람), OCR, 관찰된 사람, 사람, 클래퍼 보드 감지, 디지털 패턴 검색, 주요 의류 인사이트, 텍스트 없는 슬레이트 감지, 감정, 스피커, 장면(키프레임 및 샷), 텍스트 로고 감지, 검은색 프레임, 시각적 con텐트 모드ration 및 토픽 추출.
스트리밍 품질 옵션
인덱싱된 비디오를 스트리밍하는 두 가지 옵션이 있습니다.
- 단일 비트 전송률: 비디오 높이가 720p HD보다 크거나 같은 경우 Azure AI Video Indexer는 1280 x 720 해상도로 인코딩합니다. 그렇지 않으면 640 x 468로 인코딩됩니다.
- 스트리밍 없음: 인사이트가 생성되지만 스트리밍 작업이 수행되지 않으며 Azure AI Video Indexer 웹 사이트에서 동영상을 사용할 수 없습니다. 스트리밍 없음을 선택하면 인코딩 요금이 청구되지 않습니다.
모델 제외
VI 웹 사이트 및 API를 통해 인덱싱할 때 모델을 제외할 수 있습니다. 웹 사이트를 사용하여 인덱싱할 비디오를 업로드할 때 고급 설정>인덱싱 사전 설정을 선택한 다음 인덱싱 결과에서 제외할 AI 모델을 선택합니다. 이렇게 하면 관심 있는 인사이트만 포함하는 보다 효율적인 인덱싱 및 VI 결과를 사용할 수 있습니다.
콘텐츠 모델 사용자 지정
Azure AI Video Indexer를 사용하면 특정 사용 사례에 맞게 일부 모델을 사용자 지정할 수 있습니다. 이러한 모델에는 브랜드, 언어, 사람 및 음성이 포함됩니다.
인사이트 및 미디어 스토리지
인사이트 스토리지
모든 인덱싱 인사이트 및 메타데이터는 VI에서 관리하는 스토리지 계정에 유지되며 이 스토리지에 대한 요금은 청구되지 않습니다.
미디어 스토리지
VI 계정이 Azure Storage 계정에 연결됩니다. 이 스토리지 계정의 사용량을 제어하고 비용을 지불합니다. 다음 파일은 비디오가 인덱싱될 때 이 계정에 저장됩니다.
- 원본 파일입니다. 나중에 비디오를 다시 인덱싱하려는 경우에 유지됩니다.
- 스트리밍 품질이 단일 비트 전송률로 설정된 경우 새 인코딩된 파일입니다.
미디어 삭제
인덱싱된 미디어와 관련된 모든 파일 및 인사이트는 다음 세 가지 방법으로 삭제할 수 있습니다.