다음을 통해 공유


언어 식별 모델을 사용하여 음성 언어 자동 식별

Warning

지난 1년 동안 Azure AI VI(Video Indexer)는 사용 중지로 인해 AMS(Azure Media Services)에 대한 종속성을 제거한다고 발표했습니다. 기능 조정 및변경 내용 이 발표되었고 마이그레이션 가이드 가 제공되었습니다.

마이그레이션 완료 마감일은 2024년 6월 30일이었습니다. VI는 VI 계정을 업데이트하고 2024년 8월 31일까지 AMS VI 자산 마이그레이션을 옵트인할 수 있도록 업데이트/마이그레이션 기한을 연장했습니다.

그러나 6월 30일 이후에 VI 계정을 업데이트하지 않은 경우 새 비디오를 인덱싱할 수 없으며 마이그레이션되지 않은 비디오를 재생할 수도 없습니다. 6월 30일 이후에 계정을 업데이트하는 경우 즉시 인덱싱을 다시 시작할 수 있지만 AMS VI 마이그레이션을 통해 마이그레이션될 때까지 계정 업데이트 전에 인덱싱된 비디오를 재생할 수 없습니다.

Azure AI Video Indexer는 오디오 콘텐츠에서 음성 언어를 자동으로 식별하는 프로세스인 자동 LID(언어 식별)를 지원합니다. 미디어 파일은 기본 식별 언어로 전사됩니다.

지원되는 언어의 Azure AI Video Indexer 언어에서 지원되는 목록을 참조하세요.

지침 및 제한 사항 섹션을 검토해야 합니다.

인덱싱할 때 자동 언어 식별 선택

API를 사용하여 비디오를 인덱싱하거나 다시 인덱싱할 때 sourceLanguage 매개 변수에서auto detect 옵션을 선택합니다.

포털을 사용하는 경우 Azure AI Video Indexer 홈페이지의 계정 비디오로 이동하여 다시 인덱싱하려는 비디오의 이름을 마우스로 가리킵니다. 오른쪽 아래 모서리에서 다시 인덱싱 단추를 선택합니다. 비디오 다시 인덱싱 대화 상자의 비디오 원본 언어 드롭다운 상자에서 자동 검색을 선택합니다.

자동 검색을 선택할 위치를 보여 주는 스크린샷

모델 출력

Azure AI Video Indexer는 해당 언어에 대한 신뢰도가 > 0.6인 경우 가장 가능성이 높은 언어에 따라 비디오를 전사합니다. 언어를 확실하게 식별할 수 없는 경우 Video Indexer는 음성 언어를 영어로 가정합니다.

모델 주요 언어는 인사이트 JSON에서 sourceLanguage 특성(루트/비디오/인사이트 아래)으로 사용할 수 있습니다. 해당 신뢰도 점수는 sourceLanguageConfidence 특성에서 사용할 수도 있습니다.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

지침 및 제한 사항

LID(자동 언어 식별)는 다음 언어를 지원합니다.

지원되는 언어의 Azure AI Video Indexer 언어에서 지원되는 목록을 참조하세요.

  • 오디오에 지원되는 목록 이외의 언어가 포함된 경우 예기치 못한 결과가 발생합니다.
  • Azure AI Video Indexer가 충분히 높은 신뢰도(0.6보다 큼)로 언어를 식별할 수 없는 경우 대체 언어는 영어입니다.
  • 현재 혼합 언어 오디오를 사용하는 파일에 대한 지원은 없습니다. 오디오에 혼합된 언어가 포함되어 있으면 예기치 않은 결과가 발생합니다.
  • 저품질 오디오는 모델 결과에 영향을 미칠 수 있습니다.
  • 모델에는 오디오에서 1분 이상의 음성이 필요합니다.
  • 이 모델은 자연스러운 대화 음성(음성 명령, 노래 등이 아님)을 인식하도록 설계되었습니다.