다음을 통해 공유


Azure AI Video Indexer의 언어 지원

이 문서에서는 Video Indexer의 언어 옵션을 설명하고 각각에 대한 언어 지원 목록을 제공합니다. 여기에는 Video Indexer 기능, 번역, 언어 식별, 사용자 지정 및 Video Indexer 웹 사이트의 언어 설정에 대한 언어 지원이 포함됩니다.

시나리오별 지원 언어

이 섹션에서는 Video Indexer 언어 옵션에 대해 설명하고 각각에 대해 지원되는 언어 표를 제공합니다.

Important

나열된 모든 언어는 API를 통해 인덱싱할 때 번역을 지원합니다.

열 설명

  • 지원되는 소스 언어 – 대화 기록, 번역 및 검색이 지원되는 미디어 파일에서 사용되는 언어입니다.

  • 언어 식별 - 인덱싱에 언어 식별이 사용될 때 Video Indexer에서 언어를 자동으로 검색할 수 있는지 여부를 나타냅니다. 자세한 내용은 Azure AI Video Indexer를 사용하여 음성 언어 자동 식별언어 식별 섹션을 참조하세요.

  • 사용자 지정(언어 모델) - Video Indexer에서 언어 모델을 사용자 지정할 때 언어를 사용할 수 있는지 여부를 나타냅니다. 자세한 내용은 Azure AI Video Indexer에서 언어 모델 사용자 지정을 참조하세요.

  • 발음(언어 모델) - 사용자 지정 음성 모델의 일부로 발음 데이터 세트를 만드는 데 언어를 사용할 수 있는지 여부를 나타냅니다. 자세한 내용은 Azure AI Video Indexer로 음성 모델 사용자 지정을 참조하세요.

  • 웹 사이트 번역Azure AI Video Indexer 웹 사이트를 사용할 때 번역에 언어가 지원되는지 여부를 나타냅니다. 언어 드롭다운 메뉴에서 번역된 언어를 선택합니다.

    다운로드, 영어 및 보기가 메뉴 항목으로 표시된 메뉴를 보여 주는 스크린샷 도구 설명은 영어 항목에 마우스로 표시되며 번역이 영어로 설정되어 있다고 말합니다.

    다음 인사이트가 번역됩니다.

    • 대본
    • 키워드
    • 토픽
    • 레이블
    • 프레임 패턴(현재 히브리어만 지원)

    다른 모든 인사이트는 번역을 사용할 때 영어로 표시됩니다.

  • 웹 사이트 언어 - Azure AI Video Indexer 웹 사이트에서 사용할 언어를 선택할 수 있는지 여부를 나타냅니다. 설정 아이콘을 선택한 다음 언어 설정 드롭다운에서 언어를 선택합니다.

    사용자 설정이 있는 메뉴를 보여 주는 스크린샷은 모두 켜진 것으로 표시됩니다.

언어 코드 지원됨
소스 언어
Language
식별
사용자 지정
(언어 모델)
발음
(언어 모델)
웹 사이트
번역
웹 사이트
언어
아프리칸스어 af-ZA
아랍어(이스라엘) AR-IL
아랍어(이라크) ar-IQ
아랍어(요르단) ar-JO
아랍어(쿠웨이트) ar-KW
아랍어(레바논) ar-LB
아랍어(오만) ar-OM
아랍어(팔레스타인 자치 정부) ar-PS
아랍어(카타르) ar-QA
아랍어(사우디아라비아) ar-SA
아랍어(아랍에미리트) ar-AE
아랍어(이집트) ar-EG
아랍어 현대 표준(바레인) ar-BH
아랍어(시리아) ar-SY
아르메니아 hy-AM
벵골어 bn-BD
보스니아 헤르체고비나어 bs-Latn
불가리아어 bg-BG
카탈로니아어 ca-ES
중국어(광둥어 번체) zh-HK
중국어(간체) zh-Hans
중국어(간체) zh-CK
중국어(번체) zh-Hant
크로아티아어 hr-HR
체코어 cs CZ
덴마크어 da-DK
네덜란드어 nl-NL
영어(오스트레일리아) en-AU
영어(영국) en-GB
영어(미국) en-US
에스토니아어 et-EE
피지어 en-FJ
필리핀어 fil-PH
핀란드어 fi-FI
프랑스어 fr-FR
프랑스어(캐나다) fr-CA
독일어 de-DE
그리스어 el-GR
구자라트어 gu-IN
아이티어 fr-HT
히브리어 he-IL
힌디어 hi-IN
헝가리어 hu-HU
아이슬란드어 is-IS
인도네시아어 id-ID
아일랜드어 ga-IE
이탈리아어 it-IT
일본어 ja-JP
칸나다어 kn-IN
스와힐리어 sw-KE
한국어 ko-KR
라트비아어 lv-LV
리투아니아어 lt-LT
말라가시어 mg-MG
말레이어 ms-MY
말라얄람어 ml-IN
몰타어 mt-MT
노르웨이어 nb-NO
페르시아어 fa-IR
폴란드어 pl-PL
포르투갈어 pt-BR
포르투갈어(포르투갈) pt-PT
루마니아어 ro-RO
러시아어 ru-RU
사모아어 en-WS
세르비아어(키릴 자모) sr-Cyrl-RS
세르비아어(라틴 문자) sr-Latn-RS
슬로바키아어 sk-SK
슬로베니아어 sl-SI
스페인어 es-ES
스페인어(멕시코) es-MX
스웨덴어 sv-SE
타밀어 ta-IN
텔루구어 te-IN
태국어 th-TH
통가어 to-TO
터키어 tr-TR
우크라이나어 uk-UA
우르두어 ur-PK
베트남어 vi-VN

API를 통해 지원되는 언어 가져오기

Get Supported Languages API 호출을 사용하여 지역별로 지원되는 언어의 전체 목록을 가져옵니다. 자세한 내용은 지원되는 언어 가져오기를 참조하세요.

API는 다음 값과 함께 지원되는 언어 목록을 반환합니다.

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • 지원되는 소스 언어:

    isSourceLanguage가 false이면 해당 언어는 번역에만 지원됩니다. isSourceLanguage가 true인 경우 해당 언어는 대화 기록, 번역 및 검색을 위한 원본으로 지원됩니다.

  • 언어 식별(자동 검색):

    isAutoDetect가 true이면 해당 언어는 언어 식별(LID) 및 다국어 식별(MLID)에 지원됩니다.

언어 식별

Video Indexer에 미디어 파일을 업로드할 때 미디어 파일의 소스 언어를 지정할 수 있습니다. Video Indexer 웹 사이트를 통해 파일을 인덱싱하는 경우 파일 업로드 중에 언어를 선택하면 됩니다. API를 통해 인덱싱 작업을 제출하는 경우 언어 매개 변수를 사용하여 완료됩니다. 그런 다음 선택한 언어를 사용하여 파일의 대화 기록을 생성합니다.

미디어 파일의 소스 언어가 확실하지 않거나 여러 언어가 포함된 경우 Video Indexer에서 음성 언어를 검색할 수 있습니다. 미디어 파일의 소스 언어로 자동 검색 단일 언어(LID) 또는 다중 언어(MLID)를 선택하면 검색된 언어가 미디어 파일을 전사하는 데 사용됩니다. LID 및 MLID에 대해 자세히 알아보려면 Azure AI Video Indexer를 사용하여 음성 언어 자동 식별, 언어 식별 모델로 음성 언어 자동 식별다국어 콘텐츠 자동 식별 및 전사를 참조하세요.

LID 및 MLID 모두에 대해 미디어 파일을 인덱싱하는 동안 식별에 허용되는 언어는 10개로 제한됩니다. 다음은 언어 식별(LID) 및 다국어 식별(MILD)의 9가지 기본 언어입니다.

  • 독일어(de-DE)
  • 영어 미국(en-US)
  • 스페인어(es-ES)
  • 프랑스어(fr-FR)
  • 이탈리아어(it-IT)
  • 일본어(ja-JP)
  • 포르투갈어(pt-BR)
  • 러시아어(ru-RU)
  • 중국어(간체)(zh-Hans)

기본 언어 목록을 변경하는 방법

기본적으로 사용되지 않는 식별 언어를 사용해야 하는 경우 웹 사이트 또는 API를 통해 사용자 지정을 지원하는 10개 언어로 목록을 사용자 지정할 수 있습니다.

웹 사이트를 사용하여 목록 변경

  1. 모델 사용자 지정에서 언어 ID 탭을 선택합니다. 언어 목록은 사용 중인 Video Indexer 계정과 로그인한 사용자에 따라 다릅니다. 기본 언어 목록은 로컬 디바이스의 사용자별, 디바이스별 및 브라우저별로 저장됩니다. 결과적으로 각 사용자는 고유한 기본 식별 언어 목록을 구성할 수 있습니다.

  2. 더 많은 언어를 검색하고 추가하려면 언어 추가를 사용합니다. 10개 언어가 이미 선택된 경우 새 언어를 추가하기 전에 먼저 검색된 기존 언어 중 하나를 제거해야 합니다.

    선택한 모든 언어를 보여 주는 테이블을 보여 주는 스크린샷

API를 사용하여 목록 변경

파일을 업로드할 때 Video Indexer 언어 모델은 기본적으로 9개 언어를 상호 참조합니다. 일치하는 항목이 있는 경우 모델은 검색된 언어로 파일에 대한 대화 기록을 생성합니다.

언어 매개 변수를 사용하여 multi(MLID) 또는 auto(LID) 매개 변수를 지정합니다. customLanguages 매개 변수를 사용하여 최대 10개 언어를 지정합니다. (매개 변수는 언어 매개 변수가 multi 또는 auto로 설정된 경우에만 사용됩니다.) API 사용에 대한 자세한 내용은 Azure AI Video Indexer API 사용을 참조하세요.