Udostępnij za pośrednictwem


Obsługa języka w usłudze Azure AI Video Indexer

W tym artykule opisano opcje języka usługi Video Indexer i przedstawiono listę obsługi języków dla każdego z nich. Obejmuje ona obsługę języków funkcji usługi Video Indexer, tłumaczenia, identyfikacji języka, dostosowywania i ustawień języka witryny internetowej usługi Video Indexer.

Obsługiwane języki na scenariusz

W tej sekcji opisano opcje języka usługi Video Indexer oraz tabelę obsługiwanych języków dla każdego z nich.

Ważne

Wszystkie wymienione języki obsługują tłumaczenie podczas indeksowania za pośrednictwem interfejsu API.

Wyjaśnienia kolumn

  • Obsługiwany język źródłowy — język używany w pliku multimedialnym obsługiwany do transkrypcji, tłumaczenia i wyszukiwania.

  • Identyfikacja języka — określa, czy język może zostać automatycznie wykryty przez usługę Video Indexer, gdy na potrzeby indeksowania jest używana identyfikacja języka. Aby dowiedzieć się więcej, zobacz Używanie usługi Azure AI Video Indexer do automatycznego identyfikowania języków mówionych i sekcji Identyfikacja języka.

  • Dostosowywanie (model językowy) — określa, czy język może być używany podczas dostosowywania modeli językowych w usłudze Video Indexer. Aby dowiedzieć się więcej, zobacz Dostosowywanie modelu językowego w usłudze Azure AI Video Indexer.

  • Wymowa (model językowy) — określa, czy język może służyć do tworzenia zestawu danych wymowy w ramach niestandardowego modelu mowy. Aby dowiedzieć się więcej, zobacz Dostosowywanie modelu mowy za pomocą usługi Azure AI Video Indexer.

  • Tłumaczenie witryny internetowej — określa, czy język jest obsługiwany do tłumaczenia podczas korzystania z witryny internetowej usługi Azure AI Video Indexer. Wybierz przetłumaczony język w menu rozwijanym języka.

    Zrzut ekranu przedstawiający menu z menu pobierania, języka angielskiego i widoków jako elementów menu. Etykietka narzędzia jest wyświetlana jako myszka w elemencie angielskim i mówi Tłumaczenie jest ustawione na angielski.

    Przetłumaczone są następujące szczegółowe informacje:

    • Transkrypcja
    • Słowa kluczowe
    • Tematy
    • Etykiety
    • Wzorce ramek (tylko do hebrajskiego od teraz)

    Wszystkie inne szczegółowe informacje są wyświetlane w języku angielskim podczas korzystania z tłumaczenia.

  • Język witryny internetowej — określa, czy język można wybrać do użycia w witrynie internetowej usługi Azure AI Video Indexer. Wybierz ikonę Ustawienia, a następnie wybierz język z listy rozwijanej Ustawienia języka.

    Zrzut ekranu przedstawiający menu z ustawieniami użytkownika pokazujące, że wszystkie są włączone.

Język Kod Obsługiwane
język źródłowy
Język
identyfikacja
Dostosowywania
(model językowy)
Wymowa
(model językowy)
Witryna internetowa
Tłumaczenie
Witryna internetowa
Język
Afrikaans af-ZA
Arabski (Izrael) ar-IL
Arabski (Irak) ar-IQ
Arabski (Jordania) ar-JO
Arabski (Kuwejt) ar-KW
Arabski (Liban) ar-LB
Arabski (Oman) ar-OM
Arabski (Autonomia Palestyńska) ar-PS
Arabski (Katar) ar-QA
Arabski (Arabia Saudyjska) ar-SA
Arabski (Zjednoczone Emiraty Arabskie) ar-AE
Arabski Egipt ar-EG
Arabski nowoczesny standard (Bahrajn) ar-BH
Arabska Republika Arabska ar-SY
Ormiański hy-AM
Bangla bn-BD
Bośniacki bs-Latn
Bułgarski bg-BG
Kataloński ca-ES
Chiński (tradycyjny kantoński) zh-HK
chiński (uproszczony) zh-Hans
Chiński (uproszczony) zh-CK
chiński (tradycyjny) zh-Hant
Chorwacki hr-HR
czeski, cs-CZ
duński da-DK
Niderlandzki nl-NL
Australia angielska en-AU
Angielski Zjednoczone Królestwo en-GB
Stany Zjednoczone angielski en-US
Estoński et-EE
Fidżijski en-FJ
Filipino fil-PH
fiński fi-FI
Francuski fr-FR
Francuski (Kanada) fr-CA
Niemiecki de-DE
Grecki el-GR
Gudżarati gu-IN
Haitański fr-HT
Hebrajski he-IL
Hindi hi-IN
Węgierski hu-HU
Islandzki is-IS
Indonezyjski id-ID
Irlandzki ga-IE
Włoski it-IT
Japoński ja-JP
Kannada kn-IN
Suahili sw-KE
Koreański ko-KR
Łotewski lv-LV
Litewski lt-LT
Malgaski mg-MG
Malajski ms-MY
Malayalam ml-IN
Maltański mt-MT
Norweski nb-NO
Perski fa-IR
Polski pl-PL
Portugalski pt-BR
portugalski (Portugalia) pt-PT
Rumuński ro-RO
Rosyjski ru-RU
Samoański en-WS
Serbski (cyrylica) sr-Cyrl-RS
Serbski (łaciński) sr-Latn-RS
Słowacki sk-SK
Słoweński sl-SI
Hiszpański es-ES
Hiszpański (Meksyk) es-MX
Szwedzki sv-SE
Tamilski ta-IN
Telugu te-IN
Tajlandzki th-TH
Tonga do-DO
Turecki tr-TR
Ukraiński uk-UA
Urdu twój klucz PK
Wietnamski vi-VN

Uzyskiwanie obsługiwanych języków za pośrednictwem interfejsu API

Użyj wywołania interfejsu API Pobierz obsługiwane języki, aby ściągnąć pełną listę obsługiwanych języków na obszar. Aby uzyskać więcej informacji, zobacz Uzyskiwanie obsługiwanych języków.

Interfejs API zwraca listę obsługiwanych języków z następującymi wartościami:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Obsługiwany język źródłowy:

    Jeśli isSourceLanguage jest to fałsz, język jest obsługiwany tylko do tłumaczenia. Jeśli isSourceLanguage to prawda, język jest obsługiwany jako źródło transkrypcji, tłumaczenia i wyszukiwania.

  • Identyfikacja języka (automatyczne wykrywanie):

    Jeśli isAutoDetect to prawda, język jest obsługiwany do identyfikacji języka (LID) i identyfikacji wielojęzycznej (MLID).

Identyfikacja języka

Podczas przekazywania pliku multimedialnego do usługi Video Indexer można określić język źródłowy pliku multimedialnego. W przypadku indeksowania pliku za pośrednictwem witryny internetowej usługi Video Indexer można to zrobić, wybierając język podczas przekazywania pliku. Jeśli przesyłasz zadanie indeksowania za pośrednictwem interfejsu API, odbywa się to przy użyciu parametru języka. Wybrany język jest następnie używany do generowania transkrypcji pliku.

Jeśli nie masz pewności co do języka źródłowego pliku multimedialnego lub może zawierać wiele języków, usługa Video Indexer może wykryć języki mówione. W przypadku wybrania opcji Automatycznego wykrywania pojedynczego języka (LID) lub wielojęzycznego (MLID) dla języka źródłowego pliku multimedialnego wykryty język lub języki będą używane do transkrypcji pliku multimedialnego. Aby dowiedzieć się więcej na temat LID i MLID, zobacz Używanie usługi Azure AI Video Indexer do automatycznego identyfikowania języków mówionych, zobacz Automatyczne identyfikowanie języka mówionego za pomocą modelu identyfikacji języka i Automatyczne identyfikowanie i transkrypcja zawartości w wielu językach

Istnieje limit 10 języków dozwolonych do identyfikacji podczas indeksowania pliku multimedialnego zarówno dla LID, jak i MLID. Poniżej przedstawiono 9 domyślnych języków identyfikacji języka (LID) i identyfikacji wielojęzycznej (MILD):

  • Niemiecki (de-DE)
  • Angielski Stany Zjednoczone (en-US)
  • Hiszpański (es-ES)
  • Francuski (fr-FR)
  • Włoski (it-IT)
  • Japoński (ja-JP)
  • Portugalski (pt-BR)
  • Rosyjski (ru-RU)
  • Chiński (uproszczony) (zh-Hans)

Jak zmienić listę języków domyślnych

Jeśli musisz używać języków do identyfikacji, które nie są domyślnie używane, możesz dostosować listę do 10 języków, które obsługują dostosowywanie za pośrednictwem witryny internetowej lub interfejsu API:

Zmienianie listy za pomocą witryny internetowej

  1. Wybierz kartę Identyfikator języka w obszarze Dostosowywanie modelu. Lista języków jest specyficzna dla używanego konta usługi Video Indexer i dla zalogowanego użytkownika. Domyślna lista języków jest zapisywana dla użytkownika na urządzeniu lokalnym, na urządzenie i przeglądarkę. W związku z tym każdy użytkownik może skonfigurować własną domyślną listę języków zidentyfikowanych.

  2. Użyj polecenia Dodaj język , aby wyszukać i dodać więcej języków. Jeśli wybrano już 10 języków, należy najpierw usunąć jeden z istniejących wykrytych języków przed dodaniem nowego.

    Zrzut ekranu przedstawiający tabelę przedstawiającą wszystkie wybrane języki.

Zmienianie listy przy użyciu interfejsu API

Podczas przekazywania pliku model językowy usługi Video Indexer domyślnie odwołuje się do 9 języków. Jeśli istnieje dopasowanie, model generuje transkrypcję dla pliku z wykrytym językiem.

Użyj parametru języka, aby określić multi parametry (MLID) lub auto (LID). Użyj parametru customLanguages , aby określić maksymalnie 10 języków. (Parametr jest używany tylko wtedy, gdy parametr języka jest ustawiony na multi lub auto.) Aby dowiedzieć się więcej na temat korzystania z interfejsu API, zobacz Korzystanie z interfejsu API usługi Azure AI Video Indexer.