Språkstöd i Azure AI Video Indexer

I den här artikeln beskrivs språkalternativen för Video Indexer och en lista över språkstöd för var och en. Den innehåller språkstöd för Video Indexer-funktioner, översättning, språkidentifiering, anpassning och språkinställningar för Video Indexer-webbplatsen.

Språk som stöds per scenario

I det här avsnittet beskrivs språkalternativen för Video Indexer och en tabell med de språk som stöds för var och en.

Viktigt!

Alla språk som anges stöder översättning vid indexering via API:et.

Kolumnförklaringar

  • Källspråk som stöds – det språk som talas i mediefilen som stöds för transkription, översättning och sökning.

  • Språkidentifiering – Om språket kan identifieras automatiskt av Video Indexer när språkidentifiering används för indexering. Mer information finns i Använda Azure AI Video Indexer för att identifiera talade språk automatiskt och avsnittet Språkidentifiering .

  • Anpassning (språkmodell) – Om språket kan användas vid anpassning av språkmodeller i Video Indexer. Mer information finns i Anpassa en språkmodell i Azure AI Video Indexer.

  • Uttal (språkmodell) – Om språket kan användas för att skapa en uttalsdatauppsättning som en del av en anpassad talmodell. Mer information finns i Anpassa en talmodell med Azure AI Video Indexer.

  • Webbplatsöversättning – Om språket stöds för översättning när du använder Azure AI Video Indexer-webbplatsen. Välj det översatta språket i den nedrullningsbara menyn för språk.

    Skärmbild som visar en meny med nedladdning, engelska och vyer som menyalternativ. En knappbeskrivning visas som mouseover på det engelska objektet och säger att översättningen är inställd på engelska.

    Följande insikter översätts:

    • Avskrift
    • Nyckelord
    • Ämnen
    • Etiketter
    • Rammönster (endast till hebreiska från och med nu)

    Alla andra insikter visas på engelska när du använder översättning.

  • Webbplatsspråk – Om språket kan väljas för användning på Webbplatsen för Azure AI Video Indexer. Välj ikonen Inställningar och välj sedan språket i listrutan Språkinställningar.

    Skärmbild som visar en meny med användarinställningar som visar alla växlade till på.

Språk Code Stöds
källspråk
Språk
Identifiering
Anpassning
(språkmodell)
Uttal
(språkmodell)
Webbplats
Översättning
Webbplats
Språk
Afrikaans af-ZA
Arabiska (Israel) ar-IL
Arabiska (Irak) ar-IQ
Arabiska (Jordanien) ar-JO
Arabiska (Kuwait) ar-KW
Arabiska (Libanon) ar-LB
Arabiska (Oman) ar-OM
Arabiska (palestinska myndigheten) ar-PS
Arabiska (Qatar) ar-QA
Arabiska (Saudiarabien) ar-SA
Arabiska (Förenade Arabemiraten) ar-AE
Arabiska Egypten ar-EG
Arabisk modern standard (Bahrain) ar-BH
Arabiska Arabrepubliken Syrien ar-SY
Armeniska hy-AM
Bangla bn-BD
Bosnian bs-Latn
Bulgariska bg-BG
Katalanska ca-ES
Kinesiska (kantonesiska traditionella) zh-HK
Kinesiska (förenklad) zh-Hans
Kinesiska (förenklad) zh-CK
Kinesiska (traditionell) zh-Hant
Kroatiska hr-HR
Tjeckiska cs-CZ
Danska da-DK
Nederländska nl-NL
Engelska Australien en-AU
Engelska Storbritannien en-GB
Engelska USA en-US
Estniska et-EE
Fijianska en-FJ
Filipino fil-PH
Finska fi-FI
Franska fr-FR
Franska (Kanada) fr-CA
Tyska de-DE
Grekiska el-GR
Gujarati gu-IN
Haitiska fr-HT
Hebreiska he-IL
Hindi hi-IN
Ungerska hu-HU
Isländska is-IS
Indonesiska id-ID
Iriska ga-IE
Italienska it-IT
Japanska ja-JP
Kannada kn-IN
Kiswahili sw-KE
Koreanska ko-KR
Lettiska lv-LV
Litauiska lt-LT
Malagassiska mg-MG
Malajiska ms-MY
Malayalam ml-IN
Maltesiska mt-MT
Norska nb-NO
Persiska fa-IR
Polska pl-PL
Portugisiska pt-BR
Portugisiska (Portugal) pt-PT
Rumänska ro-RO
Ryska ru-RU
Samoanska en-WS
Serbiska (kyrillisk) sr-Cyrl-RS
Serbiska (latinsk) (Serbien) sr-Latn-RS
Slovakiska sk-SK
Slovenska sl-SI
Spanska es-ES
Spanska (Mexiko) es-MX
Svenska sv-SE
Tamilska ta-IN
Telugu te-IN
Thailändska th-TH
Tonga till to-TO
Turkiska tr-TR
Ukrainska uk-UA
Urdu your-PK
Vietnamesiska vi-VN

Hämta språk som stöds via API:et

Använd API-anropet Hämta språk som stöds för att hämta en fullständig lista över språk som stöds per område. Mer information finns i Hämta språk som stöds.

API:et returnerar en lista över språk som stöds med följande värden:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Källspråk som stöds:

    Om isSourceLanguage är falskt stöds språket endast för översättning. Om isSourceLanguage är sant stöds språket som källa för transkription, översättning och sökning.

  • Språkidentifiering (automatisk identifiering):

    Om isAutoDetect är sant stöds språket för språkidentifiering (LID) och multispråksidentifiering (MLID).

Språkidentifiering

När du laddar upp en mediefil till Video Indexer kan du ange mediefilens källspråk. Om du indexerar en fil via Video Indexer-webbplatsen kan du göra detta genom att välja ett språk under filuppladdningen. Om du skickar indexeringsjobbet via API:et görs det med hjälp av språkparametern. Det valda språket används sedan för att generera transkriptionen av filen.

Om du inte är säker på mediefilens källspråk eller om det kan innehålla flera språk kan Video Indexer identifiera de talade språken. Om du väljer antingen Autoidentifiering av ett enda språk (LID) eller flera språk (MLID) för mediefilens källspråk används det identifierade språket eller språken för att transkribera mediefilen. Mer information om LID och MLID finns i Använda Azure AI Video Indexer för att identifiera talade språk automatiskt, se Identifiera det talade språket automatiskt med språkidentifieringsmodellen och Identifiera och transkribera innehåll på flera språk automatiskt

Det finns en gräns på 10 språk som tillåts för identifiering under indexeringen av en mediefil för både LID och MLID. Följande är de 9 standardspråken för språkidentifiering (LID) och multispråksidentifiering (MILD):

  • Tyska (de-DE)
  • Engelska USA (en-US)
  • Spanska (es-ES)
  • Franska (fr-FR)
  • Italienska (it-IT)
  • Japanska (ja-JP)
  • Portugisiska (pt-BR)
  • Ryska (ru-RU)
  • Kinesiska (förenklad) (zh-Hans)

Så här ändrar du listan över standardspråk

Om du behöver använda språk för identifiering som inte används som standard kan du anpassa listan till 10 språk som stöder anpassning via webbplatsen eller API:et:

Använd webbplatsen för att ändra listan

  1. Välj fliken Språk-ID under Modellanpassning. Listan över språk är specifik för det Video Indexer-konto som du använder och för den inloggade användaren. Standardlistan över språk sparas per användare på deras lokala enhet, per enhet och webbläsare. Därför kan varje användare konfigurera sin egen standardlista för identifierade språk.

  2. Använd Lägg till språk för att söka efter och lägga till fler språk. Om 10 språk redan har valts måste du först ta bort ett av de befintliga identifierade språken innan du lägger till ett nytt.

    Skärmbild som visar en tabell som visar alla valda språk.

Använd API:et för att ändra listan

När du laddar upp en fil korsreferenser 9 språk i Video Indexer-språkmodellen som standard. Om det finns en matchning genererar modellen transkriptionen för filen med det identifierade språket.

Använd språkparametern för att ange multi parametrar (MLID) eller auto (LID). Använd parametern customLanguages för att ange upp till 10 språk. (Parametern används endast när språkparametern är inställd på multi eller auto.) Mer information om hur du använder API :et finns i Använda Azure AI Video Indexer API.