Taalondersteuning in Azure AI Video Indexer
In dit artikel worden de taalopties van Video Indexer uitgelegd en vindt u een lijst met taalondersteuning voor elke taal. Het bevat de talenondersteuning voor Video Indexer-functies, vertaling, taalidentificatie, aanpassing en de taalinstellingen van de Video Indexer-website.
Ondersteunde talen per scenario
In deze sectie worden de taalopties van Video Indexer uitgelegd en is er een tabel met de ondersteunde talen voor elke taal.
Belangrijk
Alle vermelde talen ondersteunen vertaling bij het indexeren via de API.
Kolomuitleg
Ondersteunde brontaal : de taal die wordt gesproken in het mediabestand dat wordt ondersteund voor transcriptie, vertaling en zoeken.
Taalidentificatie : of de taal automatisch kan worden gedetecteerd door Video Indexer wanneer taalidentificatie wordt gebruikt voor indexering. Zie Azure AI Video Indexer gebruiken om gesproken talen en de sectie Taalidentificatie automatisch te identificeren voor meer informatie.
Aanpassing (taalmodel): of de taal kan worden gebruikt bij het aanpassen van taalmodellen in Video Indexer. Zie Een taalmodel aanpassen in Azure AI Video Indexer voor meer informatie.
Uitspraak (taalmodel): of de taal kan worden gebruikt om een uitspraakgegevensset te maken als onderdeel van een aangepast spraakmodel. Zie Een spraakmodel aanpassen met Azure AI Video Indexer voor meer informatie.
Websiteomzetting : of de taal wordt ondersteund voor vertaling wanneer u de Azure AI Video Indexer-website gebruikt. Selecteer de vertaalde taal in de vervolgkeuzelijst taal.
De volgende inzichten worden vertaald:
- Transcript
- Trefwoorden
- Onderwerpen
- Etiketten
- Framepatronen (vanaf nu alleen naar Hebreeuws)
Alle andere inzichten worden weergegeven in het Engels wanneer u vertaling gebruikt.
Websitetaal : of de taal kan worden geselecteerd voor gebruik op de Website van Azure AI Video Indexer. Selecteer het pictogram Instellingen en selecteer vervolgens de taal in de vervolgkeuzelijst Taalinstellingen .
Taal | Code | Ondersteund brontaal |
Taal identificatie |
Aanpassing (taalmodel) |
Uitspraak (taalmodel) |
Website Vertaling |
Website Taal |
---|---|---|---|---|---|---|---|
Afrikaans | af-ZA | ✔ | |||||
Arabisch (Israël) | ar-IL | ✔ | ✔ | ||||
Arabisch (Irak) | ar-IQ | ✔ | ✔ | ||||
Arabisch (Jordanië) | ar-JO | ✔ | ✔ | ✔ | |||
Arabisch (Koeweit) | ar-KW | ✔ | ✔ | ✔ | |||
Arabisch (Libanon) | ar-LB | ✔ | ✔ | ||||
Arabisch (Oman) | ar-OM | ✔ | ✔ | ✔ | |||
Arabisch (Palestijnse Autoriteit) | ar-PS | ✔ | ✔ | ||||
Arabisch (Qatar) | ar-QA | ✔ | ✔ | ✔ | |||
Arabisch (Saoedi-Arabië) | ar-SA | ✔ | ✔ | ✔ | |||
Arabisch (Verenigde Arabische Emiraten) | ar-AE | ✔ | ✔ | ✔ | |||
Arabisch Egypte | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Arabische Moderne Standaard (Arabisch) | ar-BH | ✔ | ✔ | ✔ | |||
Arabische Syrische Arabische Republiek | ar-SY | ✔ | ✔ | ✔ | |||
Armeens | hy-AM | ✔ | |||||
Bengaals | bn-BD | ✔ | |||||
Bosnisch | bs-Latn | ✔ | |||||
Bulgaars | bg-BG | ✔ | ✔ | ✔ | |||
Catalaans | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinees (Traditioneel Kantonees) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinees (vereenvoudigd) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Chinees (Vereenvoudigd) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Chinees (traditioneel) | zh-Hant | ✔ | |||||
Kroatisch | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Tsjechisch | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Deens | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Nederlands | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Engels Australië | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Engels Verenigd Koninkrijk | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Engels Verenigde Staten | nl | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Ests | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fijian | en-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | |||||
Fins | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Frans | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Frans (Canada) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Duits | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Grieks | el-GR | ✔ | ✔ | ✔ | |||
Gujarati | gu-IN | ✔ | ✔ | ✔ | |||
Haïtiaans | fr-HT | ✔ | |||||
Hebreeuws | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Hindi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Hongaars | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
IJslands | is-IS | ✔ | |||||
Indonesisch | id-ID | ✔ | ✔ | ✔ | |||
Iers | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italiaans | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japans | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kannada | kn-IN | ✔ | ✔ | ||||
Kiswahili | sw-KE | ✔ | |||||
Koreaans | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lets | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Litouws | lt-LT | ✔ | ✔ | ✔ | |||
Malagasy | mg-MG | ✔ | |||||
Maleisisch | ms-MY | ✔ | ✔ | ||||
Malayalam | ml-IN | ✔ | ✔ | ||||
Maltees | mt-MT | ✔ | |||||
Noors | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Perzisch | fa-IR | ✔ | ✔ | ✔ | |||
Pools | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugees | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugees (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Roemeens | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Russisch | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoan | en-WS | ||||||
Servisch (Cyrillisch) | sr-Cyrl-RS | ✔ | |||||
Servisch (Latijns) | sr-Latn-RS | ✔ | |||||
Slowaaks | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Sloveens | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Spaans | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Spaans (Mexico) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Zweeds | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tamil | ta-IN | ✔ | ✔ | ✔ | |||
Telugu | te-IN | ✔ | ✔ | ||||
Thai | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tonga | to-TO | ✔ | |||||
Turks | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Oekraïens | uk-UA | ✔ | ✔ | ✔ | |||
Urdu | your-PK | ✔ | |||||
Vietnamees | vi-VN | ✔ | ✔ | ✔ |
Ondersteunde talen ophalen via de API
Gebruik de API-aanroep Ondersteunde talen ophalen om een volledige lijst met ondersteunde talen per gebied op te halen. Zie Ondersteunde talen ophalen voor meer informatie.
De API retourneert een lijst met ondersteunde talen met de volgende waarden:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Ondersteunde brontaal:
Als
isSourceLanguage
dit onwaar is, wordt de taal alleen ondersteund voor vertaling. AlsisSourceLanguage
dit waar is, wordt de taal ondersteund als bron voor transcriptie, vertaling en zoeken.Taalidentificatie (automatische detectie):
Als
isAutoDetect
dit waar is, wordt de taal ondersteund voor taalidentificatie (LID) en multi-language identification (MLID).
Taalidentificatie
Wanneer u een mediabestand uploadt naar Video Indexer, kunt u de brontaal van het mediabestand opgeven. Als u een bestand indexeert via de Video Indexer-website, kunt u dit doen door een taal te selecteren tijdens het uploaden van het bestand. Als u de indexeringstaak via de API verzendt, wordt deze uitgevoerd met behulp van de taalparameter. De geselecteerde taal wordt vervolgens gebruikt om de transcriptie van het bestand te genereren.
Als u niet zeker bent van de brontaal van het mediabestand of als het meerdere talen bevat, kan Video Indexer de gesproken talen detecteren. Als u Voor de brontaal van het mediabestand automatische detectie (LID) of MLID (Multi-Language) selecteert, worden de gedetecteerde taal of talen gebruikt om het mediabestand te transcriberen. Zie Azure AI Video Indexer gebruiken voor het automatisch identificeren van gesproken talen voor meer informatie over LID en MLID. Zie Automatisch de gesproken taal identificeren met taalidentificatiemodel en inhoud in meerdere talen automatisch identificeren en transcriberen
Er is een limiet van 10 talen toegestaan voor identificatie tijdens het indexeren van een mediabestand voor zowel LID als MLID. Hieronder volgen de 9 standaardtalen van Language Identification (LID) en Multi-Language Identification (MILD):
- Duits (de-DE)
- Engels Verenigde Staten (en-US)
- Spaans (es-ES)
- Frans (fr-FR)
- Italiaans (it-IT)
- Japans (ja-JP)
- Portugees (pt-BR)
- Russisch (ru-RU)
- Chinees (vereenvoudigd) (zh-Hans)
De lijst met standaardtalen wijzigen
Als u talen wilt gebruiken voor identificatie die niet standaard worden gebruikt, kunt u de lijst aanpassen aan 10 talen die aanpassing via de website of de API ondersteunen:
De website gebruiken om de lijst te wijzigen
Selecteer het tabblad Taal-id onder Modelaanpassing. De lijst met talen is specifiek voor het Video Indexer-account dat u gebruikt en voor de aangemelde gebruiker. De standaardlijst met talen wordt per gebruiker opgeslagen op hun lokale apparaat, per apparaat en browser. Als gevolg hiervan kan elke gebruiker een eigen standaardlijst met geïdentificeerde talen configureren.
Gebruik Taal toevoegen om meer talen te zoeken en toe te voegen. Als er al 10 talen zijn geselecteerd, moet u eerst een van de bestaande gedetecteerde talen verwijderen voordat u een nieuwe taal toevoegt.
De API gebruiken om de lijst te wijzigen
Wanneer u een bestand uploadt, verwijst het taalmodel van Video Indexer standaard naar 9 talen. Als er een overeenkomst is, genereert het model de transcriptie voor het bestand met de gedetecteerde taal.
Gebruik de taalparameter om parameters (MLID) of auto
(LID) op te geven multi
. Gebruik de customLanguages
parameter om maximaal 10 talen op te geven. (De parameter wordt alleen gebruikt wanneer de taalparameter is ingesteld op multi
of auto
.) Zie De Azure AI Video Indexer-API gebruiken voor meer informatie over het gebruik van de API.