Freigeben über


Sprachunterstützung in Azure AI Video Indexer

In diesem Artikel werden die Sprachoptionen von Video Indexer erläutert und eine Liste der Sprachunterstützung für jeden bereitgestellt. Es enthält die Sprachenunterstützung für Video Indexer-Features, Übersetzung, Sprachidentifikation, Anpassung und die Spracheinstellungen der VideoIndexer-Website.

Unterstützte Sprachen pro Szenario

In diesem Abschnitt werden die Sprachoptionen für die Videoindexer erläutert und eine Tabelle der unterstützten Sprachen für die einzelnen Sprachen enthalten.

Wichtig

  • Bei der Indizierung mit Azure Video Indexer unterstützen alle aufgeführten Sprachen übersetzungen beim Indizieren über die API.
  • Wenn die Indizierung mit von Arc aktivierter Azure AI Video Indexer sowohl über die Webapp als auch über die API unterstützt wird, wird nur Übersetzung in Englisch unterstützt.

Erläuterungen zu Spalten

  • Unterstützte Quellsprache – Die in der Mediendatei gesprochene Sprache, die für Transkription, Übersetzung und Suche unterstützt wird.

  • Sprachidentifikation – Gibt an, ob die Sprache automatisch von der Videoindexer erkannt werden kann, wenn die Sprachidentifikation für die Indizierung verwendet wird. Weitere Informationen finden Sie unter Verwenden von Azure AI Video Indexer, um gesprochene Sprachen und den Abschnitt "Sprachidentifikation " automatisch zu identifizieren.

  • Anpassung (Sprachmodell) – Gibt an, ob die Sprache beim Anpassen von Sprachmodellen im Videoindexer verwendet werden kann. Weitere Informationen finden Sie unter Anpassen eines Sprachmodells in Azure AI Video Indexer.

  • Aussprache (Sprachmodell) – Gibt an, ob die Sprache zum Erstellen eines Aussprache-Datasets als Teil eines benutzerdefinierten Sprachmodells verwendet werden kann. Weitere Informationen finden Sie unter Anpassen eines Sprachmodells mit azure AI Video Indexer.

  • Websiteübersetzung: Gibt an, ob die Übersetzung der Sprache bei Verwendung der Azure KI Video Indexer-Website unterstützt wird. Wählen Sie die übersetzte Sprache im Dropdownmenü "Sprache" aus.

    Screenshot eines Menüs mit den Menüelementen „Download“, „Englisch“ und „Ansichten“. Eine QuickInfo wird angezeigt, wenn mit der Maus auf das Element „Englisch“ gezeigt wird. Sie besagt, dass die Übersetzung ins Englische festgelegt ist.

    Die folgenden Erkenntnisse werden übersetzt:

    • Textaufzeichnung
    • Schlüsselwörter
    • Themen
    • Beschriftungen
    • Rahmenmuster (derzeit nur für Hebräisch verfügbar)

    Alle anderen Erkenntnisse werden bei Verwendung der Übersetzung in Englisch angezeigt.

  • Websitesprache – Gibt an, ob die Sprache für die Verwendung auf der Azure AI Video Indexer-Website ausgewählt werden kann. Wählen Sie das Symbol "Einstellungen" und dann die Sprache im Dropdownmenü " Spracheinstellungen " aus.

    Screenshot eines Menüs mit Benutzereinstellungen, die alle aktiviert sind.

Sprache Code   Abgestützt
Ausgangssprache
Abgestützt
Quellsprache (Arc)
Sprache
identifikation
Anpassung
(Sprachmodell)
Aussprache
(Sprachmodell)
Website
Übersetzung
Website
Sprache
Afrikaans af-ZA
Arabisch (Israel) ar-IL
Arabisch (Irak) ar-IQ
Arabisch (Jordanien) ar-JO
Arabisch (Kuwait) ar-KW
Arabisch (Libanon) ar-LB
Arabisch (Oman) ar-OM
Arabisch (Palästinensische Autonomiebehörde) ar-PS
Arabisch (Katar) ar-QA
Arabisch (Saudi-Arabien) ar-SA
Arabisch (Vereinigte Arabische Emirate) ar-AE
Arabisch (Ägypten) ar-EG
Arabisch (Modernes Standardarabisch, Bahrain) ar-BH
Arabisch (Arabische Republik Syrien) ar-SY
Armenisch hy-AM
Bengalisch bn-BD
Bosnisch bs-Latn
Bulgarisch bg-BG
Katalanisch ca-ES
Chinesisch (Kantonesisch, traditionell) zh-HK
Chinesisch (vereinfacht) zh-Hans
Chinesisch (vereinfacht) zh-CK
Chinesisch (traditionell) zh-Hant
Kroatisch hr-HR
Tschechisch Tschechisch (cs-CZ)
Dänisch da-DK
Niederländisch nl-NL
Englisch (Australien) en-AU
Englisch (Vereinigtes Königreich) en-GB
Englisch (USA) de-DE
Estnisch et-EE
Fidschianisch en-FJ
Philippinisch fil-PH
Finnisch FI-FI
Französisch fr-FR
Französisch (Kanada) fr-CA
Deutsch de-DE
Griechisch el-GR
Gujarati gu-IN
Haitianisch fr-HT
Hebräisch he-IL
Hindi hi-IN
Ungarisch hu-HU
Isländisch is-IS
Indonesisch id-ID
Irisch ga-IE
Italienisch it-IT
Japanisch ja-JP
Kannada kn-IN
Suaheli sw-KE
Koreanisch ko-KR
Lettisch lv-LV
Litauisch lt-LT
Madagassisch mg-MG
Malaiisch ms-MY
Malayalam ml-IN
Maltesisch mt-MT
Norwegisch nb-NO
Persisch fa-IR
Polnisch pl-PL
Portugiesisch pt-BR
Portugiesisch (Portugal) pt-PT
Rumänisch ro-RO
Russisch ru-RU
Samoisch en-WS
Serbisch (Kyrillisch) sr-Cyrl-RS
Serbisch (Lateinisch) sr-Latn-RS
Slowakisch sk-SK
Slowenisch sl-SI
Spanisch es-ES
Spanisch (Mexiko) es-MX
Schwedisch sv-SE
Tamilisch ta-IN
Telugu te-IN
Thailändisch th-TH
Tongaisch to-TO
Türkisch tr-TR
Ukrainisch uk-UA
Urdu ur-PK
Vietnamesisch vi-VN

Abrufen unterstützter Sprachen über die API

Verwenden Sie den API-Aufruf "Unterstützte Sprachen abrufen", um eine vollständige Liste der unterstützten Sprachen pro Bereich abzurufen. Weitere Informationen finden Sie unter "Unterstützte Sprachen abrufen".

Die API gibt eine Liste der unterstützten Sprachen mit den folgenden Werten zurück:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Unterstützte Quellsprache:

    Ist isSourceLanguage "false" angegeben, wird die Sprache nur für die Übersetzung unterstützt. Ist isSourceLanguage dies der Fall, wird die Sprache als Quelle für Transkription, Übersetzung und Suche unterstützt.

  • Sprachenerkennung (automatische Erkennung):

    Ist isAutoDetect dies der Fall, wird die Sprache für die Sprachidentifikation (LID) und die mehrsprachige Identifikation (Multi-Language Identification, MLID) unterstützt.

Sprachidentifikation

Beim Hochladen einer Mediendatei in den Videoindexer können Sie die Quellsprache der Mediendatei angeben. Wenn Sie eine Datei über die Videoindexer-Website indizieren, können Sie eine Sprache während des Dateiuploads auswählen. Wenn Sie den Indizierungsauftrag über die API übermitteln, erfolgt dies mithilfe des Sprachparameters. Die ausgewählte Sprache wird dann verwendet, um die Transkription der Datei zu generieren.

Wenn Sie nicht sicher sind, dass die Quellsprache der Mediendatei vorhanden ist oder sie mehrere Sprachen enthalten kann, kann Der Videoindexer die gesprochenen Sprachen erkennen. Wenn Sie für die Quellsprache der Mediendatei entweder "Automatische Erkennung einer Einzelsprache (LID)" oder "Mehrsprachige Erkennung (MLID)" auswählen, werden die erkannten Sprache(n) verwendet, um die Mediendatei zu transkribieren. Weitere Informationen zu LID und MLID finden Sie unter Verwenden von Azure AI Video Indexer zum automatischen Identifizieren gesprochener Sprachen, siehe Automatisches Identifizieren der gesprochenen Sprache mit sprachidentifizierungsmodell und automatisches Identifizieren und Transkribieren von mehrsprachigen Inhalten

Es gilt eine Beschränkung von 10 Sprachen, die zur Identifizierung während der Indizierung einer Mediendatei für LID und MLID zulässig sind. Im Folgenden sind die neun Standardsprachen der Sprachidentifikation (LID) und Multi-Language Identification (MILD) aufgeführt:

  • Deutsch (de-DE)
  • Englisch USA (en-US)
  • Spanisch (es-ES)
  • Französisch (fr-FR)
  • Italienisch (it-IT)
  • Japanisch (ja-JP)
  • Portugiesisch (pt-BR)
  • Russisch (ru-RU)
  • Chinesisch (vereinfacht) (zh-Hans)

So ändern Sie die Liste der Standardsprachen

Wenn Sie Sprachen für die Identifizierung verwenden müssen, die nicht standardmäßig verwendet werden, können Sie die Liste auf alle 10 Sprachen anpassen, die anpassungen über die Website oder die API unterstützen:

Verwenden der Website zum Ändern der Liste

  1. Wählen Sie die Registerkarte "Sprach-ID " unter "Modellanpassung" aus. Die Liste der Sprachen ist spezifisch für das Videoindexer-Konto, das Sie verwenden, und für den angemeldeten Benutzer. Die Standardliste der Sprachen wird pro Benutzer auf ihrem lokalen Gerät, pro Gerät und Browser gespeichert. Daher kann jeder Benutzer seine eigene standardidente Sprachliste konfigurieren.

  2. Verwenden Sie "Sprache hinzufügen", um weitere Sprachen zu suchen und hinzuzufügen. Wenn bereits 10 Sprachen ausgewählt sind, müssen Sie zuerst eine der vorhandenen erkannten Sprachen entfernen, bevor Sie eine neue sprache hinzufügen.

    Screenshot einer Tabelle mit allen ausgewählten Sprachen.

Verwenden der API zum Ändern der Liste

Wenn Sie eine Datei hochladen, verweist das Videoindexer-Sprachmodell standardmäßig auf neun Sprachen. Wenn eine Übereinstimmung vorliegt, generiert das Modell die Transkription für die Datei mit der erkannten Sprache.

Verwenden Sie den Sprachparameter, um die Parameter multi (MLID) oder auto (LID) anzugeben. Verwenden Sie den customLanguages Parameter, um bis zu 10 Sprachen anzugeben. (Der Parameter wird nur verwendet, wenn der Sprachparameter auf multi oder auto festgelegt ist.) Weitere Informationen zur Verwendung der API finden Sie unter Verwendung der Azure AI Video Indexer-API.