Sdílet prostřednictvím


Automatická identifikace mluveného jazyka s využitím modelu identifikace jazyka

Upozorňující

Během minulého roku služba Azure AI Video Indexer (VI) oznámila odebrání závislosti na službě Azure Media Services (AMS) kvůli vyřazení. Byly oznámeny úpravy funkcí a změny a byl poskytnut průvodce migrací.

Termín dokončení migrace byl 30. června 2024. VI prodloužil termín aktualizace nebo migrace, abyste mohli aktualizovat svůj účet VI a přihlásit se k migraci prostředků AMS VI do 31. srpna 2024.

Pokud jste ale po 30. červnu neaktualizovalisvůj účet VI, nebudete moct indexovat nová videa ani nebudete moct přehrávat žádná videa, která nebyla migrována. Pokud aktualizujete svůj účet po 30. červnu, můžete obnovit indexování okamžitě, ale nebudete moct přehrávat videa indexovaná před aktualizací účtu, dokud se nemigrují prostřednictvím migrace AMS VI.

Azure AI Video Indexer podporuje automatickou identifikaci jazyka (LID), což je proces automatické identifikace mluveného jazyka ze zvukového obsahu. Multimediální soubor se přepisuje v dominantním identifikovaném jazyce.

Podívejte se na seznam podporovaných jazyků Azure AI Video Indexeru v podporovaných jazycích.

Nezapomeňte si projít část Pokyny a omezení .

Volba automatické identifikace jazyka při indexování

Při indexování nebo přeindexování videa pomocí rozhraní API zvolte auto detect možnost v parametru sourceLanguage .

Pokud používáte portál, přejděte na domovskou stránku Azure AI Video Indexeru na videasvého účtu a najeďte myší na název videa, které chcete přeindexovat. V pravém dolním rohu vyberte tlačítko Znovu indexovat . V dialogovém okně Znovu indexovat video zvolte v rozevíracím seznamu Jazyk zdroje videa možnost Automaticky rozpoznat.

Snímek obrazovky znázorňující, kde vybrat automatické rozpoznání

Výstup modelu

Azure AI Video Indexer video přepisuje podle nejpravděpodobnějšího jazyka, pokud je > 0.6spolehlivost daného jazyka . Pokud jazyk nelze identifikovat s jistotou, předpokládá se, že mluvený jazyk je angličtina.

Dominantní jazyk modelu je k dispozici ve formátu JSON přehledů sourceLanguage jako atribut (v kořenovém adresáři, videích nebo přehledech). Odpovídající skóre spolehlivosti je také k dispozici v rámci atributu sourceLanguageConfidence .

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Řízení a omezení.

Automatická identifikace jazyka (LID) podporuje následující jazyky:

Podívejte se na seznam podporovaných jazyků Azure AI Video Indexeru v podporovaných jazycích.

  • Pokud zvuk obsahuje jiné jazyky než podporovaný seznam, výsledek je neočekávaný.
  • Pokud Azure AI Video Indexer nedokáže identifikovat jazyk s vysokou spolehlivostí (větší než 0,6), je záložní jazyk angličtina.
  • V současné době nepodporuje soubory se zvukem ve smíšeném jazyce. Pokud zvuk obsahuje smíšené jazyky, výsledek je neočekávaný.
  • Výsledky modelu můžou mít vliv na zvuk s nízkou kvalitou.
  • Model vyžaduje alespoň jednu minutu řeči ve zvuku.
  • Model je navržený tak, aby rozpoznal spontánně konverzační řeč (ne hlasové příkazy, zpívání atd.).