Automatická identifikace mluveného jazyka s využitím modelu identifikace jazyka

Důležité

Vzhledem k oznámení o vyřazení služby Azure Media Services vám Azure AI Video Indexer oznámí úpravy funkcí Azure AI Video Indexeru. Informace o tom, co to znamená pro váš účet Azure AI Video Indexer, najdete v tématu Změny související s vyřazením služby Azure Media Service (AMS). Podívejte se na průvodce přípravou na vyřazení AMS: Průvodce aktualizací VI a migrací.

Azure AI Video Indexer podporuje automatickou identifikaci jazyka (LID), což je proces automatické identifikace mluveného jazyka ze zvukového obsahu. Multimediální soubor se přepisuje v dominantním identifikovaném jazyce.

Podívejte se na seznam podporovaných jazyků Azure AI Video Indexeru v podporovaných jazycích.

Nezapomeňte si projít část Pokyny a omezení .

Volba automatické identifikace jazyka při indexování

Při indexování nebo přeindexování videa pomocí rozhraní API zvolte auto detect možnost v parametru sourceLanguage .

Pokud používáte portál, přejděte na domovskou stránku Azure AI Video Indexeru na videasvého účtu a najeďte myší na název videa, které chcete přeindexovat. V pravém dolním rohu vyberte tlačítko Znovu indexovat . V dialogovém okně Znovu indexovat video zvolte v rozevíracím seznamu Jazyk zdroje videa možnost Automaticky rozpoznat.

Snímek obrazovky znázorňující, kde vybrat automatické rozpoznání

Výstup modelu

Azure AI Video Indexer video přepisuje podle nejpravděpodobnějšího jazyka, pokud je > 0.6spolehlivost daného jazyka . Pokud jazyk nelze identifikovat s jistotou, předpokládá se, že mluvený jazyk je angličtina.

Dominantní jazyk modelu je k dispozici ve formátu JSON přehledů sourceLanguage jako atribut (v kořenovém adresáři, videích nebo přehledech). Odpovídající skóre spolehlivosti je také k dispozici v rámci atributu sourceLanguageConfidence .

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Řízení a omezení.

Automatická identifikace jazyka (LID) podporuje následující jazyky:

Podívejte se na seznam podporovaných jazyků Azure AI Video Indexeru v podporovaných jazycích.

  • Pokud zvuk obsahuje jiné jazyky než podporovaný seznam, výsledek je neočekávaný.
  • Pokud Azure AI Video Indexer nedokáže identifikovat jazyk s vysokou spolehlivostí (větší než 0,6), je záložní jazyk angličtina.
  • V současné době nepodporuje soubory se zvukem ve smíšeném jazyce. Pokud zvuk obsahuje smíšené jazyky, výsledek je neočekávaný.
  • Výsledky modelu můžou mít vliv na zvuk s nízkou kvalitou.
  • Model vyžaduje alespoň jednu minutu řeči ve zvuku.
  • Model je navržený tak, aby rozpoznal spontánně konverzační řeč (ne hlasové příkazy, zpívání atd.).