Sdílet prostřednictvím


Automatická identifikace a přepis vícejazyčného obsahu

Upozorňující

Během minulého roku služba Azure AI Video Indexer (VI) oznámila odebrání závislosti na službě Azure Media Services (AMS) kvůli vyřazení. Byly oznámeny úpravy funkcí a změny a byl poskytnut průvodce migrací.

Termín dokončení migrace byl 30. června 2024. VI prodloužil termín aktualizace nebo migrace, abyste mohli aktualizovat svůj účet VI a přihlásit se k migraci prostředků AMS VI do 31. srpna 2024.

Pokud jste ale po 30. červnu neaktualizovalisvůj účet VI, nebudete moct indexovat nová videa ani nebudete moct přehrávat žádná videa, která nebyla migrována. Pokud aktualizujete svůj účet po 30. červnu, můžete obnovit indexování okamžitě, ale nebudete moct přehrávat videa indexovaná před aktualizací účtu, dokud se nemigrují prostřednictvím migrace AMS VI.

Azure AI Video Indexer podporuje automatickou identifikaci jazyka a přepis v obsahu ve více jazycích. Tento proces zahrnuje automatickou identifikaci mluveného jazyka v různých segmentech od zvuku, odesílání každého segmentu mediálního souboru, který se má přepis přepisovat, a zkombinovat přepis zpět do jednoho sjednoceného přepisu.

Volba vícejazyčné identifikace při indexování pomocí portálu

Při nahrávání a indexování videa můžete zvolit detekci více jazyků. Alternativně můžete při přeindexování videa zvolit rozpoznávání více jazyků. Následující kroky popisují, jak přeindexovat:

  1. Přejděte na web Azure AI Video Indexer a přihlaste se.

  2. Přejděte na stránku Knihovna a najeďte myší na název videa, které chcete přeindexovat.

  3. V pravém dolním rohu vyberte tlačítko Znovu indexovat video .

  4. V dialogovém okně Znovu indexovat video v rozevíracím seznamu Jazyk videa zvolte rozpoznávání více jazyků.

    • Když se video indexuje ve více jazycích, uživatel zobrazí segment, ve kterém jazyce se přepisuje.
    • Překlad do všech jazyků je plně dostupný z přepisu ve více jazycích.
    • Všechny ostatní přehledy se zobrazí v jazyce, který ve zvukovém přenosu detekoval nejvíce.
    • Titulky na přehrávači jsou k dispozici i ve více jazycích.

Prostředí portálu

Volba vícejazyčné identifikace při indexování pomocí rozhraní API

Při indexování nebo přeindexování videa pomocí rozhraní API zvolte multi-language detection možnost v parametru sourceLanguage .

Výstup modelu

Model načte všechny jazyky zjištěné ve videu v jednom seznamu.

"sourceLanguage": null,
"sourceLanguages": [
    "es-ES",
    "en-US"
],

Kromě toho každá instance v části přepisu obsahuje jazyk, ve kterém byl přepisován.

{
  "id": 136,
  "text": "I remember well when my youth Minister took me to hear Doctor King I was a teenager.",
  "confidence": 0.9343,
  "speakerId": 1,
  "language": "en-US",
  "instances": [
    {
       "adjustedStart": "0:21:10.42",
       "adjustedEnd": "0:21:17.48",
       "start": "0:21:10.42",
       "end": "0:21:17.48"
    }
  ]
},

Řízení a omezení.

  • Zvuk, který obsahuje jiné jazyky než ty, které jste vybrali, způsobí neočekávané výsledky.
  • Minimální délka segmentu pro detekci jednotlivých jazyků je 15 sekund.
  • Posun detekce jazyka je v průměru 3 sekundy.
  • Očekává se, že řeč bude nepřetržitá. Časté alternace mezi jazyky můžou ovlivnit výkon modelu.
  • Řeč ne nativních mluvčích může ovlivnit výkon modelu (například když mluvčí používají svůj první jazyk a přepnou do jiného jazyka).
  • Model je navržený tak, aby rozpoznal spontánně konverzační řeč s rozumnou zvukovou akustikou (ne hlasovými příkazy, zpíváním atd.).
  • Vytváření a úpravy projektů nejsou k dispozici pro vícejazyčná videa.
  • Vlastní jazykové modely nejsou při použití detekce ve více jazycích dostupné.
  • Přidání klíčových slov se nepodporuje.
  • Označení jazyka není součástí exportovaného souboru skrytých titulků.
  • Přepis aktualizace v rozhraní API nepodporuje soubory s více jazyky.