Share via


A beszélt nyelv automatikus felismerése nyelvazonosítási modellel

Fontos

Az Azure Media Services kivonási bejelentése miatt az Azure AI Video Indexer bejelenti az Azure AI Video Indexer funkcióinak módosításait. Az Azure Media Service (AMS) kivonásával kapcsolatos változásokért tekintse meg az Azure AI Video Indexer-fiókjának jelentését. Tekintse meg az AMS-kivonás előkészítése: VI frissítési és migrálási útmutatót.

Az Azure AI Video Indexer támogatja az automatikus nyelvazonosítást (LID), amely a hangtartalmakból származó beszélt nyelv automatikus azonosításának folyamata. A médiafájl át van írva a domináns azonosított nyelven.

Tekintse meg az Azure AI Video Indexer által támogatott nyelvek listáját a támogatott nyelveken.

Ellenőrizze az Irányelvek és korlátozások szakaszt .

Automatikus nyelvazonosítás kiválasztása indexeléskor

Ha az API-val indexel vagy újraindexel egy videót, válassza ki a auto detect paraméter beállítását sourceLanguage .

A portál használatakor nyissa meg fiókvideóit az Azure AI Video Indexer kezdőlapján, és vigye az egérmutatót az újraindexelni kívánt videó nevére. A jobb alsó sarokban válassza az Újraindexelés gombot. A Videó újraindexelése párbeszédpanelen válassza az Automatikus észlelés lehetőséget a Video forrásnyelv legördülő listában.

Képernyőkép az automatikus észlelés helyének kiválasztásáról.

Modell kimenete

Az Azure AI Video Indexer a legvalószínűbb nyelv szerint írja át a videót, ha az adott nyelv megbízhatósága .> 0.6 Ha a nyelv nem azonosítható magabiztosan, feltételezi, hogy a beszélt nyelv angol.

A modell domináns nyelve attribútumként sourceLanguage az insights JSON-ban érhető el (a gyökér/videók/elemzések alatt). A megfelelő megbízhatósági pontszám az attribútum alatt sourceLanguageConfidence is elérhető.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Irányelvek és korlátozások

Az automatikus nyelvazonosítás (LID) a következő nyelveket támogatja:

Tekintse meg az Azure AI Video Indexer által támogatott nyelvek listáját a támogatott nyelveken.

  • Ha a hang nem a támogatott listát tartalmazza, az eredmény váratlan.
  • Ha az Azure AI Video Indexer nem tudja elég magabiztosan azonosítani a nyelvet (0,6-nál nagyobb), a tartalék nyelv az angol.
  • A vegyes nyelvű hanggal rendelkező fájlok jelenleg nem támogatottak. Ha a hang vegyes nyelveket tartalmaz, az eredmény váratlan.
  • A gyenge minőségű hang befolyásolhatja a modell eredményeit.
  • A modellhez legalább egy perc beszéd szükséges a hangban.
  • A modell úgy lett kialakítva, hogy felismerjen egy spontán társalgási beszédet (nem hangparancsokat, éneklést stb.).