A beszélt nyelv automatikus felismerése nyelvazonosítási modellel
Fontos
Az Azure Media Services kivonási bejelentése miatt az Azure AI Video Indexer bejelenti az Azure AI Video Indexer funkcióinak módosításait. Az Azure Media Service (AMS) kivonásával kapcsolatos változásokért tekintse meg az Azure AI Video Indexer-fiókjának jelentését. Tekintse meg az AMS-kivonás előkészítése: VI frissítési és migrálási útmutatót.
Az Azure AI Video Indexer támogatja az automatikus nyelvazonosítást (LID), amely a hangtartalmakból származó beszélt nyelv automatikus azonosításának folyamata. A médiafájl át van írva a domináns azonosított nyelven.
Tekintse meg az Azure AI Video Indexer által támogatott nyelvek listáját a támogatott nyelveken.
Ellenőrizze az Irányelvek és korlátozások szakaszt .
Automatikus nyelvazonosítás kiválasztása indexeléskor
Ha az API-val indexel vagy újraindexel egy videót, válassza ki a auto detect
paraméter beállítását sourceLanguage
.
A portál használatakor nyissa meg fiókvideóit az Azure AI Video Indexer kezdőlapján, és vigye az egérmutatót az újraindexelni kívánt videó nevére. A jobb alsó sarokban válassza az Újraindexelés gombot. A Videó újraindexelése párbeszédpanelen válassza az Automatikus észlelés lehetőséget a Video forrásnyelv legördülő listában.
Modell kimenete
Az Azure AI Video Indexer a legvalószínűbb nyelv szerint írja át a videót, ha az adott nyelv megbízhatósága .> 0.6
Ha a nyelv nem azonosítható magabiztosan, feltételezi, hogy a beszélt nyelv angol.
A modell domináns nyelve attribútumként sourceLanguage
az insights JSON-ban érhető el (a gyökér/videók/elemzések alatt). A megfelelő megbízhatósági pontszám az attribútum alatt sourceLanguageConfidence
is elérhető.
"insights": {
"version": "1.0.0.0",
"duration": "0:05:30.902",
"sourceLanguage": "fr-FR",
"language": "fr-FR",
"transcript": [...],
. . .
"sourceLanguageConfidence": 0.8563
}
Irányelvek és korlátozások
Az automatikus nyelvazonosítás (LID) a következő nyelveket támogatja:
Tekintse meg az Azure AI Video Indexer által támogatott nyelvek listáját a támogatott nyelveken.
- Ha a hang nem a támogatott listát tartalmazza, az eredmény váratlan.
- Ha az Azure AI Video Indexer nem tudja elég magabiztosan azonosítani a nyelvet (0,6-nál nagyobb), a tartalék nyelv az angol.
- A vegyes nyelvű hanggal rendelkező fájlok jelenleg nem támogatottak. Ha a hang vegyes nyelveket tartalmaz, az eredmény váratlan.
- A gyenge minőségű hang befolyásolhatja a modell eredményeit.
- A modellhez legalább egy perc beszéd szükséges a hangban.
- A modell úgy lett kialakítva, hogy felismerjen egy spontán társalgási beszédet (nem hangparancsokat, éneklést stb.).
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: