Identificare in modo automatico la lingua parlata con il modello di identificazione della lingua
Importante
A causa dell'annuncio di ritiro Servizi multimediali di Azure, Azure AI Video Indexer annuncia le modifiche alle funzionalità di Azure AI Video Indexer. Vedere Modifiche correlate al ritiro di Servizi multimediali di Azure (AMS) per comprendere cosa significa per l'account Video Indexer di Azure per intelligenza artificiale. Vedere la guida alla preparazione per il ritiro di AMS: aggiornamento VI e migrazione.
Azure AI Video Indexer supporta l'identificazione automatica della lingua (LID), che è il processo di identificazione automatica della lingua parlata dal contenuto audio. Il file multimediale viene trascritto nella lingua identificata dominante.
Vedere l'elenco delle lingue supportate da Azure AI Video Indexer nelle lingue supportate.
Assicurarsi di esaminare la sezione Linee guida e limitazioni .
Scelta dell'identificazione automatica della lingua per l'indicizzazione
Quando si esegue l'indicizzazione o la reindicizzazione di un video usando l'API, scegliere l'opzione auto detect
nel sourceLanguage
parametro .
Quando si usa il portale, passare ai video dell'account nella home page di Azure AI Video Indexer e passare il puntatore del mouse sul nome del video che si vuole reindicizzare. Nell'angolo in basso a destra selezionare il pulsante Ri-indicizzazione . Nella finestra di dialogo Re-index video scegliere Rileva automaticamente dalla casella di riepilogo a discesa Lingua origine video.
Output del modello
Azure AI Video Indexer trascrive il video in base al linguaggio più probabile se l'attendibilità per tale linguaggio è > 0.6
. Se la lingua non può essere identificata con fiducia, presuppone che la lingua parlata sia l'inglese.
Il linguaggio dominante del modello è disponibile nel codice JSON delle informazioni dettagliate come sourceLanguage
attributo (in root/videos/insights). Un punteggio di attendibilità corrispondente è disponibile anche nell'attributo sourceLanguageConfidence
.
"insights": {
"version": "1.0.0.0",
"duration": "0:05:30.902",
"sourceLanguage": "fr-FR",
"language": "fr-FR",
"transcript": [...],
. . .
"sourceLanguageConfidence": 0.8563
}
Linee guida e limitazioni
L'identificazione automatica della lingua (LID) supporta le lingue seguenti:
Vedere l'elenco delle lingue supportate da Azure AI Video Indexer nelle lingue supportate.
- Se l'audio contiene lingue diverse dall'elenco supportato, il risultato è imprevisto.
- Se Video Indexer di Intelligenza artificiale di Azure non riesce a identificare la lingua con un livello di attendibilità sufficiente (maggiore di 0,6), la lingua di fallback è l'inglese.
- Attualmente, non è disponibile il supporto per i file con audio in linguaggio misto. Se l'audio contiene lingue miste, il risultato è imprevisto.
- L'audio di bassa qualità può influire sui risultati del modello.
- Il modello richiede almeno un minuto di riconoscimento vocale nell'audio.
- Il modello è progettato per riconoscere un parlato conversazionale spontaneo (non comandi vocali, canto e così via).
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per