Share via


Identificare in modo automatico la lingua parlata con il modello di identificazione della lingua

Importante

A causa dell'annuncio di ritiro Servizi multimediali di Azure, Azure AI Video Indexer annuncia le modifiche alle funzionalità di Azure AI Video Indexer. Vedere Modifiche correlate al ritiro di Servizi multimediali di Azure (AMS) per comprendere cosa significa per l'account Video Indexer di Azure per intelligenza artificiale. Vedere la guida alla preparazione per il ritiro di AMS: aggiornamento VI e migrazione.

Azure AI Video Indexer supporta l'identificazione automatica della lingua (LID), che è il processo di identificazione automatica della lingua parlata dal contenuto audio. Il file multimediale viene trascritto nella lingua identificata dominante.

Vedere l'elenco delle lingue supportate da Azure AI Video Indexer nelle lingue supportate.

Assicurarsi di esaminare la sezione Linee guida e limitazioni .

Scelta dell'identificazione automatica della lingua per l'indicizzazione

Quando si esegue l'indicizzazione o la reindicizzazione di un video usando l'API, scegliere l'opzione auto detect nel sourceLanguage parametro .

Quando si usa il portale, passare ai video dell'account nella home page di Azure AI Video Indexer e passare il puntatore del mouse sul nome del video che si vuole reindicizzare. Nell'angolo in basso a destra selezionare il pulsante Ri-indicizzazione . Nella finestra di dialogo Re-index video scegliere Rileva automaticamente dalla casella di riepilogo a discesa Lingua origine video.

Screenshot che mostra dove selezionare il rilevamento automatico.

Output del modello

Azure AI Video Indexer trascrive il video in base al linguaggio più probabile se l'attendibilità per tale linguaggio è > 0.6. Se la lingua non può essere identificata con fiducia, presuppone che la lingua parlata sia l'inglese.

Il linguaggio dominante del modello è disponibile nel codice JSON delle informazioni dettagliate come sourceLanguage attributo (in root/videos/insights). Un punteggio di attendibilità corrispondente è disponibile anche nell'attributo sourceLanguageConfidence .

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Linee guida e limitazioni

L'identificazione automatica della lingua (LID) supporta le lingue seguenti:

Vedere l'elenco delle lingue supportate da Azure AI Video Indexer nelle lingue supportate.

  • Se l'audio contiene lingue diverse dall'elenco supportato, il risultato è imprevisto.
  • Se Video Indexer di Intelligenza artificiale di Azure non riesce a identificare la lingua con un livello di attendibilità sufficiente (maggiore di 0,6), la lingua di fallback è l'inglese.
  • Attualmente, non è disponibile il supporto per i file con audio in linguaggio misto. Se l'audio contiene lingue miste, il risultato è imprevisto.
  • L'audio di bassa qualità può influire sui risultati del modello.
  • Il modello richiede almeno un minuto di riconoscimento vocale nell'audio.
  • Il modello è progettato per riconoscere un parlato conversazionale spontaneo (non comandi vocali, canto e così via).