Personalizzare un modello di linguaggio con il sito Web di Azure Video Indexer
Azure Video Indexer consente di creare modelli linguistici personalizzati per personalizzare il riconoscimento vocale caricando testo di adattamento, ovvero testo dal dominio il cui vocabolario si vuole che il motore si adatti. Dopo avere eseguito il training del modello, le nuove parole presenti nel testo di adattamento verranno riconosciute.
Per una panoramica dettagliata e procedure consigliate per i modelli linguistici personalizzati, vedere Personalizzare un modello di linguaggio con Azure Video Indexer.
È possibile usare il sito Web di Azure Video Indexer per creare e modificare modelli linguistici personalizzati nell'account, come descritto in questo argomento. È anche possibile usare l'API, come descritto in Personalizzare il modello linguistico usando le API.
Creare un modello linguistico
Passare al sito Web di Azure Video Indexer e accedere.
Per personalizzare un modello nell'account, selezionare il pulsante Personalizzazione del modello di contenuto a sinistra della pagina.
Selezionare la scheda Lingua.
Verrà visualizzato un elenco di lingue supportate.
Nella lingua desiderata selezionare Aggiungi modello.
Digitare il nome per il modello linguistico e premere INVIO.
Questo passaggio crea il modello e consente di caricare file di testo nel modello.
Per aggiungere un file di testo, selezionare Aggiungi file. Verrà aperto Esplora file.
Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico.
È anche possibile aggiungere un file di testo selezionando il pulsante ... a destra del modello di lingua e selezionando Aggiungi file.
Dopo aver caricato i file di testo, selezionare l'opzione Train verde.
Il processo di training potrebbe richiedere alcuni minuti. Al termine del training, accanto al modello sarà visibile l'indicazione Con training. È possibile visualizzare in anteprima, scaricare ed eliminare il file dal modello.
Uso di un modello linguistico in un nuovo video
Per usare il modello linguistico in un nuovo video, eseguire una delle azioni seguenti:
Selezionare il pulsante Carica nella parte superiore della pagina.
Eliminare il file audio o video o cercare il file.
È possibile selezionare la lingua di origine video. Selezionare l'elenco a discesa e selezionare un modello di lingua creato dall'elenco. Dovrebbe essere indicati la lingua del modello linguistico e il nome assegnato tra parentesi. Ad esempio:
Selezionare l'opzione Carica nella parte inferiore della pagina e il nuovo video verrà indicizzato usando il modello di lingua.
Utilizzo di modello linguistico per reindicizzare
Per usare il modello linguistico per reinserire un video nella raccolta, seguire questa procedura:
- Accedere alla home page di Azure Video Indexer .
- Fare clic sul pulsante ... nel video e selezionare Ri-indice.
- Si ha la possibilità di selezionare la lingua di origine video per reinserire il video con. Selezionare l'elenco a discesa e selezionare un modello di lingua creato dall'elenco. Dovrebbe essere indicati la lingua del modello linguistico e il nome assegnato tra parentesi.
- Selezionare il pulsante Re-index e il video verrà reindexed usando il modello di lingua.
Modificare un modello linguistico
È possibile modificare un modello linguistico cambiando il nome, aggiungendovi file e cancellando file da esso.
Se si aggiungono o eliminano file dal modello di lingua, è necessario eseguire di nuovo il training del modello selezionando l'opzione Train verde.
Rinominare il modello linguistico
È possibile modificare il nome del modello di lingua selezionando il pulsante con i puntini di sospensione (...) sul lato destro del modello di lingua e selezionando Rinomina.
Digitare il nuovo nome e premere invio.
Aggiungere file
Per aggiungere un file di testo, selezionare Aggiungi file. Verrà aperto Esplora file.
Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico.
È anche possibile aggiungere un file di testo selezionando il pulsante con i puntini di sospensione (...) sul lato destro del modello di lingua e selezionando Aggiungi file.
Eliminare file
Per eliminare un file dal modello di lingua, selezionare il pulsante con i puntini di sospensione (...) sul lato destro del file di testo e selezionare Elimina. Viene visualizzata una nuova finestra che indica che l'eliminazione non può essere annullata. Selezionare l'opzione Elimina nella nuova finestra.
Questa azione rimuove completamente il file dal modello linguistico.
Eliminare un modello linguistico
Per eliminare un modello di lingua dall'account, selezionare il pulsante con i puntini di sospensione (...) sul lato destro del modello di lingua e selezionare Elimina.
Viene visualizzata una nuova finestra che indica che l'eliminazione non può essere annullata. Selezionare l'opzione Elimina nella nuova finestra.
Questa azione rimuove completamente il modello linguistico dall'account. Qualsiasi video che usava il modello linguistico eliminato manterrà lo stesso indice fino a quando non si reindicizzare il video. Se si reindexa il video, è possibile assegnare un nuovo modello linguistico al video. In caso contrario, Azure Video Indexer userà il modello predefinito per reindicizzare il video.
Personalizzare i modelli di linguaggio correggendo le trascrizioni
Azure Video Indexer supporta la personalizzazione automatica dei modelli linguistici in base alle correzioni effettive apportate agli utenti alle trascrizioni dei video.
Per apportare correzioni a una trascrizione, aprire il video che si vuole modificare dai video dell'account. Selezionare la scheda Sequenza temporale .
Selezionare l'icona a forma di matita per modificare la trascrizione della trascrizione.
Azure Video Indexer acquisisce tutte le righe corrette dall'utente nella trascrizione del video e le aggiunge automaticamente a un file di testo denominato "Dalle modifiche di trascrizione". Queste modifiche vengono usate per ripetere il training del modello linguistico specifico usato per indicizzare questo video.
Sono incluse anche le modifiche eseguite nella sequenza temporale del widget .
Se non è stato specificato un modello linguistico durante l'indicizzazione di questo video, tutte le modifiche per questo video verranno archiviate in un modello linguistico predefinito denominato "Adattamenti account" all'interno della lingua rilevata del video.
Nel caso in cui siano state apportate più modifiche alla stessa riga, verrà usata solo l'ultima versione della riga corretta per l'aggiornamento del modello di lingua.
Nota
Per la personalizzazione vengono usate solo le correzioni testuali. Le correzioni che non coinvolgono parole effettive (ad esempio, segni di punteggiatura o spazi) non sono incluse.
Verranno visualizzate le correzioni della trascrizione nella scheda Lingua della pagina personalizzazione del modello di contenuto.
Per esaminare il file "From transcript edits" per ognuno dei modelli linguistici, selezionarlo per aprirlo.