Personalizzare un modello linguistico con Video Indexer di Intelligenza artificiale di Azure
Video Indexer di Azure per intelligenza artificiale supporta il riconoscimento vocale automatico tramite l'integrazione con il servizio Di riconoscimento vocale personalizzato Microsoft. È possibile personalizzare il modello linguistico caricando il testo di adattamento. Questo testo proviene dal dominio il cui vocabolario si desidera che il motore usi per adattarsi. Dopo aver eseguito il training del modello, le nuove parole visualizzate nel testo di adattamento vengono riconosciute, presupponendo la pronuncia predefinita e il modello linguistico apprende nuove sequenze probabili di parole. Vedere l'elenco dei linguaggi supportati da Azure AI Video Indexer in langues supportati.
Ad esempio, "Kubernetes" (nel contesto del servizio Azure Kubernetes), è una parola altamente specifica. Poiché la parola è una novità di Azure AI Video Indexer, viene riconosciuta come "community". Eseguire il training del modello per riconoscerlo come "Kubernetes". In altri casi, le parole esistono, ma il modello linguistico non si aspetta che vengano visualizzate in un determinato contesto. Ad esempio, "servizio contenitore" non è una sequenza di 2 parole che un modello linguistico non specifico riconosce come un set specifico di parole.
Esistono due modi per personalizzare un modello linguistico:
- Opzione 1: Modificare la trascrizione generata da Azure AI Video Indexer. Modificando e correggendo la trascrizione, si sta eseguendo il training di un modello linguistico per offrire risultati migliorati in futuro.
- Opzione 2: Caricare file di testo per eseguire il training del modello linguistico. Il file può contenere un elenco di parole come si desidera che vengano visualizzate nella trascrizione di Video Indexer o le parole pertinenti incluse naturalmente in frasi e paragrafi. Poiché si ottengono risultati migliori con quest'ultimo approccio, è consigliabile che il file di caricamento contenga frasi o paragrafi completi correlati al contenuto.
Importante
Non includere le parole o le frasi come attualmente trascritto in modo non corretto (ad esempio, "community" nel file di caricamento, perché ciò nega l'impatto previsto. Includere solo le parole desiderate per visualizzarle, ad esempio "Kubernetes".
Ottimizzare il modello linguistico personalizzato
Video Indexer di Azure per intelligenza artificiale apprende in base alle probabilità delle combinazioni di parole, per imparare meglio:
- Indicare un numero sufficiente di esempi concreti di frasi come verrebbero pronunciate.
- Inserire solo una frase per ogni riga, non un numero maggiore. In caso contrario, il sistema apprenderà in base alle probabilità tra le frasi.
- Va bene mettere una parola come frase per aumentare la parola contro gli altri, ma il sistema impara meglio dalle frasi complete.
- Quando si introducono nuove parole oppure acronimi, è opportuno assegnare molti esempi di uso in una frase completa per dare il maggior contesto possibile al sistema.
- Provare a inserire diverse opzioni di adattamento per scoprirne il funzionamento.
- Evitare la ripetizione della stessa frase esatta più volte perché potrebbe causare distorsione rispetto al resto dell'input.
- Evitare di includere simboli non comuni (~, # @ % &) man mano che verranno eliminati. come le frasi in cui sono presenti.
- Evitare di inserire input di dimensioni eccessive, ad esempio centinaia di migliaia di frasi, perché verrebbe ridotto l'effetto dell'aumento.
Prerequisiti
- Un account Azure
- Un account Video Indexer di Azure per intelligenza artificiale
Creare un modello linguistico
- Passare al sito Web di Azure AI Video Indexer ed eseguire l'accesso.
- Per personalizzare un modello nell'account, selezionare il pulsante di personalizzazione Con modalità tenda l a sinistra della pagina.
- Selezionare la scheda Lingua . Viene visualizzato un elenco delle lingue supportate.
- Nella lingua desiderata selezionare Aggiungi modello.
- Digitare il nome del modello linguistico e premere INVIO. Questo passaggio crea il modello e offre la possibilità di caricare file di testo nel modello.
- Per aggiungere un file di testo, selezionare Aggiungi file. Verrà aperto Esplora file.
- Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico. È anche possibile aggiungere un file di testo selezionando il pulsante ... sul lato destro del modello linguistico e selezionando Aggiungi file.
- Al termine del caricamento dei file di testo, selezionare l'opzione Green Train (Training verde).
Il processo di training potrebbe richiedere alcuni minuti. Al termine del training, viene visualizzato Training accanto al modello. È possibile visualizzare in anteprima, scaricare ed eliminare il file dal modello.
Uso di un modello linguistico in un nuovo video
Per usare il modello linguistico in un nuovo video, eseguire una delle azioni seguenti:
- Selezionare il pulsante Carica nella parte superiore della pagina.
- Eliminare il file audio o video o cercare il file.
- Selezionare un modello linguistico creato dall'elenco a discesa Lingua origine video.
- Selezionare l'opzione Carica nella parte inferiore della pagina e il nuovo video verrà indicizzato usando il modello linguistico.
Uso di un modello linguistico per reindicizzare
- Accedere alla home page di Azure AI Video Indexer .
- Fare clic sul pulsante ... nel video e selezionare Ri-indicizzazione.
- Selezionare l'elenco a discesa Lingua origine video e selezionare un modello linguistico creato dall'elenco.
- Selezionare il pulsante Ri-indicizzazione e il video verrà reindicizzare usando il modello linguistico.
Modificare un modello linguistico
È possibile modificare un modello linguistico modificandone il nome, aggiungendone i file ed eliminandone i file. Se si aggiungono o si eliminano file dal modello linguistico, sarà necessario eseguire di nuovo il training del modello selezionando l'opzione Training verde.
Rinominare il modello linguistico
È possibile modificare il nome del modello linguistico selezionando i puntini di sospensione (...) sul lato destro del modello linguistico e selezionando Rinomina. Immettere il nuovo nome.
Aggiunta di file
- Selezionare Aggiungi file. Verrà aperto Esplora file.
- Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico.
È anche possibile aggiungere un file di testo selezionando i puntini di sospensione (...) sul lato destro del modello linguistico e selezionando Aggiungi file.
Elimina file
Questa azione rimuove completamente il file dal modello linguistico.
- Selezionare il pulsante con i puntini di sospensione (...) sul lato destro del file di testo.
- Selezionare Elimina. Viene visualizzata una nuova finestra per indicare che l'eliminazione non può essere annullata.
- Selezionare l'opzione Elimina nella nuova finestra.
Eliminare un modello linguistico
Questa azione rimuove completamente il modello linguistico dall'account. Qualsiasi video che usa il modello deletedlLanguage manterrà lo stesso indice fino a quando non si reindicizzare il video. Se si reindicizzare il video, è possibile assegnare un nuovo modello linguistico al video. In caso contrario, Video Indexer di Azure per intelligenza artificiale userà il modello predefinito per reindicizzare il video.
- Selezionare il pulsante con i puntini di sospensione (...) sul lato destro del modello linguistico.
- Selezionare Elimina. Viene visualizzata una nuova finestra per indicare che l'eliminazione non può essere annullata.
- Selezionare l'opzione Elimina nella nuova finestra.
Personalizzare i modelli linguistici correggendo le trascrizioni
Video Indexer di Azure per intelligenza artificiale personalizza i modelli linguistici in base alle correzioni effettive apportate dagli utenti alle trascrizioni dei video. Acquisisce tutte le righe corrette nella trascrizione del video e le aggiunge a un file di testo denominato From transcript edits
. Queste modifiche vengono usate per ripetere il training del modello linguistico usato per indicizzare il video.
Sono incluse anche le modifiche eseguite nella sequenza temporale del widget.
Se non è stato specificato un modello linguistico durante l'indicizzazione del video, tutte le modifiche per questo video vengono archiviate in un modello linguistico predefinito denominato Account adaptations
all'interno della lingua rilevata del video.
Nel caso in cui siano state apportate più modifiche alla stessa riga, per aggiornare il modello linguistico viene usata solo l'ultima versione della riga corretta.
Nota
Per la personalizzazione vengono usate solo correzioni testuali. Le correzioni che non comportano parole effettive (ad esempio, segni di punteggiatura o spazi) non sono incluse.
- Selezionare il video da modificare dalla raccolta.
- Selezionare la scheda Sequenza temporale .
- Selezionare l'icona a forma di matita per modificare la trascrizione della trascrizione.
- Le correzioni delle trascrizioni verranno visualizzate nella scheda Lingua della pagina di personalizzazione Con modalità tenda l. Per esaminare il file "From transcript edits" per ognuno dei modelli linguistici, selezionarlo per aprirlo.