Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Video Indexer di Azure per intelligenza artificiale supporta il riconoscimento vocale automatico tramite l'integrazione con il servizio Di riconoscimento vocale personalizzato Microsoft. È possibile personalizzare il modello linguistico caricando il testo di adattamento. Questo testo proviene dal dominio il cui vocabolario si desidera che il motore usi per adattarsi. Dopo aver eseguito il training del modello, le nuove parole visualizzate nel testo di adattamento vengono riconosciute, presupponendo la pronuncia predefinita e il modello linguistico apprende nuove sequenze probabili di parole. Consulta l'elenco delle lingue supportate da Azure AI Video Indexer in lingue supportate.
Ad esempio, Kubernetes (nel contesto del servizio Azure Kubernetes), è una parola altamente specifica. Poiché la parola è una novità di Azure AI Video Indexer, viene riconosciuta come community. Addestrare il modello per riconoscerlo come Kubernetes. In altri casi, le parole esistono, ma il modello linguistico non si aspetta che vengano visualizzate in un determinato contesto. Ad esempio, il servizio contenitore non è una sequenza di due parole che un modello linguistico non specifico riconosce come un set specifico di parole.
Esistono due modi per personalizzare un modello linguistico:
- Opzione 1: Modificare la trascrizione generata dall'indicizzatore video di Intelligenza artificiale di Azure. Modificando e correggendo la trascrizione, si sta allenando un modello linguistico per fornire risultati migliori in futuro.
- Opzione 2: Caricare file di testo per eseguire il training del modello linguistico. Il file può contenere un elenco di parole come si desidera che vengano visualizzate nella trascrizione di Video Indexer. Oppure può contenere le parole pertinenti incluse naturalmente in frasi e paragrafi. Man mano che si ottengono risultati migliori con quest'ultimo approccio, è consigliabile che il file di caricamento contenga frasi o paragrafi completi correlati al contenuto.
Importante
Non includere le parole o le frasi come attualmente trascritte in modo non corretto (ad esempio, community) nel file di caricamento, perché ciò nega l'impatto previsto. Includere solo le parole come desiderato, ad esempio Kubernetes.
Ottimizzare il modello linguistico personalizzato
Video Indexer di Azure per intelligenza artificiale apprende in base alle probabilità delle combinazioni di parole, per imparare meglio:
- Indicare un numero sufficiente di esempi concreti di frasi come verrebbero pronunciate.
- Inserire solo una frase per ogni riga, non un numero maggiore. In caso contrario, il sistema apprende le probabilità tra le frasi.
- Va bene usare una sola parola come frase per dare più risalto a una parola rispetto ad altre, ma il sistema impara meglio dalle frasi complete.
- Quando si introducono nuove parole oppure acronimi, è opportuno assegnare molti esempi di uso in una frase completa per dare il maggior contesto possibile al sistema.
- Provare a inserire diverse opzioni di adattamento per scoprirne il funzionamento.
- Evitare la ripetizione della stessa frase esatta più volte Potrebbe creare distorsioni rispetto al resto dell'input.
- Evitare di includere simboli non comuni (~, # @ % &) perché vengono eliminati. Anche le frasi in cui vengono visualizzate vengono eliminate.
- Evitare di inserire input troppo grandi, ad esempio centinaia di migliaia di frasi, perché in questo modo si diluisce l'effetto di potenziamento.
Prerequisiti
- Un account Azure
- Un account Video Indexer di Azure per intelligenza artificiale
Creare un modello linguistico
- Passare al sito Web di Azure AI Video Indexer ed eseguire l'accesso.
- Per personalizzare un modello nel tuo account, seleziona il pulsante personalizzazione del modello di contenuto a sinistra della pagina.
- Selezionare la scheda Lingua . Viene visualizzato un elenco delle lingue supportate.
- Nella lingua desiderata selezionare Aggiungi modello.
- Digitare il nome del modello linguistico e premere INVIO. Questo passaggio crea il modello e offre la possibilità di caricare file di testo nel modello.
- Per aggiungere un file di testo, selezionare Aggiungi file. Verrà aperto Esplora file.
- Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico. È anche possibile aggiungere un file di testo selezionando il pulsante ... sul lato destro del modello linguistico e selezionando Aggiungi file.
- Al termine del caricamento dei file di testo, selezionare l'opzione Train verde.
Il processo di training potrebbe richiedere alcuni minuti. Al termine del training, viene visualizzato Training accanto al modello. È possibile visualizzare in anteprima, scaricare ed eliminare il file dal modello.
Uso di un modello linguistico in un nuovo video
Per usare il modello linguistico in un nuovo video, eseguire una delle azioni seguenti:
- Selezionare Carica nella parte superiore della pagina.
- Trascina qui il tuo file audio o video o sfoglia per il tuo file.
- Selezionare un modello linguistico creato dall'elenco Lingua di origine video .
- Selezionare l'opzione Carica nella parte inferiore della pagina e il nuovo video viene indicizzato usando il modello linguistico.
Uso di un modello linguistico per reindicizzare
- Accedere alla home page di Azure AI Video Indexer .
- Selezionare i puntini di sospensione (...) nel video e quindi selezionare Ri-indicizzazione.
- Selezionare l'elenco Lingua origine video e selezionare un modello linguistico creato dall'elenco.
- Selezionare Ri-indicizzazione e il video viene reindicizzare usando il modello linguistico.
Modificare un modello linguistico
È possibile modificare un modello linguistico modificandone il nome, aggiungendone i file ed eliminandone i file. Se si aggiungono o si eliminano file dal modello linguistico, è necessario eseguire di nuovo il training del modello selezionando l'opzione Train verde.
Rinominare il modello linguistico
È possibile modificare il nome del modello linguistico selezionando i puntini di sospensione (...) sul lato destro del modello linguistico e selezionando Rinomina. Immettere il nuovo nome.
Aggiungi file
- Selezionare Aggiungi file. Verrà aperto Esplora file.
- Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico.
È anche possibile aggiungere un file di testo selezionando i puntini di sospensione (...) sul lato destro del modello linguistico e selezionando Aggiungi file.
Elimina file
Questa azione rimuove completamente il file dal modello linguistico.
- Selezionare il pulsante dei puntini (...) situato sul lato destro del file di testo.
- Selezionare Elimina. Viene visualizzata una nuova finestra per indicare che l'eliminazione non può essere annullata.
- Selezionare l'opzione Elimina nella nuova finestra.
Eliminare un modello linguistico
Questa azione rimuove completamente il modello linguistico dall'account. Qualsiasi video che usa il modello linguistico eliminato mantiene lo stesso indice fino a quando non si reindicizzare il video. Se si reindicizzare il video, è possibile assegnare un nuovo modello linguistico al video. In caso contrario, Video Indexer di Azure per intelligenza artificiale usa il modello predefinito per reindicizzare il video.
- Selezionare il pulsante con l'ellissi (...) sul lato destro del modello di lingua.
- Selezionare Elimina. Viene visualizzata una nuova finestra per indicare che l'eliminazione non può essere annullata.
- Selezionare l'opzione Elimina nella nuova finestra.
Personalizzare i modelli linguistici correggendo le trascrizioni
Video Indexer di Azure per intelligenza artificiale personalizza i modelli linguistici in base alle correzioni effettive apportate dagli utenti alle trascrizioni dei video. Acquisisce tutte le righe corrette nella trascrizione del video e le aggiunge a un file di testo denominato From transcript edits
. Queste modifiche vengono usate per rieducare il modello linguistico che è stato usato per indicizzare il video.
Sono incluse anche le modifiche eseguite nella sequenza temporale del widget.
Se non è stato specificato un modello linguistico durante l'indicizzazione del video, tutte le modifiche per questo video vengono archiviate in un modello linguistico predefinito denominato Account adaptations
all'interno della lingua rilevata del video.
Nel caso in cui siano state apportate più modifiche alla stessa riga, per aggiornare il modello linguistico viene usata solo l'ultima versione della riga corretta.
Nota
Per la personalizzazione vengono usate solo correzioni testuali. Le correzioni che non comportano parole effettive (ad esempio, segni di punteggiatura o spazi) non sono incluse.
- Selezionare il video da modificare dalla raccolta.
- Seleziona la scheda Sequenza temporale.
- Seleziona l'icona a forma di matita per modificare la trascrizione.
- Le correzioni delle trascrizioni vengono visualizzate nella scheda Lingua della pagina di personalizzazione del modello di contenuto. Per esaminare il file "From transcript edits" per ognuno dei modelli linguistici, selezionarlo per aprirlo.