Personalizzare un modello linguistico con Video Indexer di Intelligenza artificiale di Azure

2025-05-30

Video Indexer di Azure per intelligenza artificiale supporta il riconoscimento vocale automatico tramite l'integrazione con il servizio Di riconoscimento vocale personalizzato Microsoft. È possibile personalizzare il modello linguistico caricando il testo di adattamento. Questo testo proviene dal dominio il cui vocabolario si desidera che il motore usi per adattarsi. Dopo aver eseguito il training del modello, le nuove parole visualizzate nel testo di adattamento vengono riconosciute, presupponendo la pronuncia predefinita e il modello linguistico apprende nuove sequenze probabili di parole. Consulta l'elenco delle lingue supportate da Azure AI Video Indexer in lingue supportate.

Ad esempio, Kubernetes (nel contesto del servizio Azure Kubernetes), è una parola altamente specifica. Poiché la parola è una novità di Azure AI Video Indexer, viene riconosciuta come community. Addestrare il modello per riconoscerlo come Kubernetes. In altri casi, le parole esistono, ma il modello linguistico non si aspetta che vengano visualizzate in un determinato contesto. Ad esempio, il servizio contenitore non è una sequenza di due parole che un modello linguistico non specifico riconosce come un set specifico di parole.

Esistono due modi per personalizzare un modello linguistico:

Opzione 1: Modificare la trascrizione generata dall'indicizzatore video di Intelligenza artificiale di Azure. Modificando e correggendo la trascrizione, si sta allenando un modello linguistico per fornire risultati migliori in futuro.
Opzione 2: Caricare file di testo per eseguire il training del modello linguistico. Il file può contenere un elenco di parole come si desidera che vengano visualizzate nella trascrizione di Video Indexer. Oppure può contenere le parole pertinenti incluse naturalmente in frasi e paragrafi. Man mano che si ottengono risultati migliori con quest'ultimo approccio, è consigliabile che il file di caricamento contenga frasi o paragrafi completi correlati al contenuto.

Importante

Non includere le parole o le frasi come attualmente trascritte in modo non corretto (ad esempio, community) nel file di caricamento, perché ciò nega l'impatto previsto. Includere solo le parole come desiderato, ad esempio Kubernetes.

Ottimizzare il modello linguistico personalizzato

Video Indexer di Azure per intelligenza artificiale apprende in base alle probabilità delle combinazioni di parole, per imparare meglio:

Indicare un numero sufficiente di esempi concreti di frasi come verrebbero pronunciate.
Inserire solo una frase per ogni riga, non un numero maggiore. In caso contrario, il sistema apprende le probabilità tra le frasi.
Va bene usare una sola parola come frase per dare più risalto a una parola rispetto ad altre, ma il sistema impara meglio dalle frasi complete.
Quando si introducono nuove parole oppure acronimi, è opportuno assegnare molti esempi di uso in una frase completa per dare il maggior contesto possibile al sistema.
Provare a inserire diverse opzioni di adattamento per scoprirne il funzionamento.
Evitare la ripetizione della stessa frase esatta più volte Potrebbe creare distorsioni rispetto al resto dell'input.
Evitare di includere simboli non comuni (~, # @ % &) perché vengono eliminati. Anche le frasi in cui vengono visualizzate vengono eliminate.
Evitare di inserire input troppo grandi, ad esempio centinaia di migliaia di frasi, perché in questo modo si diluisce l'effetto di potenziamento.

Prerequisiti

Un account Azure
Un account Video Indexer di Azure per intelligenza artificiale

Portale Web
api

Creare un modello linguistico

Passare al sito Web di Azure AI Video Indexer ed eseguire l'accesso.
Per personalizzare un modello nel tuo account, seleziona il pulsante personalizzazione del modello di contenuto a sinistra della pagina.
Selezionare la scheda Lingua . Viene visualizzato un elenco delle lingue supportate.
Nella lingua desiderata selezionare Aggiungi modello.
Digitare il nome del modello linguistico e premere INVIO. Questo passaggio crea il modello e offre la possibilità di caricare file di testo nel modello.
Per aggiungere un file di testo, selezionare Aggiungi file. Verrà aperto Esplora file.
Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico. È anche possibile aggiungere un file di testo selezionando il pulsante ... sul lato destro del modello linguistico e selezionando Aggiungi file.
Al termine del caricamento dei file di testo, selezionare l'opzione Train verde.

Il processo di training potrebbe richiedere alcuni minuti. Al termine del training, viene visualizzato Training accanto al modello. È possibile visualizzare in anteprima, scaricare ed eliminare il file dal modello.

Uso di un modello linguistico in un nuovo video

Per usare il modello linguistico in un nuovo video, eseguire una delle azioni seguenti:

Selezionare Carica nella parte superiore della pagina.
Trascina qui il tuo file audio o video o sfoglia per il tuo file.
Selezionare un modello linguistico creato dall'elenco Lingua di origine video .
Selezionare l'opzione Carica nella parte inferiore della pagina e il nuovo video viene indicizzato usando il modello linguistico.

Uso di un modello linguistico per reindicizzare

Accedere alla home page di Azure AI Video Indexer .
Selezionare i puntini di sospensione (...) nel video e quindi selezionare Ri-indicizzazione.
Selezionare l'elenco Lingua origine video e selezionare un modello linguistico creato dall'elenco.
Selezionare Ri-indicizzazione e il video viene reindicizzare usando il modello linguistico.

Modificare un modello linguistico

È possibile modificare un modello linguistico modificandone il nome, aggiungendone i file ed eliminandone i file. Se si aggiungono o si eliminano file dal modello linguistico, è necessario eseguire di nuovo il training del modello selezionando l'opzione Train verde.

Rinominare il modello linguistico

È possibile modificare il nome del modello linguistico selezionando i puntini di sospensione (...) sul lato destro del modello linguistico e selezionando Rinomina. Immettere il nuovo nome.

Aggiungi file

Selezionare Aggiungi file. Verrà aperto Esplora file.
Individuare e selezionare il file di testo. È possibile aggiungere più file di testo a un modello linguistico.

È anche possibile aggiungere un file di testo selezionando i puntini di sospensione (...) sul lato destro del modello linguistico e selezionando Aggiungi file.

Elimina file

Questa azione rimuove completamente il file dal modello linguistico.

Selezionare il pulsante dei puntini (...) situato sul lato destro del file di testo.
Selezionare Elimina. Viene visualizzata una nuova finestra per indicare che l'eliminazione non può essere annullata.
Selezionare l'opzione Elimina nella nuova finestra.

Eliminare un modello linguistico

Questa azione rimuove completamente il modello linguistico dall'account. Qualsiasi video che usa il modello linguistico eliminato mantiene lo stesso indice fino a quando non si reindicizzare il video. Se si reindicizzare il video, è possibile assegnare un nuovo modello linguistico al video. In caso contrario, Video Indexer di Azure per intelligenza artificiale usa il modello predefinito per reindicizzare il video.

Selezionare il pulsante con l'ellissi (...) sul lato destro del modello di lingua.
Selezionare Elimina. Viene visualizzata una nuova finestra per indicare che l'eliminazione non può essere annullata.
Selezionare l'opzione Elimina nella nuova finestra.

Personalizzare i modelli linguistici correggendo le trascrizioni

Video Indexer di Azure per intelligenza artificiale personalizza i modelli linguistici in base alle correzioni effettive apportate dagli utenti alle trascrizioni dei video. Acquisisce tutte le righe corrette nella trascrizione del video e le aggiunge a un file di testo denominato From transcript edits. Queste modifiche vengono usate per rieducare il modello linguistico che è stato usato per indicizzare il video.

Sono incluse anche le modifiche eseguite nella sequenza temporale del widget.

Se non è stato specificato un modello linguistico durante l'indicizzazione del video, tutte le modifiche per questo video vengono archiviate in un modello linguistico predefinito denominato Account adaptations all'interno della lingua rilevata del video.

Nel caso in cui siano state apportate più modifiche alla stessa riga, per aggiornare il modello linguistico viene usata solo l'ultima versione della riga corretta.

Nota

Per la personalizzazione vengono usate solo correzioni testuali. Le correzioni che non comportano parole effettive (ad esempio, segni di punteggiatura o spazi) non sono incluse.

Selezionare il video da modificare dalla raccolta.
Seleziona la scheda Sequenza temporale.
Seleziona l'icona a forma di matita per modificare la trascrizione.
Le correzioni delle trascrizioni vengono visualizzate nella scheda Lingua della pagina di personalizzazione del modello di contenuto. Per esaminare il file "From transcript edits" per ognuno dei modelli linguistici, selezionarlo per aprirlo.

Creare un modello linguistico

È possibile creare una richiesta api Create Language Model per creare un nuovo modello linguistico personalizzato per l'account specificato. È possibile caricare file per il modello linguistico usando questa richiesta. In alternativa, è possibile creare il modello linguistico qui e caricare i file per il modello in un secondo momento aggiornando il modello linguistico.

Oltre a fornire i valori per i parametri obbligatori, è necessario caricare i file nel corpo usando FormData. Esistono due modi per definire la coppia di chiavi per questa attività:

La chiave è il nome del file e il valore è il file txt.
La chiave è il nome del file e il valore è un URL per il file txt.

Nota

È comunque necessario eseguire il training del modello con i relativi file abilitati per fare in modo che il modello possa apprendere il contenuto dei file.

Esempio di risposta

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Addestrare un modello linguistico

La richiesta Train Language Model esegue il training di un modello linguistico personalizzato per l'account specificato con il contenuto dei file caricati e abilitati nel modello linguistico.

Nota

È prima necessario creare il modello linguistico e caricarne i file. È possibile caricare file durante la creazione del modello linguistico o aggiornando il modello linguistico.

Esempio di risposta

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

id è un ID univoco usato per distinguere i modelli linguistici. Tuttavia, languageModelId viene usato per caricare un video nell'indice e reindicizzare le richieste video . Sono noti anche come linguisticModelId nelle richieste di caricamento/reindicizzazione di Video Indexer per intelligenza artificiale di Azure.

Eliminare un modello linguistico

È possibile usare una richiesta dell'API Elimina modello linguistico per eliminare un modello linguistico personalizzato dall'account specificato. Qualsiasi video che usa il modello linguistico eliminato mantiene lo stesso indice fino a quando non si reindicizzare il video. Se si reindicizzare il video, è possibile assegnare un nuovo modello linguistico al video. In caso contrario, Video Indexer di Azure per intelligenza artificiale usa il modello predefinito per reindicizzare il video.

Esempio di risposta

Non viene restituito alcun contenuto quando il modello linguistico viene eliminato correttamente.

Aggiornare un modello linguistico

La richiesta Update Language Model aggiorna un modello linguistico personalizzato nell'account specificato.

Nota

Assicurarsi di aver creato il modello linguistico. È possibile usare la chiamata a: abilitare o disabilitare tutti i file nel modello, aggiornare il nome del modello linguistico e caricare i file da aggiungere al modello linguistico.

Per caricare i file da aggiungere al modello linguistico, è necessario caricare i file nel corpo usando FormData. È inoltre necessario specificare i valori per i parametri obbligatori indicati in precedenza. Per eseguire l'attività, esistono due modi:

La chiave è il nome del file e il valore è il file txt.
La chiave è il nome del file e il valore è un URL per il file txt.

Esempio di risposta

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Per scaricare il contenuto del file, usare l'oggetto id dei file restituiti nella risposta.

Aggiornare un file da un modello linguistico

La richiesta Update Language Model File consente di aggiornare il nome e enable lo stato di un file in un modello linguistico personalizzato nell'account specificato.

Esempio di risposta

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

Per scaricare il contenuto del file, usare l'oggetto id del file restituito nella risposta.

Ottenere un modello linguistico specifico

È possibile effettuare una richiesta api Get Language Model per restituire informazioni sul modello linguistico specificato nell'account specificato, ad esempio la lingua e i file presenti nel modello linguistico.

Esempio di risposta

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Per scaricare il contenuto del file, usare l'oggetto id del file restituito nella risposta.

Ottenere tutti i modelli linguistici

È possibile usare una richiesta api Get Language Models per restituire tutti i modelli linguistici personalizzati nell'account specificato in un elenco.

Esempio di risposta

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Eliminare un file da un modello linguistico

La richiesta Elimina il file del modello linguistico elimina il file specificato dal modello linguistico specificato nell'account specificato.

Esempio di risposta

Non viene restituito alcun contenuto quando il file viene eliminato correttamente dal modello linguistico.

Ottenere i metadati su un file da un modello linguistico

La richiesta Get Language Model File Data restituisce il contenuto di e i metadati nel file specificato dal modello linguistico scelto nell'account.

Esempio di risposta

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Nota

Il contenuto di questo file di esempio è costituito dalle parole "hello" e "world" in due righe separate.

Scaricare un file da un modello linguistico

La richiesta Download Language Model File Content scarica un file di testo contenente il contenuto del file specificato dal modello linguistico specificato nell'account specificato. Questo file di testo dovrebbe corrispondere al contenuto del file di testo caricato in origine.

Esempio di risposta

La risposta è il download di un file di testo con il contenuto del file nel formato JSON.

Condividi tramite

Personalizzare un modello linguistico con Video Indexer di Intelligenza artificiale di Azure

Ottimizzare il modello linguistico personalizzato

Prerequisiti

Creare un modello linguistico

Uso di un modello linguistico in un nuovo video

Uso di un modello linguistico per reindicizzare

Modificare un modello linguistico

Rinominare il modello linguistico

Aggiungi file

Elimina file

Eliminare un modello linguistico

Personalizzare i modelli linguistici correggendo le trascrizioni

Commenti e suggerimenti

Risorse aggiuntive