Anpassa en språkmodell med Azure AI Video Indexer

Artikel
10/09/2024

Azure AI Video Indexer stöder automatisk taligenkänning genom integrering med Microsoft Custom Speech Service. Du kan anpassa språkmodellen genom att ladda upp anpassningstext. Den här texten kommer från domänen vars vokabulär du vill att motorn ska använda för att anpassa. När du har tränat din modell känns nya ord som visas i anpassningstexten igen, förutsatt standarduttal, och språkmodellen lär sig nya troliga ordsekvenser. Se listan över språk som stöds av Azure AI Video Indexer i langues som stöds.

Till exempel är "Kubernetes" (i kontexten för Azure Kubernetes-tjänsten) ett ord som är mycket specifikt. Eftersom ordet är nytt för Azure AI Video Indexer känns det igen som "communities". Träna modellen att känna igen den som "Kubernetes". I andra fall finns orden, men språkmodellen förväntar sig inte att de ska visas i en viss kontext. Till exempel är "containertjänst" inte en 2-ords sekvens som en icke-specialiserad språkmodell skulle känna igen som en specifik uppsättning ord.

Det finns två sätt att anpassa en språkmodell:

Alternativ 1: Redigera avskriften som genererades av Azure AI Video Indexer. Genom att redigera och korrigera avskriften tränar du en språkmodell för att ge bättre resultat i framtiden.
Alternativ 2: Ladda upp textfiler för att träna språkmodellen. Filen kan antingen innehålla en lista med ord som du vill att de ska visas i Video Indexer-avskriften eller relevanta ord som ingår naturligt i meningar och stycken. När bättre resultat uppnås med den senare metoden rekommenderar vi att uppladdningsfilen innehåller fullständiga meningar eller stycken som är relaterade till ditt innehåll.

Viktigt!

Inkludera inte orden eller meningarna som för närvarande felaktigt transkriberade (till exempel "communities") i uppladdningsfilen eftersom detta kommer att negera den avsedda effekten. Inkludera bara orden som du vill att de ska visas (till exempel "Kubernetes").

Optimera din anpassade språkmodell

Azure AI Video Indexer lär sig baserat på sannolikheter för ordkombinationer, så att du lär dig bäst:

Ge tillräckligt med verkliga exempel på meningar som de skulle talas.
Lägg bara en mening per rad, inte mer. Annars lär sig systemet sannolikheter mellan meningar.
Det är okej att sätta ett ord som en mening för att öka ordet mot andra, men systemet lär sig bäst av fullständiga meningar.
När du introducerar nya ord eller förkortningar, om möjligt, ge så många exempel på användning i en fullständig mening för att ge så mycket kontext som möjligt till systemet.
Försök att lägga till flera anpassningsalternativ och se hur de fungerar för dig.
Undvik upprepning av exakt samma mening flera gånger. Det kan skapa bias mot resten av indata.
Undvik att inkludera ovanliga symboler (~, # @ % &) när de tas bort. De meningar som de visas i ignoreras också.
Undvik att lägga för stora indata, till exempel hundratusentals meningar, eftersom detta kommer att späda ut effekten av att öka.

Förutsättningar

Ett Azure-konto
Ett Azure AI Video Indexer-konto

Webbportal
API

Skapa en språkmodell

Gå till webbplatsen för Azure AI Video Indexer och logga in.
Om du vill anpassa en modell i ditt konto väljer du knappen Con režim šatora l customization till vänster på sidan.
Välj fliken Språk . Du ser en lista över språk som stöds.
Under det språk som du vill använda väljer du Lägg till modell.
Skriv in namnet på språkmodellen och tryck på Retur. Det här steget skapar modellen och ger möjlighet att ladda upp textfiler till modellen.
Om du vill lägga till en textfil väljer du Lägg till fil. Utforskaren öppnas.
Navigera till och välj textfilen. Du kan lägga till flera textfiler i en språkmodell. Du kan också lägga till en textfil genom att välja knappen ... till höger i språkmodellen och välja Lägg till fil.
När du är klar med att ladda upp textfilerna väljer du det gröna alternativet Träna .

Träningsprocessen kan ta några minuter. När träningen är klar visas Tränad bredvid modellen. Du kan förhandsgranska, ladda ned och ta bort filen från modellen.

Använda en språkmodell i en ny video

Om du vill använda din språkmodell i en ny video gör du något av följande:

Välj knappen Ladda upp överst på sidan.
Släpp ljud- eller videofilen eller bläddra efter filen.
Välj en språkmodell som du skapade i listrutan Video source language (Video source language ).
Välj alternativet Ladda upp längst ned på sidan så indexeras den nya videon med hjälp av språkmodellen.

Använda en språkmodell för att indexera om

Logga in på startsidan för Azure AI Video Indexer .
Klicka på ... i videon och välj Indexering igen.
Välj listrutan Video source language (Video source language) och välj en språkmodell som du skapade i listan.
Välj knappen Indexera om så indexeras videon om med hjälp av språkmodellen.

Redigera en språkmodell

Du kan redigera en språkmodell genom att ändra dess namn, lägga till filer i den och ta bort filer från den. Om du lägger till eller tar bort filer från språkmodellen måste du träna modellen igen genom att välja det gröna alternativet Träna .

Byt namn på språkmodellen

Du kan ändra namnet på språkmodellen genom att välja ellipsknappen (...) till höger i språkmodellen och välja Byt namn. Ange det nya namnet.

Lägg till filer

Välj Lägg till fil. Utforskaren öppnas.
Navigera till och välj textfilen. Du kan lägga till flera textfiler i en språkmodell.

Du kan också lägga till en textfil genom att välja ellipsknappen (...) till höger i språkmodellen och välja Lägg till fil.

Ta bort filer

Den här åtgärden tar bort filen helt från språkmodellen.

Välj ellipsknappen (...) till höger i textfilen.
Välj Ta bort. Ett nytt fönster visas som anger att borttagningen inte kan ångras.
Välj alternativet Ta bort i det nya fönstret.

Ta bort en språkmodell

Den här åtgärden tar bort språkmodellen helt från ditt konto. Alla videor som använder deletedlLanguage-modellen behåller samma index tills du indexerar om videon. Om du indexerar om videon kan du tilldela videon en ny språkmodell. Annars använder Azure AI Video Indexer sin standardmodell för att indexera om videon.

Välj ellipsknappen (...) till höger i språkmodellen.
Välj Ta bort. Ett nytt fönster visas som anger att borttagningen inte kan ångras.
Välj alternativet Ta bort i det nya fönstret.

Anpassa språkmodeller genom att korrigera avskrifter

Azure AI Video Indexer anpassar språkmodeller baserat på de faktiska korrigeringar som användarna gör i transkriptionerna av sina videor. Den samlar in alla rader som du korrigerade i transkriptionen av videon och lägger till dem i en textfil med namnet From transcript edits. Dessa redigeringar används för att träna om språkmodellen som användes för att indexera videon.

Redigeringar som gjordes i widgetens tidslinje ingår också.

Om du inte angav någon språkmodell när du indexerade videon lagras alla redigeringar för videon i en standardspråkmodell som anropas Account adaptations inom det identifierade språket i videon.

Om flera ändringar har gjorts på samma rad används endast den senaste versionen av den korrigerade raden för att uppdatera språkmodellen.

Kommentar

Endast textkorrigeringar används för anpassningen. Korrigeringar som inte omfattar faktiska ord (till exempel skiljetecken eller blanksteg) ingår inte.

Välj den video som du vill redigera från biblioteket.
Välj fliken Tidslinje .
Välj pennikonen för att redigera transkriptionen av transkriptionen.
Avskriftskorrigeringar visas på fliken Språk på sidan Anpassning av con režim šatora l. Om du vill titta på filen "Från transkriptionsredigeringar" för var och en av dina språkmodeller väljer du den för att öppna den.

Skapa en språkmodell

Begäran Skapa språkmodell skapar en ny anpassad språkmodell för det angivna kontot. Du kan ladda upp filer för språkmodellen med hjälp av den här begäran. Du kan också skapa språkmodellen här och ladda upp filer för modellen senare genom att uppdatera språkmodellen.

Du måste ladda upp filer i brödtexten med Hjälp av FormData förutom att ange värden för de obligatoriska parametrarna. Det finns två sätt att definiera nyckelparet för den här uppgiften:

Nyckeln är filnamnet och värdet är txt-filen.
Nyckeln är filnamnet och värdet är en URL till txt-fil.

Kommentar

Du måste fortfarande träna modellen med dess aktiverade filer för modellen för att lära dig innehållet i dess filer.

Exempelsvar

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Träna en språkmodell

Begäran om träningsspråkmodell tränar en anpassad språkmodell för det angivna kontot med innehållet i de uppladdade och aktiverade filerna i språkmodellen.

Kommentar

Du måste först skapa språkmodellen och ladda upp dess filer. Du kan ladda upp filer när du skapar språkmodellen eller genom att uppdatera språkmodellen.

Exempelsvar

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

id är ett unikt ID som används för att skilja mellan språkmodeller, medan languageModelId används både för att ladda upp en video för att indexera om och indexera om en videobegäran (kallas linguisticModelId även för uppladdning/omindexering av Azure AI Video Indexer-begäranden).

Ta bort en språkmodell

Begäran Ta bort språkmodell tar bort en anpassad språkmodell från det angivna kontot. Alla videor som använde den borttagna språkmodellen behåller samma index tills du indexerar om videon. Om du indexerar om videon kan du tilldela videon en ny språkmodell. Annars använder Azure AI Video Indexer sin standardmodell för att indexera om videon.

Exempelsvar

Det finns inget returnerat innehåll när språkmodellen har tagits bort.

Uppdatera en språkmodell

Begäran om uppdateringsspråkmodell uppdaterar en anpassad personmodell för språk i det angivna kontot.

Kommentar

Du måste redan ha skapat språkmodellen. Du kan använda det här anropet för att aktivera eller inaktivera alla filer under modellen, uppdatera namnet på språkmodellen och ladda upp filer som ska läggas till i språkmodellen.

Om du vill ladda upp filer som ska läggas till i språkmodellen måste du ladda upp filer i brödtexten med hjälp av FormData utöver att ange värden för de obligatoriska parametrarna ovan. Det finns två sätt att utföra den här uppgiften:

Nyckeln är filnamnet och värdet är txt-filen.
Nyckeln är filnamnet och värdet är en URL till txt-fil.

Exempelsvar

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Använd filerna id som returneras i svaret för att ladda ned innehållet i filen.

Uppdatera en fil från en språkmodell

Med begäran om uppdateringsspråkmodellfil kan du uppdatera namnet och enable tillståndet för en fil i en anpassad språkmodell i det angivna kontot.

Exempelsvar

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

Använd filen id som returneras i svaret för att ladda ned innehållet i filen.

Hämta en specifik språkmodell

Begäran Hämta språkmodell returnerar information om den angivna språkmodellen i det angivna kontot, till exempel språk och filer som finns i språkmodellen.

Exempelsvar

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Använd filen id som returneras i svaret för att ladda ned innehållet i filen.

Hämta alla språkmodeller

Begäran Hämta språkmodeller returnerar alla anpassade språkmodeller i det angivna kontot i en lista.

Exempelsvar

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Ta bort en fil från en språkmodell

Begäran Ta bort språkmodellfil tar bort den angivna filen från den angivna språkmodellen i det angivna kontot.

Exempelsvar

Det finns inget returnerat innehåll när filen tas bort från språkmodellen.

Hämta metadata för en fil från en språkmodell

Begäran hämta språkmodellfildata returnerar innehållet i och metadata för den angivna filen från den valda språkmodellen i ditt konto.

Exempelsvar

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Kommentar

Innehållet i den här exempelfilen är orden "hello" och "world" på två separata rader.

Ladda ned en fil från en språkmodell

Begäran Ladda ned språkmodellfilinnehåll laddar ned en textfil som innehåller innehållet i den angivna filen från den angivna språkmodellen i det angivna kontot. Den här textfilen ska matcha innehållet i textfilen som ursprungligen laddades upp.

Exempelsvar

Svaret är nedladdningen av en textfil med innehållet i filen i JSON-format.

Dela via

Anpassa en språkmodell med Azure AI Video Indexer

Optimera din anpassade språkmodell

Förutsättningar

Skapa en språkmodell

Använda en språkmodell i en ny video

Använda en språkmodell för att indexera om

Redigera en språkmodell

Byt namn på språkmodellen

Lägg till filer

Ta bort filer

Ta bort en språkmodell

Anpassa språkmodeller genom att korrigera avskrifter

Skapa en språkmodell

Exempelsvar

Träna en språkmodell

Exempelsvar

Ta bort en språkmodell

Exempelsvar

Uppdatera en språkmodell

Exempelsvar

Uppdatera en fil från en språkmodell

Exempelsvar

Hämta en specifik språkmodell

Exempelsvar

Hämta alla språkmodeller

Exempelsvar

Ta bort en fil från en språkmodell

Exempelsvar

Hämta metadata för en fil från en språkmodell

Exempelsvar

Ladda ned en fil från en språkmodell

Exempelsvar

Feedback

Ytterligare resurser