Anpassa en språkmodell med Azure AI Video Indexer
Azure AI Video Indexer stöder automatisk taligenkänning genom integrering med Microsoft Custom Speech Service. Du kan anpassa språkmodellen genom att ladda upp anpassningstext. Den här texten kommer från domänen vars vokabulär du vill att motorn ska använda för att anpassa. När du har tränat din modell känns nya ord som visas i anpassningstexten igen, förutsatt standarduttal, och språkmodellen lär sig nya troliga ordsekvenser. Se listan över språk som stöds av Azure AI Video Indexer i langues som stöds.
Till exempel är "Kubernetes" (i kontexten för Azure Kubernetes-tjänsten) ett ord som är mycket specifikt. Eftersom ordet är nytt för Azure AI Video Indexer känns det igen som "communities". Träna modellen att känna igen den som "Kubernetes". I andra fall finns orden, men språkmodellen förväntar sig inte att de ska visas i en viss kontext. Till exempel är "containertjänst" inte en 2-ords sekvens som en icke-specialiserad språkmodell skulle känna igen som en specifik uppsättning ord.
Det finns två sätt att anpassa en språkmodell:
- Alternativ 1: Redigera avskriften som genererades av Azure AI Video Indexer. Genom att redigera och korrigera avskriften tränar du en språkmodell för att ge bättre resultat i framtiden.
- Alternativ 2: Ladda upp textfiler för att träna språkmodellen. Filen kan antingen innehålla en lista med ord som du vill att de ska visas i Video Indexer-avskriften eller relevanta ord som ingår naturligt i meningar och stycken. När bättre resultat uppnås med den senare metoden rekommenderar vi att uppladdningsfilen innehåller fullständiga meningar eller stycken som är relaterade till ditt innehåll.
Viktigt!
Inkludera inte orden eller meningarna som för närvarande felaktigt transkriberade (till exempel "communities") i uppladdningsfilen eftersom detta kommer att negera den avsedda effekten. Inkludera bara orden som du vill att de ska visas (till exempel "Kubernetes").
Optimera din anpassade språkmodell
Azure AI Video Indexer lär sig baserat på sannolikheter för ordkombinationer, så att du lär dig bäst:
- Ge tillräckligt med verkliga exempel på meningar som de skulle talas.
- Lägg bara en mening per rad, inte mer. Annars lär sig systemet sannolikheter mellan meningar.
- Det är okej att sätta ett ord som en mening för att öka ordet mot andra, men systemet lär sig bäst av fullständiga meningar.
- När du introducerar nya ord eller förkortningar, om möjligt, ge så många exempel på användning i en fullständig mening för att ge så mycket kontext som möjligt till systemet.
- Försök att lägga till flera anpassningsalternativ och se hur de fungerar för dig.
- Undvik upprepning av exakt samma mening flera gånger. Det kan skapa bias mot resten av indata.
- Undvik att inkludera ovanliga symboler (~, # @ % &) när de tas bort. De meningar som de visas i ignoreras också.
- Undvik att lägga för stora indata, till exempel hundratusentals meningar, eftersom detta kommer att späda ut effekten av att öka.
Förutsättningar
- Ett Azure-konto
- Ett Azure AI Video Indexer-konto
Skapa en språkmodell
- Gå till webbplatsen för Azure AI Video Indexer och logga in.
- Om du vill anpassa en modell i ditt konto väljer du knappen Con režim šatora l customization till vänster på sidan.
- Välj fliken Språk . Du ser en lista över språk som stöds.
- Under det språk som du vill använda väljer du Lägg till modell.
- Skriv in namnet på språkmodellen och tryck på Retur. Det här steget skapar modellen och ger möjlighet att ladda upp textfiler till modellen.
- Om du vill lägga till en textfil väljer du Lägg till fil. Utforskaren öppnas.
- Navigera till och välj textfilen. Du kan lägga till flera textfiler i en språkmodell. Du kan också lägga till en textfil genom att välja knappen ... till höger i språkmodellen och välja Lägg till fil.
- När du är klar med att ladda upp textfilerna väljer du det gröna alternativet Träna .
Träningsprocessen kan ta några minuter. När träningen är klar visas Tränad bredvid modellen. Du kan förhandsgranska, ladda ned och ta bort filen från modellen.
Använda en språkmodell i en ny video
Om du vill använda din språkmodell i en ny video gör du något av följande:
- Välj knappen Ladda upp överst på sidan.
- Släpp ljud- eller videofilen eller bläddra efter filen.
- Välj en språkmodell som du skapade i listrutan Video source language (Video source language ).
- Välj alternativet Ladda upp längst ned på sidan så indexeras den nya videon med hjälp av språkmodellen.
Använda en språkmodell för att indexera om
- Logga in på startsidan för Azure AI Video Indexer .
- Klicka på ... i videon och välj Indexering igen.
- Välj listrutan Video source language (Video source language) och välj en språkmodell som du skapade i listan.
- Välj knappen Indexera om så indexeras videon om med hjälp av språkmodellen.
Redigera en språkmodell
Du kan redigera en språkmodell genom att ändra dess namn, lägga till filer i den och ta bort filer från den. Om du lägger till eller tar bort filer från språkmodellen måste du träna modellen igen genom att välja det gröna alternativet Träna .
Byt namn på språkmodellen
Du kan ändra namnet på språkmodellen genom att välja ellipsknappen (...) till höger i språkmodellen och välja Byt namn. Ange det nya namnet.
Lägg till filer
- Välj Lägg till fil. Utforskaren öppnas.
- Navigera till och välj textfilen. Du kan lägga till flera textfiler i en språkmodell.
Du kan också lägga till en textfil genom att välja ellipsknappen (...) till höger i språkmodellen och välja Lägg till fil.
Ta bort filer
Den här åtgärden tar bort filen helt från språkmodellen.
- Välj ellipsknappen (...) till höger i textfilen.
- Välj Ta bort. Ett nytt fönster visas som anger att borttagningen inte kan ångras.
- Välj alternativet Ta bort i det nya fönstret.
Ta bort en språkmodell
Den här åtgärden tar bort språkmodellen helt från ditt konto. Alla videor som använder deletedlLanguage-modellen behåller samma index tills du indexerar om videon. Om du indexerar om videon kan du tilldela videon en ny språkmodell. Annars använder Azure AI Video Indexer sin standardmodell för att indexera om videon.
- Välj ellipsknappen (...) till höger i språkmodellen.
- Välj Ta bort. Ett nytt fönster visas som anger att borttagningen inte kan ångras.
- Välj alternativet Ta bort i det nya fönstret.
Anpassa språkmodeller genom att korrigera avskrifter
Azure AI Video Indexer anpassar språkmodeller baserat på de faktiska korrigeringar som användarna gör i transkriptionerna av sina videor. Den samlar in alla rader som du korrigerade i transkriptionen av videon och lägger till dem i en textfil med namnet From transcript edits
. Dessa redigeringar används för att träna om språkmodellen som användes för att indexera videon.
Redigeringar som gjordes i widgetens tidslinje ingår också.
Om du inte angav någon språkmodell när du indexerade videon lagras alla redigeringar för videon i en standardspråkmodell som anropas Account adaptations
inom det identifierade språket i videon.
Om flera ändringar har gjorts på samma rad används endast den senaste versionen av den korrigerade raden för att uppdatera språkmodellen.
Kommentar
Endast textkorrigeringar används för anpassningen. Korrigeringar som inte omfattar faktiska ord (till exempel skiljetecken eller blanksteg) ingår inte.
- Välj den video som du vill redigera från biblioteket.
- Välj fliken Tidslinje .
- Välj pennikonen för att redigera transkriptionen av transkriptionen.
- Avskriftskorrigeringar visas på fliken Språk på sidan Anpassning av con režim šatora l. Om du vill titta på filen "Från transkriptionsredigeringar" för var och en av dina språkmodeller väljer du den för att öppna den.