Dela via


Anpassa en talmodell

Kommentar

Anpassning av talmodell, inklusive uttalsträning, stöds endast i Utvärderingskonton för Video Indexer Azure och Resource Manager-konton. Det stöds inte i klassiska konton. Information om hur du uppdaterar din kontotyp utan kostnad finns i Uppdatera ditt Azure AI Video Indexer-konto. Mer information om hur du använder den anpassade språkupplevelsen finns i Anpassa en språkmodell.

Med Azure AI Video Indexer kan du skapa anpassade talmodeller för att anpassa taligenkänning genom att ladda upp datauppsättningar som används för att skapa en talmodell. Den här artikeln går igenom stegen för att göra det via Video Indexer-webbplatsen. Du kan också använda API:et enligt beskrivningen i Anpassa talmodell med hjälp av API.

En detaljerad översikt och metodtips för anpassade talmodeller finns i Anpassa en talmodell med Azure AI Video Indexer.

Förutsättningar

  • Läs metodtipsguiden för speech-modellträning.
  • Ett Azure-konto
  • Ett Azure AI Video Indexer-konto

Skapa en datamängd

Eftersom alla anpassade modeller måste innehålla en datauppsättning börjar vi med processen för hur du skapar och hanterar datauppsättningar.

  1. Välj knappen Modellanpassning.
  2. Välj fliken Tal (ny).
  3. Välj Ladda upp datauppsättning.
  4. Välj antingen Oformaterad text eller Uttal från listrutan Datauppsättningstyp . Varje talmodell måste ha en datauppsättning med oformaterad text och kan eventuellt ha en uttalsdatauppsättning.
  5. Välj Bläddra och välj datamängdsfilen. Du kan bara välja en.
  6. Välj ett språk för modellen. Välj det språk som talas i de mediefiler som du planerar att indexera med den här modellen. Namnet på datauppsättningen är ifyllt med namnet på filen, men du kan ändra namnet.
  7. Du kan också lägga till en beskrivning av datamängden. Detta kan vara användbart för att särskilja varje datauppsättning om du förväntar dig att ha flera datauppsättningar.
  8. Välj överför. När datauppsättningen har skapats kan du använda den för att träna och skapa nya modeller.

Granska och uppdatera en datauppsättning

Du kan visa en datauppsättning och dess egenskaper genom att:

  • Klicka på datauppsättningens namn
  • Hovra över datauppsättningen
  • Välja ellipsen

Välj sedan Visa datauppsättning.

Du kan sedan visa namn, beskrivning, språk och status för datamängden plus följande egenskaper:

Antal rader: anger antalet rader som har lästs in av det totala antalet rader i filen. Om hela filen har lästs in matchar siffrorna (till exempel 10 av 10 normaliserade). Om talen inte matchar (till exempel 7 av 10 normaliserade) innebär det att endast några av raderna har lästs in och resten har fel. Vanliga orsaker till fel är formateringsproblem med en rad, till exempel att inte avståndet mellan en flik mellan varje ord i en uttalsfil. Att granska oformaterad text och uttalsdata för träningsartiklar bör vara användbart för att hitta problemet. Om du vill felsöka orsaken läser du felinformationen som finns i rapporten. Välj Visa rapport för att visa felinformationen om de rader som inte lästes in (errorKind). Detta kan också visas genom att välja fliken Rapport .

Datamängds-ID: Varje datauppsättning har ett unikt GUID, vilket behövs när du använder API:et för åtgärder som refererar till datamängden.

Oformaterad text (normaliserad): Detta innehåller den normaliserade texten i den inlästa datamängdsfilen. Normaliserad text är den tolkade texten i oformaterad form utan formatering.

Redigera information: Om du vill redigera en datauppsättnings namn eller beskrivning, när du hovrar över datauppsättningen, väljer du på ellipsen och väljer sedan Redigera information. Sedan kan du redigera datauppsättningens namn och beskrivning.

Kommentar

Data i en datauppsättning kan inte redigeras eller uppdateras när datamängden har laddats upp. Om du behöver redigera eller uppdatera data i en datauppsättning laddar du ned datamängden, utför redigeringarna, sparar filen och laddar upp den nya datamängdsfilen.

Ladda ned: Om du vill ladda ned en datamängdsfil, när du hovrar över datauppsättningen, väljer du på ellipsen och väljer sedan Ladda ned. När du visar datamängden kan du också välja Ladda ned och sedan välja att ladda ned datamängdsfilen eller ladda upp rapporten i JSON-formulär.

Ta bort: Om du vill ta bort en datauppsättning, när du hovrar över datauppsättningen, väljer du på ellipsen och väljer sedan Ta bort.

Skapa en anpassad talmodell

Datauppsättningar används för att skapa och träna modeller. När du har skapat en oformaterad datauppsättning kan du skapa och börja använda en anpassad talmodell.

Tänk på följande när du skapar och använder anpassade talmodeller:

  • En ny modell måste innehålla minst en oformaterad datauppsättning och kan ha flera oformaterade datauppsättningar.
  • Det är valfritt att inkludera en uttalsdatauppsättning och inte mer än en kan inkluderas.
  • När en modell har skapats kan du inte lägga till ytterligare datauppsättningar i den eller utföra några ändringar i dess datauppsättningar. Om du behöver lägga till eller ändra datauppsättningar skapar du en ny modell.
  • Om du har indexerat en video med en anpassad talmodell och sedan tar bort modellen påverkas inte avskriften om du inte utför en omindexering.
  • Om du har tagit bort en datauppsättning som användes för att träna en anpassad modell, eftersom talmodellen redan har tränats av datamängden, fortsätter den att använda den tills talmodellen har tagits bort.
  • Om du tar bort en anpassad modell påverkas den inte av transkriptionen av videor som redan indexerats med hjälp av modellen.

Träna en modell

Kommentar

När en modell har skapats kan datauppsättningar inte läggas till. En modell kan bara innehålla datauppsättningar på samma språk.

Det finns två sätt att träna en modell – via fliken datauppsättning och på fliken Modell.

Träna en modell via fliken Datauppsättningar

  1. Visa listan över datauppsättningar.
  2. Välj en oformaterad datauppsättning. Ikonen Träna ny modell ovan kan sedan väljas.
  3. Välj Träna ny modell.
  4. Ange ett namn för modellen, ett språk och lägg till en beskrivning.
  5. Välj fliken Datauppsättningar
  6. Välj de datauppsättningar som du vill ska ingå i modellen.
  7. Välj Skapa och träna.

Träna en modell via fliken Modeller

  1. Välj fliken Modeller .
  2. Välj ikonen Träna ny modell .
  3. Välj de datauppsättningar som du vill ska ingå i modellen.
  4. Ange ett namn för modellen, ett språk och lägg till en beskrivning.
  5. Välj fliken Datauppsättningar .
  6. Välj de datauppsättningar som du vill ska ingå i modellen.
  7. Välj Skapa och träna.

Granska och uppdatera en modell

Visa modell: Du kan visa en modell och dess egenskaper genom att antingen klicka på modellens namn eller när du hovrar över modellen, klickar på ellipsen och sedan väljer Visa modell.

På fliken Information visas sedan namnet, beskrivningen, språket och statusen för modellen plus följande egenskaper:

Modell-ID: Varje modell har ett unikt GUID som behövs när du använder API:et för åtgärder som refererar till modellen.

Skapades den: Det datum då modellen skapades.

Redigera information: Om du vill redigera en modells namn eller beskrivning, när du hovrar över modellen, väljer du på ellipsen och väljer sedan Redigera information. Sedan kan du redigera modellens namn och beskrivning.

Kommentar

Endast modellens namn och beskrivning kan redigeras. Om du vill göra ändringar i dess datauppsättningar eller lägga till datauppsättningar måste en ny modell skapas.

Ta bort: Om du vill ta bort en modell när du hovrar över datauppsättningen väljer du på ellipsen och väljer sedan Ta bort.

Inkluderade datauppsättningar: Välj på fliken Inkluderade datamängder för att visa modellens datauppsättningar.

Använda en anpassad språkmodell när du indexerar en video

En anpassad språkmodell används inte som standard för indexeringsjobb, så måste väljas under indexuppladdningsprocessen.

  1. Under uppladdningsprocessen väljer du din anpassade språkmodellkälla i den nedrullningsbara menyn för språk .
  2. Välj överför.

Samma steg gäller när du vill indexera om en video med en anpassad modell.