Sdílet prostřednictvím


Přizpůsobení modelu řeči

Poznámka:

Přizpůsobení modelu řeči, včetně trénování výslovnosti, se podporuje jenom ve zkušebních účtech Azure Video Indexeru a účtech Resource Manageru. Nepodporuje se v klasických účtech. Pokyny k aktualizaci typu účtu bez poplatků najdete v tématu Aktualizace účtu Azure AI Video Indexer. Pokyny k používání vlastního jazyka najdete v tématu Přizpůsobení jazykového modelu.

Azure AI Video Indexer umožňuje vytvářet vlastní modely řeči pro přizpůsobení rozpoznávání řeči nahráním datových sad, které se používají k vytvoření modelu řeči. Tento článek popisuje kroky, které je potřeba provést prostřednictvím webu Video Indexer. Můžete také použít rozhraní API, jak je popsáno v tématu Přizpůsobení modelu řeči pomocí rozhraní API.

Podrobný přehled a osvědčené postupy pro vlastní modely řeči najdete v tématu Přizpůsobení modelu řeči pomocí Azure AI Video Indexeru.

Požadavky

  • Přečtěte si průvodce osvědčenými postupy trénování modelu speech.
  • Účet Azure
  • Účet Azure AI Video Indexeru

Vytvoření datové sady

Protože všechny vlastní modely musí obsahovat datovou sadu, začneme procesem vytváření a správy datových sad.

  1. Vyberte tlačítko Přizpůsobení modelu.
  2. Vyberte kartu Speech (nový).
  3. Vyberte Nahrát datovou sadu.
  4. V rozevírací nabídce Typ datové sady vyberte prostý text nebo výslovnost. Každý model řeči musí mít datovou sadu prostého textu a volitelně může mít datovou sadu výslovnosti.
  5. Vyberte Procházet a vyberte soubor datové sady. Můžete zvolit jenom jednu.
  6. Vyberte jazyk modelu. Zvolte jazyk, který se mluví v mediálních souborech, které plánujete indexovat pomocí tohoto modelu. Název datové sady je předem vyplněný názvem souboru, ale název můžete upravit.
  7. Volitelně můžete přidat popis datové sady. To může být užitečné k rozlišení každé datové sady, pokud očekáváte, že bude mít více datových sad.
  8. Vyberte Odeslat. Po dokončení vytváření datové sady ji můžete použít k trénování a vytváření nových modelů.

Kontrola a aktualizace datové sady

Datovou sadu a její vlastnosti můžete zobrazit pomocí:

  • Kliknutí na název datové sady
  • Najetím myší na datovou sadu
  • Výběr tří teček

Pak vyberte Zobrazit datovou sadu.

Potom můžete zobrazit název, popis, jazyk a stav datové sady a následující vlastnosti:

Počet řádků: označuje počet řádků, které byly úspěšně načteny z celkového počtu řádků v souboru. Pokud se celý soubor úspěšně načte, budou se čísla shodovat (například 10 z 10 normalizovaných). Pokud se čísla neshoduje (například 7 z 10 normalizovaných), znamená to, že se úspěšně načetly jenom některé řádky a zbytek měl chyby. Běžnými příčinami chyb jsou problémy s formátováním čáry, například nezařazení tabulátoru mezi jednotlivými slovy v souboru výslovnosti. Při hledání problému by mělo být užitečné zkontrolovat prostý text a výslovnost dat pro články školení. Pokud chcete vyřešit příčinu, projděte si podrobnosti o chybě, které jsou obsaženy v sestavě. Výběrem možnosti Zobrazit sestavu zobrazíte podrobnosti o chybě týkající se řádků, které se úspěšně nenačetly (errorKind). Můžete ho také zobrazit výběrem karty Sestava .

ID datové sady: Každá datová sada má jedinečný identifikátor GUID, který je potřeba při použití rozhraní API pro operace, které odkazují na datovou sadu.

Prostý text (normalizovaný):: Obsahuje normalizovaný text načteného souboru datové sady. Normalizovaný text je rozpoznaný text ve formátu prostého formátu bez formátování.

Upravit podrobnosti: Pokud chcete upravit název nebo popis datové sady, vyberte při najetí myší na datovou sadu tři tečky a pak vyberte Upravit podrobnosti. Pak můžete upravit název a popis datové sady.

Poznámka:

Data v datové sadě se po nahrání datové sady nedají upravovat ani aktualizovat. Pokud potřebujete upravit nebo aktualizovat data v datové sadě, stáhněte si datovou sadu, proveďte úpravy, uložte soubor a nahrajte nový soubor datové sady.

Stažení: Pokud chcete stáhnout soubor datové sady, vyberte při najetí myší na datovou sadu tři tečky a pak vyberte Stáhnout. Případně můžete při prohlížení datové sady vybrat Možnost Stáhnout a pak si můžete stáhnout soubor datové sady nebo nahrát sestavu ve formuláři JSON.

Odstranění: Pokud chcete odstranit datovou sadu, vyberte při najetí myší na datovou sadu tři tečky a pak vyberte Odstranit.

Vytvoření vlastního modelu řeči

Datové sady se používají při vytváření a trénování modelů. Jakmile vytvoříte datovou sadu prostého textu, můžete vytvořit a začít používat vlastní model řeči.

Při vytváření a používání vlastních modelů řeči mějte na paměti následující skutečnosti:

  • Nový model musí obsahovat alespoň jednu datovou sadu prostého textu a může mít několik datových sad prostého textu.
  • Je volitelné zahrnout datovou sadu výslovnosti a není možné zahrnout více než jednu datovou sadu.
  • Po vytvoření modelu do něj nemůžete přidat další datové sady ani provádět žádné úpravy datových sad. Pokud potřebujete přidat nebo upravit datové sady, vytvořte nový model.
  • Pokud jste video indexovali pomocí vlastního modelu řeči a pak model odstranili, nebude přepis ovlivněn, pokud neprovedete přeindexování.
  • Pokud jste odstranili datovou sadu, která byla použita k trénování vlastního modelu, protože už je model řeči natrénovaný datovou sadou, bude ji dál používat, dokud se model řeči odstraní.
  • Pokud odstraníte vlastní model, nemá to žádný vliv na přepis videí, která už byla indexována pomocí modelu.

Učení modelu

Poznámka:

Po vytvoření modelu se datové sady nedají přidat. Model může obsahovat pouze datové sady stejného jazyka.

Model můžete trénovat dvěma způsoby – prostřednictvím karty datové sady a karty modelu.

Trénování modelu prostřednictvím karty Datové sady

  1. Zobrazte seznam datových sad.
  2. Vyberte datovou sadu prostého textu. Potom můžete vybrat ikonu Trénovat nový model výše.
  3. Vyberte Trénovat nový model.
  4. Zadejte název modelu, jazyka a volitelně přidejte popis.
  5. Výběr karty Datové sady
  6. Vyberte datové sady, které chcete zahrnout do modelu.
  7. Vyberte Vytvořit a trénovat.

Trénování modelu prostřednictvím karty Modely

  1. Vyberte kartu Modely.
  2. Vyberte Ikonu Trénování nového modelu .
  3. Vyberte datové sady, které chcete být součástí modelu.
  4. Zadejte název modelu, jazyka a volitelně přidejte popis.
  5. Vyberte kartu Datové sady.
  6. Vyberte datové sady, které chcete zahrnout do modelu.
  7. Vyberte Vytvořit a trénovat.

Kontrola a aktualizace modelu

Zobrazit model: Model a jeho vlastnosti můžete zobrazit tak, že kliknete na název modelu nebo na něj najedete myší, kliknete na tři tečky a vyberete Zobrazit model.

Na kartě Podrobnosti se pak zobrazí název, popis, jazyk a stav modelu a následující vlastnosti:

ID modelu: Každý model má jedinečný identifikátor GUID, který je potřeba při použití rozhraní API pro operace, které odkazují na model.

Vytvořeno: Datum vytvoření modelu.

Upravit podrobnosti: Pokud chcete upravit název nebo popis modelu, vyberte při najetí myší na model tři tečky a pak vyberte Upravit podrobnosti. Pak můžete upravit název a popis modelu.

Poznámka:

Je možné upravit pouze název a popis modelu. Pokud chcete provést jakékoli změny v datových sadách nebo přidat datové sady, je potřeba vytvořit nový model.

Odstranění: Pokud chcete model odstranit, vyberte při najetí myší na datovou sadu tři tečky a pak vyberte Odstranit.

Zahrnuté datové sady: Výběrem na kartě Zahrnuté datové sady zobrazíte datové sady modelu.

Použití vlastního jazykového modelu při indexování videa

Pro úlohy indexování se ve výchozím nastavení nepoužívá vlastní jazykový model, takže je nutné ho vybrat během procesu nahrávání indexu.

  1. Během procesu nahrávání vyberte zdroj vlastního jazykového modelu z rozevírací nabídky jazyka .
  2. Vyberte Odeslat.

Stejný postup platí, když chcete přeindexovat video pomocí vlastního modelu.