Trénování modelu porozumění konverzačnímu jazyku

Článek
12/19/2023

Po dokončení označování promluv můžete začít s trénováním modelu. Trénování je proces, při kterém se model učí z označených promluv.

Pokud chcete vytrénovat model, spusťte trénovací úlohu. Model vytvoří pouze úspěšně dokončené úlohy. Platnost trénovacích úloh vyprší po sedmi dnech, po této době už nebudete moct načíst podrobnosti o úloze. Pokud se vaše trénovací úloha úspěšně dokončila a vytvořil se model, vypršení platnosti úlohy na ni nebude mít vliv. Najednou můžete mít spuštěnou jenom jednu úlohu trénování a nemůžete spustit jiné úlohy ve stejném projektu.

Doba trénování může být od několika sekund při práci s jednoduchými projekty až po několik hodin, kdy dosáhnete maximálního limitu promluv.

Vyhodnocení modelu se aktivuje automaticky po úspěšném dokončení trénování. Proces vyhodnocení začíná použitím natrénovaného modelu ke spouštění predikcí promluv v testovací sadě a porovnává předpovězené výsledky se zadanými popisky (které stanoví základní hodnoty pravdivosti).

Požadavky

Úspěšně vytvořený projekt s nakonfigurovaným účtem úložiště objektů blob v Azure
Označené promluvy

Vyvážení trénovacích dat

Pokud jde o trénovací data, měli byste se snažit, aby vaše schéma bylo dobře vyvážené. Zahrnutí velkého množství jednoho záměru a velmi málo dalších záměrů způsobí, že model bude silně zkreslený vůči konkrétním záměrům.

Pokud to chcete vyřešit, možná budete muset trénovací sadu převzorkovat nebo do ní přidat. Převzorkování dolů je možné provést pomocí:

Náhodné odstranění určitého procenta trénovacích dat
Systematičtějším způsobem díky analýze datové sady a odebrání nadměrně zastoupených duplicitních položek.

Do trénovací sady můžete také přidat výběrem možnosti Navrhnout promluvy na kartě Popisky dat v nástroji Language Studio. Konverzační Language Understanding odešle volání do Azure OpenAI za účelem vygenerování podobných promluv.

Měli byste také hledat nezamýšlené "vzory" v trénovací sadě. Například pokud je trénovací sada pro konkrétní záměr malými písmeny nebo začíná konkrétní frází. V takových případech se model, který vytrénujete, může naučit tyto nezamýšlené předsudky v trénovací sadě, místo aby mohl generalizovat.

Doporučujeme, abyste do trénovací sady zavedli různá velikost a interpunkci. Pokud se očekává, že váš model zvládne varianty, nezapomeňte mít trénovací sadu, která tuto rozmanitost také odráží. Můžete například zahrnout některé promluvy se správnými písmeny a některé malými písmeny.

Rozdělování dat

Než začnete s procesem trénování, jsou označené promluvy ve vašem projektu rozdělené na trénovací sadu a testovací sadu. Každá z nich má jinou funkci. Trénovací sada se používá při trénování modelu. Jedná se o sadu, ze které se model učí označené promluvy. Testovací sada je sada nevidomých, která se do modelu nezavádí během trénování, ale pouze během vyhodnocení.

Po úspěšném natrénování modelu je možné ho použít k předpovědím z promluv v testovací sadě. Tyto předpovědi se používají k výpočtu metrik vyhodnocení. Doporučujeme zajistit, aby všechny vaše záměry a entity byly dostatečně zastoupeny v trénovací i testovací sadě.

Porozumění konverzačnímu jazyku podporuje dvě metody rozdělení dat:

Automatické rozdělení testovací sady od trénovacích dat: Systém rozdělí označená data mezi trénovací a testovací sadu podle zvolených procent. Doporučené procento rozdělení je 80 % pro trénování a 20 % pro testování.

Poznámka

Pokud zvolíte možnost Automaticky rozdělit testovací sadu od trénovacích dat , rozdělí se podle zadaných procent pouze data přiřazená k trénovací sadě.

Použití ručního rozdělení trénovacích a testovacích dat: Tato metoda umožňuje uživatelům definovat, které promluvy mají patřit do které sady. Tento krok je povolený jenom v případě, že jste během označování přidali do testovací sady promluvy.

Režimy trénování

CLU podporuje dva režimy trénování modelů.

Standardní trénování používá k relativně rychlému trénování modelů algoritmy rychlého strojového učení. Tato možnost je momentálně dostupná jenom pro angličtinu a je zakázaná pro všechny projekty, které jako primární jazyk nepoužívají angličtinu (USA) nebo angličtinu (SPOJENÉ KRÁLOVSTVÍ). Tato možnost školení je bezplatná. Standardní trénování umožňuje přidávat promluvy a rychle je testovat bez nákladů. Zobrazená skóre hodnocení by vás měla navést na to, kde v projektu provést změny a přidat další promluvy. Jakmile několikrát iteujete a provedete přírůstková vylepšení, můžete zvážit použití pokročilého trénování k trénování jiné verze modelu.
Pokročilé trénování využívá nejnovější technologie strojového učení k přizpůsobení modelů s vašimi daty. Očekává se, že se u vašich modelů zobrazí lepší skóre výkonu a umožní vám také využívat vícejazyčné funkce CLU. Za pokročilé školení se platí různě. Podrobnosti najdete v informacích o cenách .

Při rozhodování využijte skóre hodnocení. Může se stát, že se v rozšířeném trénování predikuje konkrétní příklad nesprávně než při použití standardního režimu trénování. Pokud jsou ale celkové výsledky vyhodnocení lepší s využitím pokročilých funkcí, doporučujeme použít konečný model. Pokud tomu tak není a nechcete používat žádné vícejazyčné funkce, můžete dál používat model natrénovaný ve standardním režimu.

Poznámka

Měli byste očekávat rozdíl v chování ve skóre spolehlivosti záměru mezi trénovacími režimy, protože každý algoritmus kalibruje skóre odlišně.

Pokud chcete začít s trénováním modelu v sadě Language Studio:

V nabídce na levé straně vyberte Trénovat model .
V horní nabídce vyberte Spustit trénovací úlohu .
Vyberte Trénování nového modelu a zadejte nový název modelu do textového pole. Pokud chcete nahradit existující model modelem natrénovaným na nových datech, vyberte Přepsat existující model a pak vyberte existující model. Přepsání natrénovaného modelu je nevratné, ale nasazené modely neovlivní, dokud nový model nenasadíte.
Vyberte režim trénování. Pro rychlejší trénování můžete zvolit standardní trénování , ale je k dispozici jenom pro angličtinu. Nebo můžete zvolit pokročilé školení , které je podporované pro jiné jazyky a vícejazyčné projekty, ale zahrnuje delší dobu trénování. Přečtěte si další informace o režimech trénování.
Vyberte metodu dělení dat . Můžete zvolit automatické rozdělení testovací sady od trénovacích dat , kdy systém rozdělí promluvy mezi trénovací a testovací sadu podle zadaných procent. Nebo můžete použít ruční rozdělení trénovacích a testovacích dat. Tato možnost je povolená jenom v případě, že jste při označování promluv přidali do testovací sady promluvy.
Vyberte tlačítko Train (Trénovat).
V seznamu vyberte ID trénovací úlohy. Zobrazí se panel, kde můžete zkontrolovat průběh trénování, stav úlohy a další podrobnosti pro tuto úlohu.
Poznámka
- Modely budou generovat pouze úspěšně dokončené trénovací úlohy.
- Trénování může na základě počtu promluv trvat nějakou dobu mezi několika minutami a několika hodinami.
- Najednou můžete mít spuštěnou pouze jednu úlohu trénování. V rámci stejného projektu nemůžete spustit další úlohy trénování, dokud se spuštěná úloha nedokončí.
- Strojové učení používané k trénování modelů se pravidelně aktualizuje. Pokud chcete trénovat na předchozí verzi konfigurace, vyberte Vybrat sem, pokud chcete změnit na stránce Spustit trénovací úlohu a zvolte předchozí verzi.

Spustit trénovací úlohu

Vytvořte požadavek POST pomocí následující adresy URL, hlaviček a textu JSON a odešlete trénovací úlohu.

Adresa URL požadavku

Při vytváření požadavku rozhraní API použijte následující adresu URL. Zástupné hodnoty nahraďte vlastními hodnotami.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Zástupný symbol	Hodnota	Příklad
`{ENDPOINT}`	Koncový bod pro ověření požadavku rozhraní API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Název projektu. V této hodnotě se rozlišují malá a velká písmena.	`EmailApp`
`{API-VERSION}`	Verze rozhraní API, kterou voláte.	`2023-04-01`

Hlavičky

K ověření požadavku použijte následující hlavičku.

Klíč	Hodnota
`Ocp-Apim-Subscription-Key`	Klíč k vašemu prostředku. Používá se k ověřování požadavků rozhraní API.

Text požadavku

V požadavku použijte následující objekt. Model bude pojmenován podle hodnoty, kterou použijete pro modelLabel parametr po dokončení trénování.

{
  "modelLabel": "{MODEL-NAME}",
  "trainingMode": "{TRAINING-MODE}",
  "trainingConfigVersion": "{CONFIG-VERSION}",
  "evaluationOptions": {
    "kind": "percentage",
    "testingSplitPercentage": 20,
    "trainingSplitPercentage": 80
  }
}

Klíč	Zástupný symbol	Hodnota	Příklad
`modelLabel`	`{MODEL-NAME}`	Název vašeho modelu.	`Model1`
`trainingConfigVersion`	`{CONFIG-VERSION}`	Verze modelu konfigurace trénování. Ve výchozím nastavení se používá nejnovější verze modelu .	`2022-05-01`
`trainingMode`	`{TRAINING-MODE}`	Režim trénování, který se má použít pro trénování. Podporované režimy jsou standardní trénování, rychlejší trénování, ale k dispozici pouze pro angličtinu a pokročilé trénování podporované pro jiné jazyky a vícejazyčné projekty, ale zahrnují delší dobu trénování. Přečtěte si další informace o režimech trénování.	`standard`
`kind`	`percentage`	Metody rozdělení. Možné hodnoty jsou `percentage` nebo `manual`. Další informace najdete v tématu trénování modelu .	`percentage`
`trainingSplitPercentage`	`80`	Procento označených dat, která se mají zahrnout do trénovací sady Doporučená hodnota je `80`.	`80`
`testingSplitPercentage`	`20`	Procento označených dat, která se mají zahrnout do testovací sady Doporučená hodnota je `20`.	`20`

Poznámka

Hodnoty trainingSplitPercentage a testingSplitPercentage jsou vyžadovány pouze v případě, že Kind je nastavená na percentage hodnotu a součet obou procent by se měl rovnat hodnotě 100.

Jakmile odešlete požadavek rozhraní API, obdržíte odpověď označující 202 úspěch. V hlavičce odpovědi extrahujte operation-location hodnotu . Bude formátovaný takto:

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Tuto adresu URL můžete použít k získání stavu trénovací úlohy.

Získání stavu trénovací úlohy

Trénování může nějakou dobu trvat v závislosti na velikosti trénovacích dat a složitosti schématu. Pomocí následujícího požadavku můžete pokračovat v dotazování na stav trénovací úlohy, dokud nebude úspěšně dokončena.

Když odešlete úspěšnou žádost o trénování, bude úplná adresa URL požadavku pro kontrolu stavu úlohy (včetně koncového bodu, názvu projektu a ID úlohy) obsažená operation-location v hlavičce odpovědi.

Pomocí následujícího požadavku GET získáte stav průběhu trénování modelu. Nahraďte následující zástupné hodnoty vlastními hodnotami.

Adresa URL požadavku

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Zástupný symbol	Hodnota	Příklad
`{YOUR-ENDPOINT}`	Koncový bod pro ověření požadavku rozhraní API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Název projektu. V této hodnotě se rozlišují malá a velká písmena.	`EmailApp`
`{JOB-ID}`	ID pro vyhledání stavu trénování modelu.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	Verze rozhraní API, kterou voláte.	`2023-04-01`

Hlavičky

K ověření požadavku použijte následující hlavičku.

Klíč	Hodnota
`Ocp-Apim-Subscription-Key`	Klíč k vašemu prostředku. Používá se k ověřování požadavků rozhraní API.

Text odpovědi

Jakmile požadavek odešlete, obdržíte následující odpověď. Pokračujte v dotazování tohoto koncového bodu, dokud se parametr status nezmění na "succeeded".

{
  "result": {
    "modelLabel": "{MODEL-LABEL}",
    "trainingConfigVersion": "{TRAINING-CONFIG-VERSION}",
    "trainingMode": "{TRAINING-MODE}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "xxxxx-xxxxx-xxxx-xxxxx-xxxx",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Klíč	Hodnota	Příklad
`modelLabel`	Název modelu	`Model1`
`trainingConfigVersion`	Verze trénovací konfigurace. Ve výchozím nastavení se použije nejnovější verze .	`2022-05-01`
`trainingMode`	Vybraný režim trénování.	`standard`
`startDateTime`	Čas zahájení trénování	`2022-04-14T10:23:04.2598544Z`
`status`	Stav trénovací úlohy	`running`
`estimatedEndDateTime`	Odhadovaný čas dokončení trénovací úlohy	`2022-04-14T10:29:38.2598544Z`
`jobId`	ID trénovací úlohy	`xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx`
`createdDateTime`	Datum a čas vytvoření trénovací úlohy	`2022-04-14T10:22:42Z`
`lastUpdatedDateTime`	Datum a čas poslední aktualizace úlohy trénování	`2022-04-14T10:23:45Z`
`expirationDateTime`	Datum a čas vypršení platnosti trénovací úlohy	`2022-04-14T10:22:42Z`

Zrušit trénovací úlohu

Language Studio
Rozhraní REST API

Zrušení úlohy trénování ze sady Language Studio

Na stránce Trénování modelu vyberte trénovací úlohu, kterou chcete zrušit, a v horní nabídce vyberte Zrušit .

Vytvořte požadavek POST pomocí následující adresy URL, hlaviček a textu JSON a zrušte trénovací úlohu.

Adresa URL požadavku

Při vytváření požadavku rozhraní API použijte následující adresu URL. Nahraďte následující zástupné hodnoty vlastními hodnotami.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Zástupný symbol	Hodnota	Příklad
`{ENDPOINT}`	Koncový bod pro ověření požadavku rozhraní API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Název projektu. V této hodnotě se rozlišují malá a velká písmena.	`EmailApp`
`{JOB-ID}`	Toto je ID trénovací úlohy.	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	Verze rozhraní API, kterou voláte.	`2023-04-01`

Hlavičky

K ověření požadavku použijte následující hlavičku.

Klíč	Hodnota
`Ocp-Apim-Subscription-Key`	Klíč k vašemu prostředku. Používá se k ověřování požadavků rozhraní API.

Po odeslání požadavku rozhraní API obdržíte odpověď 202 označující úspěch, což znamená, že vaše trénovací úloha byla zrušena. Výsledky úspěšného volání s hlavičkou, která Operation-Location slouží ke kontrole stavu úlohy.

Další kroky

Metriky vyhodnocení modelu

Trénování modelu porozumění konverzačnímu jazyku

Požadavky

Vyvážení trénovacích dat

Rozdělování dat

Režimy trénování

Trénování modelu

Zrušit trénovací úlohu

Další kroky

Další materiály