Trénování modelu pracovního postupu orchestrace

Článek
12/19/2023

Trénování je proces, při kterém se model učí z označených promluv. Po dokončení trénování budete moct zobrazit výkon modelu.

Pokud chcete vytrénovat model, spusťte trénovací úlohu. Model vytvoří pouze úspěšně dokončené úlohy. Platnost trénovacích úloh vyprší po sedmi dnech, po této době už nebudete moct načíst podrobnosti o úloze. Pokud se vaše trénovací úloha úspěšně dokončila a vytvořil se model, vypršení platnosti úlohy na ni nebude mít vliv. Najednou můžete mít spuštěnou jenom jednu úlohu trénování a nemůžete spustit jiné úlohy ve stejném projektu.

Doba trénování může být od několika sekund při práci s jednoduchými projekty až po několik hodin, kdy dosáhnete maximálního limitu promluv.

Vyhodnocení modelu se aktivuje automaticky po úspěšném dokončení trénování. Proces vyhodnocení začíná použitím natrénovaného modelu ke spouštění predikcí promluv v testovací sadě a porovnává předpovězené výsledky se zadanými popisky (které stanoví základní hodnoty pravdivosti). Výsledky se vrátí, abyste mohli zkontrolovat výkon modelu.

Požadavky

Úspěšně vytvořený projekt s nakonfigurovaným účtem úložiště objektů blob v Azure

Další informace najdete v tématu Životní cyklus vývoje projektu .

Rozdělování dat

Než začnete s procesem trénování, jsou označené promluvy ve vašem projektu rozdělené na trénovací sadu a testovací sadu. Každá z nich má jinou funkci. Trénovací sada se používá při trénování modelu. Jedná se o sadu, ze které se model učí označené promluvy. Testovací sada je sada nevidomých, která se do modelu nezavádí během trénování, ale pouze během vyhodnocení.

Po úspěšném natrénování modelu je možné ho použít k předpovědím z promluv v testovací sadě. Tyto předpovědi se používají k výpočtu metrik vyhodnocení.

Doporučujeme zajistit, aby všechny vaše záměry byly adekvátně zastoupeny v trénovací i testovací sadě.

Pracovní postup orchestrace podporuje dvě metody rozdělení dat:

Automatické rozdělení testovací sady od trénovacích dat: Systém rozdělí označená data mezi trénovací a testovací sadu podle zvolených procent. Doporučené procento rozdělení je 80 % pro trénování a 20 % pro testování.

Poznámka

Pokud zvolíte možnost Automaticky rozdělit testovací sadu od trénovacích dat , rozdělí se podle zadaných procent pouze data přiřazená k trénovací sadě.

Použití ručního rozdělení trénovacích a testovacích dat: Tato metoda umožňuje uživatelům definovat, které promluvy mají patřit do které sady. Tento krok je povolený jenom v případě, že jste během označování přidali do testovací sady promluvy.

Poznámka

Do trénovací datové sady můžete přidávat výroky jenom pro nespojované záměry.

Trénování modelu

Pokud chcete začít s trénováním modelu v sadě Language Studio:

V nabídce na levé straně vyberte Trénovací úlohy .
V horní nabídce vyberte Spustit trénovací úlohu .
Vyberte Trénování nového modelu a do textového pole zadejte název modelu. Existující model můžete také přepsat tak, že vyberete tuto možnost a v rozevírací nabídce zvolíte model, který chcete přepsat. Přepsání natrénovaného modelu je nevratné, ale nasazené modely neovlivní, dokud nový model nenasadíte.

Pokud jste v projektu povolili ruční rozdělení dat při označování promluv, zobrazí se dvě možnosti rozdělení dat:
- Automatické rozdělení testovací sady od trénovacích dat: Označené promluvy se náhodně rozdělí mezi trénovací a testovací sadu podle toho, kolik procent zvolíte. Výchozí procentuální rozdělení je 80 % pro trénování a 20 % pro testování. Pokud chcete tyto hodnoty změnit, zvolte sadu, kterou chcete změnit, a zadejte novou hodnotu.
Poznámka

Pokud zvolíte možnost Automaticky rozdělit testovací sadu od trénovacích dat , rozdělí se podle zadaných procent jenom promluvy ve vaší trénovací sadě.
- Použití ručního rozdělení trénovacích a testovacích dat: Přiřaďte každou promluvu buď k trénovací , nebo testovací sadě během kroku označování projektu.
Poznámka

Možnost ručního rozdělení trénovacích a testovacích dat se povolí jenom v případě, že do testovací sady na stránce dat značek přidáte promluvy. V opačném případě bude zakázán.
Vyberte tlačítko Train (Trénovat).

Poznámka

Modely budou generovat pouze úspěšně dokončené trénovací úlohy.
Trénování může na základě velikosti označených dat nějakou dobu trvat několik minut až několik hodin.
Najednou můžete mít spuštěnou pouze jednu úlohu trénování. Nelze spustit jinou úlohu trénování se stejným projektem, dokud se spuštěná úloha nedokončí.

Vytvořte požadavek POST pomocí následující adresy URL, hlaviček a textu JSON a odešlete trénovací úlohu.

Adresa URL požadavku

Při vytváření požadavku rozhraní API použijte následující adresu URL. Nahraďte následující zástupné hodnoty vlastními hodnotami.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Zástupný symbol	Hodnota	Příklad
`{ENDPOINT}`	Koncový bod pro ověření požadavku rozhraní API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Název projektu. V této hodnotě se rozlišují malá a velká písmena.	`EmailApp`
`{API-VERSION}`	Verze rozhraní API, kterou voláte.	`2023-04-01`

Hlavičky

K ověření požadavku použijte následující hlavičku.

Klíč	Hodnota
`Ocp-Apim-Subscription-Key`	Klíč k vašemu prostředku. Používá se k ověřování požadavků rozhraní API.

Text požadavku

V požadavku použijte následující objekt. Model bude pojmenován po MyModel dokončení trénování.

{
  "modelLabel": "{MODEL-NAME}",
  "trainingMode": "standard",
  "trainingConfigVersion": "{CONFIG-VERSION}",
  "evaluationOptions": {
    "kind": "percentage",
    "testingSplitPercentage": 20,
    "trainingSplitPercentage": 80
  }
}

Klíč	Zástupný symbol	Hodnota	Příklad
`modelLabel`	`{MODEL-NAME}`	Název vašeho modelu.	`Model1`
`trainingMode`	`standard`	Režim trénování. V orchestraci je k dispozici pouze jeden režim trénování, kterým je `standard`.	`standard`
`trainingConfigVersion`	`{CONFIG-VERSION}`	Verze modelu konfigurace trénování. Ve výchozím nastavení se používá nejnovější verze modelu .	`2022-05-01`
`kind`	`percentage`	Metody rozdělení. Možné hodnoty jsou `percentage` nebo `manual`. Další informace najdete v tématu trénování modelu .	`percentage`
`trainingSplitPercentage`	`80`	Procento označených dat, která se mají zahrnout do trénovací sady Doporučená hodnota je `80`.	`80`
`testingSplitPercentage`	`20`	Procento označených dat, která se mají zahrnout do testovací sady Doporučená hodnota je `20`.	`20`

Poznámka

Hodnoty trainingSplitPercentage a testingSplitPercentage jsou vyžadovány pouze v případě, že Kind je nastavená na percentage hodnotu a součet obou procent by se měl rovnat hodnotě 100.

Jakmile odešlete požadavek rozhraní API, obdržíte odpověď označující 202 úspěch. V hlavičce odpovědi extrahujte operation-location hodnotu . Bude formátovaný takto:

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Tuto adresu URL můžete použít k získání stavu trénovací úlohy.

Získání stavu trénovací úlohy

Language Studio
Rozhraní REST API

V seznamu vyberte ID trénovací úlohy. Zobrazí se boční podokno, kde můžete zkontrolovat průběh trénování, stav úlohy a další podrobnosti pro tuto úlohu.

Trénování může nějakou dobu trvat v závislosti na velikosti trénovacích dat a složitosti schématu. Pomocí následujícího požadavku můžete pokračovat v dotazování na stav trénovací úlohy, dokud nebude úspěšně dokončena.

Pomocí následujícího požadavku GET získáte stav průběhu trénování modelu. Nahraďte následující zástupné hodnoty vlastními hodnotami.

Adresa URL požadavku

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Zástupný symbol	Hodnota	Příklad
`{YOUR-ENDPOINT}`	Koncový bod pro ověření požadavku rozhraní API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Název projektu. V této hodnotě se rozlišují malá a velká písmena.	`EmailApp`
`{JOB-ID}`	ID pro vyhledání stavu trénování modelu. Je v hodnotě hlavičky `location` , kterou jste získali při odeslání trénovací úlohy.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	Verze rozhraní API, kterou voláte.	`2023-04-01`

Hlavičky

K ověření požadavku použijte následující hlavičku.

Klíč	Hodnota
`Ocp-Apim-Subscription-Key`	Klíč k vašemu prostředku. Používá se k ověřování požadavků rozhraní API.

Text odpovědi

Jakmile požadavek odešlete, obdržíte následující odpověď. Pokračujte v dotazování tohoto koncového bodu, dokud se parametr status nezmění na "succeeded".

{
  "result": {
    "modelLabel": "{MODEL-LABEL}",
    "trainingConfigVersion": "{TRAINING-CONFIG-VERSION}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "xxxxxx-xxxxx-xxxxxx-xxxxxx",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Klíč	Hodnota	Příklad
`modelLabel`	Název modelu	`Model1`
`trainingConfigVersion`	Verze trénovací konfigurace. Ve výchozím nastavení se použije nejnovější verze .	`2022-05-01`
`startDateTime`	Čas zahájení trénování	`2022-04-14T10:23:04.2598544Z`
`status`	Stav trénovací úlohy	`running`
`estimatedEndDateTime`	Odhadovaný čas dokončení trénovací úlohy	`2022-04-14T10:29:38.2598544Z`
`jobId`	ID trénovací úlohy	`xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx`
`createdDateTime`	Datum a čas vytvoření trénovací úlohy	`2022-04-14T10:22:42Z`
`lastUpdatedDateTime`	Datum a čas poslední aktualizace úlohy trénování	`2022-04-14T10:23:45Z`
`expirationDateTime`	Datum a čas vypršení platnosti trénovací úlohy	`2022-04-14T10:22:42Z`

Zrušit trénovací úlohu

Language Studio
Rozhraní REST API

Pokud chcete zrušit úlohu trénování v nástroji Language Studio, přejděte na stránku Trénování modelu . Vyberte trénovací úlohu, kterou chcete zrušit, a v horní nabídce vyberte Zrušit .

Vytvořte požadavek POST pomocí následující adresy URL, hlaviček a textu JSON a zrušte trénovací úlohu.

Adresa URL požadavku

Při vytváření požadavku rozhraní API použijte následující adresu URL. Nahraďte následující zástupné hodnoty vlastními hodnotami.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Zástupný symbol	Hodnota	Příklad
`{ENDPOINT}`	Koncový bod pro ověření požadavku rozhraní API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Název projektu. V této hodnotě se rozlišují malá a velká písmena.	`EmailApp`
`{JOB-ID}`	Toto je ID trénovací úlohy.	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	Verze rozhraní API, kterou voláte.	`2023-04-01`

Hlavičky

K ověření požadavku použijte následující hlavičku.

Klíč	Hodnota
`Ocp-Apim-Subscription-Key`	Klíč k vašemu prostředku. Používá se k ověřování požadavků rozhraní API.

Po odeslání požadavku rozhraní API obdržíte odpověď 202 označující úspěch, což znamená, že vaše trénovací úloha byla zrušena. Výsledky úspěšného volání s hlavičkou Operation-Location sloužící ke kontrole stavu úlohy.

Sdílet prostřednictvím

Trénování modelu pracovního postupu orchestrace

Požadavky

Rozdělování dat

Trénování modelu

Spustit trénovací úlohu

Adresa URL požadavku

Hlavičky

Text požadavku

Získání stavu trénovací úlohy

Adresa URL požadavku

Hlavičky

Text odpovědi

Zrušit trénovací úlohu

Adresa URL požadavku

Hlavičky

Další kroky

Váš názor

Váš názor

Další materiály