Sdílet prostřednictvím


Odeslání trénovací úlohy v sadě Studio

Trénovací úlohu ve službě Azure Machine Learning je možné vytvořit mnoha způsoby. Můžete použít rozhraní příkazového řádku (viz trénování modelů (vytváření úloh)), rozhraní REST API (viz trénování modelů pomocí REST (Preview)) nebo můžete pomocí uživatelského rozhraní přímo vytvořit trénovací úlohu. V tomto článku se dozvíte, jak pomocí vlastních dat a kódu vytrénovat model strojového učení s asistencí pro odesílání trénovacích úloh v studio Azure Machine Learning.

Důležité

Tato funkce je v současné době ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti.

Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Požadavky

Začínáme

  1. Přihlaste se k studio Azure Machine Learning.

  2. Vyberte své předplatné a pracovní prostor.

  • Uživatelské rozhraní pro vytváření úloh můžete zadat z domovské stránky. Vyberte Vytvořit nový a vyberte Úloha. domovská stránka studio Azure Machine Learning

V tomto kroku můžete vybrat metodu trénování, dokončit zbytek formuláře pro odeslání na základě vašeho výběru a odeslat trénovací úlohu. Níže si projdeme formulář s postupem spuštění vlastního skriptu (úloha příkazu).

studio Azure Machine Learning vstupní stránku trénovacího formuláře pro uživatele, aby zvolili metodu trénování.

Konfigurace základního nastavení

Prvním krokem je konfigurace základních informací o vaší trénovací úloze. Můžete pokračovat dál, pokud jste s výchozími nastaveními, které jsme pro vás zvolili, nebo proveďte změny požadované předvolby.

studio Azure Machine Learning formulář pro odeslání úlohy pro uživatele, aby nakonfigurovali základní nastavení.

K dispozici jsou tato pole:

Pole Popis
Název úlohy Pole pro název úlohy se používá k její jednoznačné identifikaci. Používá se také jako její zobrazovaný název.
Název experimentu To pomáhá organizovat úlohu v studio Azure Machine Learning. Záznam spuštění každé úlohy je uspořádaný pod odpovídajícím experimentem na kartě Experiment studia. Azure ve výchozím nastavení umístí úlohu do výchozího experimentu.
Popis V případě potřeby přidejte nějaký text popisující vaši úlohu.
Timeout Zadejte počet hodin, po které může běžet celá trénovací úloha. Po dosažení tohoto limitu systém zruší úlohu včetně všech podřízených úloh.
Značky Přidejte do své úlohy značky, které vám pomůžou s organizací.

Trénovací skript

Dalším krokem je nahrání zdrojového kódu, konfigurace všech vstupů nebo výstupů potřebných ke spuštění trénovací úlohy a zadání příkazu pro spuštění trénovacího skriptu.

Může se jednat o soubor kódu nebo složku z výchozího úložiště objektů blob místního počítače nebo pracovního prostoru. Po výběru se v Azure zobrazí soubory, které se mají nahrát.

Pole Popis
Kód Může to být soubor nebo složka z místního počítače nebo výchozího úložiště objektů blob pracovního prostoru jako trénovací skript. Studio po provedení výběru zobrazí soubory, které se mají nahrát.
Vstupy Zadejte libovolný počet vstupů z následujících typů dat, celé číslo, číslo, logická hodnota, řetězec).
Příkaz Příkaz, který se má provést. Argumenty příkazového řádku lze explicitně zapsat do příkazu nebo odvodit z jiných oddílů, konkrétně vstupy pomocí zápisu složených závorek, jak je popsáno v další části.

Kód

Příkaz se spustí z kořenového adresáře nahrané složky kódu. Po výběru souboru nebo složky kódu uvidíte soubory, které se mají nahrát. Zkopírujte relativní cestu k kódu obsahujícímu váš vstupní bod a vložte ji do pole s popiskem Enter a spusťte úlohu.

Pokud je kód v kořenovém adresáři, můžete ho přímo odkazovat v příkazu. Například python main.py.

Pokud se kód nenachází v kořenovém adresáři, měli byste použít relativní cestu. Například struktura jazykového modelu slova je:

.
├── job.yml
├── data
└── src
    └── main.py

Tady je zdrojový kód v src podadresáři. Příkaz by byl python ./src/main.py (plus další argumenty příkazového řádku).

Obrázek odkazu na kód v příkazu ve formuláři pro odeslání trénovací úlohy

Vstupy

Pokud v příkazu použijete vstup, musíte zadat název vstupu. Chcete-li označit vstupní proměnnou, použijte formulář ${{inputs.input_name}}. Například ${{inputs.wiki}}. Pak na něj můžete odkazovat například --data ${{inputs.wiki}}v příkazu .

Obrázek odkazu na vstupy v příkazu ve formuláři pro odeslání trénovací úlohy

Výběr výpočetních prostředků

Dalším krokem je výběr cílového výpočetního objektu, na kterém chcete úlohu spustit. Uživatelské rozhraní pro vytváření úloh podporuje několik typů výpočetních prostředků:

Typ výpočetních prostředků Úvod
Výpočetní instance Co je výpočetní instance služby Azure Machine Learning?
Výpočtový cluster Co je výpočetní cluster?
Připojené výpočetní prostředky (cluster Kubernetes) Konfigurace a připojení clusteru Kubernetes kdekoli (Preview)
  1. Výběr typu výpočetních prostředků
  2. Vyberte existující výpočetní prostředek. V rozevíracím seznamu se zobrazí informace o uzlu a typ skladové položky, které vám pomůžou vybrat.
  3. U výpočetního clusteru nebo clusteru Kubernetes můžete také určit, kolik uzlů chcete pro úlohu zadat v počtu instancí. Výchozí počet instancí je 1.
  4. Až budete s volbami spokojeni, zvolte Další. Vyberte image selektoru výpočetního clusteru.

Pokud azure Machine Learning používáte poprvé, zobrazí se prázdný seznam a odkaz pro vytvoření nového výpočetního prostředí. Další informace o vytváření různých typů najdete v tématech:

Typ výpočetních prostředků Návod
Výpočetní instance Vytvoření výpočetní instance služby Azure Machine Learning
Výpočtový cluster Vytvoření výpočetního clusteru Azure Machine Learning
Připojený cluster Kubernetes Připojení clusteru Kubernetes s podporou Azure Arc

Určení nezbytného prostředí

Po výběru cílového výpočetního objektu je nutné zadat prostředí runtime pro vaši úlohu. Uživatelské rozhraní pro vytváření úloh podporuje tři typy prostředí:

  • Kurátorovaná prostředí
  • Vlastní prostředí
  • Image registru kontejneru

Kurátorovaná prostředí

Kurátorovaná prostředí jsou kolekce balíčků Pythonu definované v Azure, které se používají v běžných úlohách ML. Kurátorovaná prostředí jsou ve výchozím nastavení dostupná ve vašem pracovním prostoru. Tato prostředí jsou podporována imagemi Dockeru uloženými v mezipaměti, což snižuje režii na přípravu úloh. Karty zobrazené na stránce Kurátorovaná prostředí zobrazují podrobnosti o jednotlivých prostředích. Další informace najdete v kurátorovaných prostředích ve službě Azure Machine Learning.

Obrázek stránky selektoru kurátorovaných prostředí zobrazující různé karty prostředí

Vlastní prostředí

Vlastní prostředí jsou prostředí, která jste zadali sami. Můžete zadat prostředí nebo znovu použít prostředí, které jste už vytvořili. Další informace najdete v tématu Správa softwarových prostředí v studio Azure Machine Learning (Preview).

Image registru kontejneru

Pokud nechcete používat kurátorovaná prostředí Azure Machine Learning nebo zadat vlastní prostředí, můžete použít image Dockeru z veřejného registru kontejneru, jako je Docker Hub.

Kontrola a vytvoření

Jakmile úlohu nakonfigurujete, zvolte Další a přejděte na stránku Revize . Pokud chcete změnit nastavení, zvolte ikonu tužky a proveďte změnu. studio Azure Machine Learning obrázek podokna kontroly odeslání úlohy k ověření výběrů před odesláním.

Pokud chcete úlohu spustit, zvolte Odeslat trénovací úlohu. Po vytvoření úlohy se v Azure zobrazí stránka s podrobnostmi o úloze, kde můžete monitorovat a spravovat trénovací úlohu.

Jak nakonfigurovat e-maily v sadě Studio

Pokud chcete začít přijímat e-maily po dokončení úlohy, online koncového bodu nebo dávkového koncového bodu nebo v případě, že došlo k problému (selhání, zrušení), postupujte následovně:

  1. V nástroji Azure ML Studio přejděte na nastavení výběrem ikony ozubeného kola.
  2. Vyberte kartu E-mailová oznámení.
  3. Přepnutím povolíte nebo zakážete e-mailová oznámení pro konkrétní událost.

Snímek obrazovky s nastavením nástroje Azure ML Studio na kartě e-mailových oznámení

Další kroky