Odeslání trénovací úlohy v sadě Studio
Trénovací úlohu ve službě Azure Machine Learning je možné vytvořit mnoha způsoby. Můžete použít rozhraní příkazového řádku (viz trénování modelů (vytváření úloh)), rozhraní REST API (viz trénování modelů pomocí REST (Preview)) nebo můžete pomocí uživatelského rozhraní přímo vytvořit trénovací úlohu. V tomto článku se dozvíte, jak pomocí vlastních dat a kódu vytrénovat model strojového učení s asistencí pro odesílání trénovacích úloh v studio Azure Machine Learning.
Důležité
Tato funkce je v současné době ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti.
Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.
Požadavky
Předplatné Azure. Pokud ještě nemáte předplatné Azure, vytvořte si napřed bezplatný účet. Vyzkoušejte si bezplatnou nebo placenou verzi služby Azure Machine Learning ještě dnes.
Pracovní prostor služby Azure Machine Learning. Viz Vytvoření prostředků pracovního prostoru.
Vysvětlení toho, co je úloha ve službě Azure Machine Learning Podívejte se, jak trénovat modely.
Začínáme
Přihlaste se k studio Azure Machine Learning.
Vyberte své předplatné a pracovní prostor.
- Uživatelské rozhraní pro vytváření úloh můžete zadat z domovské stránky. Vyberte Vytvořit nový a vyberte Úloha.
V tomto kroku můžete vybrat metodu trénování, dokončit zbytek formuláře pro odeslání na základě vašeho výběru a odeslat trénovací úlohu. Níže si projdeme formulář s postupem spuštění vlastního skriptu (úloha příkazu).
Konfigurace základního nastavení
Prvním krokem je konfigurace základních informací o vaší trénovací úloze. Můžete pokračovat dál, pokud jste s výchozími nastaveními, které jsme pro vás zvolili, nebo proveďte změny požadované předvolby.
K dispozici jsou tato pole:
Pole | Popis |
---|---|
Název úlohy | Pole pro název úlohy se používá k její jednoznačné identifikaci. Používá se také jako její zobrazovaný název. |
Název experimentu | To pomáhá organizovat úlohu v studio Azure Machine Learning. Záznam spuštění každé úlohy je uspořádaný pod odpovídajícím experimentem na kartě Experiment studia. Azure ve výchozím nastavení umístí úlohu do výchozího experimentu. |
Popis | V případě potřeby přidejte nějaký text popisující vaši úlohu. |
Timeout | Zadejte počet hodin, po které může běžet celá trénovací úloha. Po dosažení tohoto limitu systém zruší úlohu včetně všech podřízených úloh. |
Značky | Přidejte do své úlohy značky, které vám pomůžou s organizací. |
Trénovací skript
Dalším krokem je nahrání zdrojového kódu, konfigurace všech vstupů nebo výstupů potřebných ke spuštění trénovací úlohy a zadání příkazu pro spuštění trénovacího skriptu.
Může se jednat o soubor kódu nebo složku z výchozího úložiště objektů blob místního počítače nebo pracovního prostoru. Po výběru se v Azure zobrazí soubory, které se mají nahrát.
Pole | Popis |
---|---|
Kód | Může to být soubor nebo složka z místního počítače nebo výchozího úložiště objektů blob pracovního prostoru jako trénovací skript. Studio po provedení výběru zobrazí soubory, které se mají nahrát. |
Vstupy | Zadejte libovolný počet vstupů z následujících typů dat, celé číslo, číslo, logická hodnota, řetězec). |
Příkaz | Příkaz, který se má provést. Argumenty příkazového řádku lze explicitně zapsat do příkazu nebo odvodit z jiných oddílů, konkrétně vstupy pomocí zápisu složených závorek, jak je popsáno v další části. |
Kód
Příkaz se spustí z kořenového adresáře nahrané složky kódu. Po výběru souboru nebo složky kódu uvidíte soubory, které se mají nahrát. Zkopírujte relativní cestu k kódu obsahujícímu váš vstupní bod a vložte ji do pole s popiskem Enter a spusťte úlohu.
Pokud je kód v kořenovém adresáři, můžete ho přímo odkazovat v příkazu. Například python main.py
.
Pokud se kód nenachází v kořenovém adresáři, měli byste použít relativní cestu. Například struktura jazykového modelu slova je:
.
├── job.yml
├── data
└── src
└── main.py
Tady je zdrojový kód v src
podadresáři. Příkaz by byl python ./src/main.py
(plus další argumenty příkazového řádku).
Vstupy
Pokud v příkazu použijete vstup, musíte zadat název vstupu. Chcete-li označit vstupní proměnnou, použijte formulář ${{inputs.input_name}}
. Například ${{inputs.wiki}}
. Pak na něj můžete odkazovat například --data ${{inputs.wiki}}
v příkazu .
Výběr výpočetních prostředků
Dalším krokem je výběr cílového výpočetního objektu, na kterém chcete úlohu spustit. Uživatelské rozhraní pro vytváření úloh podporuje několik typů výpočetních prostředků:
Typ výpočetních prostředků | Úvod |
---|---|
Výpočetní instance | Co je výpočetní instance služby Azure Machine Learning? |
Výpočtový cluster | Co je výpočetní cluster? |
Připojené výpočetní prostředky (cluster Kubernetes) | Konfigurace a připojení clusteru Kubernetes kdekoli (Preview) |
- Výběr typu výpočetních prostředků
- Vyberte existující výpočetní prostředek. V rozevíracím seznamu se zobrazí informace o uzlu a typ skladové položky, které vám pomůžou vybrat.
- U výpočetního clusteru nebo clusteru Kubernetes můžete také určit, kolik uzlů chcete pro úlohu zadat v počtu instancí. Výchozí počet instancí je 1.
- Až budete s volbami spokojeni, zvolte Další.
Pokud azure Machine Learning používáte poprvé, zobrazí se prázdný seznam a odkaz pro vytvoření nového výpočetního prostředí. Další informace o vytváření různých typů najdete v tématech:
Typ výpočetních prostředků | Návod |
---|---|
Výpočetní instance | Vytvoření výpočetní instance služby Azure Machine Learning |
Výpočtový cluster | Vytvoření výpočetního clusteru Azure Machine Learning |
Připojený cluster Kubernetes | Připojení clusteru Kubernetes s podporou Azure Arc |
Určení nezbytného prostředí
Po výběru cílového výpočetního objektu je nutné zadat prostředí runtime pro vaši úlohu. Uživatelské rozhraní pro vytváření úloh podporuje tři typy prostředí:
- Kurátorovaná prostředí
- Vlastní prostředí
- Image registru kontejneru
Kurátorovaná prostředí
Kurátorovaná prostředí jsou kolekce balíčků Pythonu definované v Azure, které se používají v běžných úlohách ML. Kurátorovaná prostředí jsou ve výchozím nastavení dostupná ve vašem pracovním prostoru. Tato prostředí jsou podporována imagemi Dockeru uloženými v mezipaměti, což snižuje režii na přípravu úloh. Karty zobrazené na stránce Kurátorovaná prostředí zobrazují podrobnosti o jednotlivých prostředích. Další informace najdete v kurátorovaných prostředích ve službě Azure Machine Learning.
Vlastní prostředí
Vlastní prostředí jsou prostředí, která jste zadali sami. Můžete zadat prostředí nebo znovu použít prostředí, které jste už vytvořili. Další informace najdete v tématu Správa softwarových prostředí v studio Azure Machine Learning (Preview).
Image registru kontejneru
Pokud nechcete používat kurátorovaná prostředí Azure Machine Learning nebo zadat vlastní prostředí, můžete použít image Dockeru z veřejného registru kontejneru, jako je Docker Hub.
Kontrola a vytvoření
Jakmile úlohu nakonfigurujete, zvolte Další a přejděte na stránku Revize . Pokud chcete změnit nastavení, zvolte ikonu tužky a proveďte změnu.
Pokud chcete úlohu spustit, zvolte Odeslat trénovací úlohu. Po vytvoření úlohy se v Azure zobrazí stránka s podrobnostmi o úloze, kde můžete monitorovat a spravovat trénovací úlohu.
Jak nakonfigurovat e-maily v sadě Studio
Pokud chcete začít přijímat e-maily po dokončení úlohy, online koncového bodu nebo dávkového koncového bodu nebo v případě, že došlo k problému (selhání, zrušení), postupujte následovně:
- V nástroji Azure ML Studio přejděte na nastavení výběrem ikony ozubeného kola.
- Vyberte kartu E-mailová oznámení.
- Přepnutím povolíte nebo zakážete e-mailová oznámení pro konkrétní událost.