Nastavení trénování autoML bez kódu pomocí uživatelského rozhraní studia

V tomto článku se dozvíte, jak nastavit trénovací úlohy AutoML bez jediného řádku kódu pomocí automatizovaného strojového učení Azure Machine Learning v studio Azure Machine Learning.

Automatizované strojové učení, AutoML, je proces, ve kterém je vybraný nejlepší algoritmus strojového učení pro vaše konkrétní data. Tento proces umožňuje rychle generovat modely strojového učení. Přečtěte si další informace o tom, jak Azure Machine Learning implementuje automatizované strojové učení.

Pro kompletní příklad vyzkoušejte kurz: AutoML – trénování modelů klasifikace bez kódu.

V případě prostředí založeného na kódu Pythonu nakonfigurujte experimenty automatizovaného strojového učení pomocí sady Azure Machine Learning SDK.

Požadavky

Začínáme

  1. Přihlaste se k studio Azure Machine Learning.

  2. Vyberte své předplatné a pracovní prostor.

  3. Přejděte do levého podokna. V části Autor vyberte Automatizované strojové učení.

navigační podokno studio Azure Machine Learning

Pokud experimenty provádíte poprvé, zobrazí se prázdný seznam a odkazy na dokumentaci.

V opačném případě se zobrazí seznam nedávných experimentů automatizovaného strojového učení, včetně experimentů vytvořených pomocí sady SDK.

Vytvoření a spuštění experimentu

  1. Vyberte + Nová automatizovaná úloha ML a vyplňte formulář.

  2. Vyberte datový prostředek z kontejneru úložiště nebo vytvořte nový datový prostředek. Datový prostředek je možné vytvořit z místních souborů, webových adres URL, úložišť dat nebo otevřených datových sad Azure. Přečtěte si další informace o vytváření datových assetů.

    Důležité

    Požadavky na trénovací data:

    • Data musí být v tabulkové podobě.
    • Hodnota, kterou chcete předpovědět (cílový sloupec), musí být v datech.
    1. Pokud chcete vytvořit novou datovou sadu ze souboru v místním počítači, vyberte +Vytvořit datovou sadu a pak vyberte Z místního souboru.

    2. Ve formuláři Základní informace dejte datové sadě jedinečný název a zadejte volitelný popis.

    3. Výběrem možnosti Další otevřete formulář pro výběr dat a úložiště souborů. V tomto formuláři vyberete, kam se má datová sada nahrát; výchozí kontejner úložiště, který se automaticky vytvoří v pracovním prostoru, nebo zvolte kontejner úložiště, který chcete pro experiment použít.

      1. Pokud jsou vaše data za virtuální sítí, musíte funkci ověření přeskočit , abyste měli jistotu, že pracovní prostor bude mít přístup k vašim datům. Další informace najdete v tématu Použití studio Azure Machine Learning ve virtuální síti Azure.
    4. Výběrem možnosti Procházet nahrajte datový soubor pro datovou sadu.

    5. Zkontrolujte přesnost formuláře Nastavení a náhled . Formulář je inteligentně vyplněný na základě typu souboru.

      Pole Description
      Formát souboru Definuje rozložení a typ dat uložených v souboru.
      Oddělovač Jeden nebo více znaků pro určení hranice mezi samostatnými, nezávislými oblastmi ve formátu prostého textu nebo jinými datovými proudy.
      Encoding Určuje, jaký bit tabulky schématu znaků se má použít ke čtení datové sady.
      Záhlaví sloupců Označuje, jak se budou zacházet s hlavičkami datové sady( pokud existuje).
      Přeskočit řádky Určuje, kolik řádků se v datové sadě přeskočí, pokud existuje.

      Vyberte Další.

    6. Formulář Schéma je inteligentně vyplněný na základě výběrů ve formuláři Nastavení a náhledu . Tady nakonfigurujte datový typ pro každý sloupec, zkontrolujte názvy sloupců a vyberte sloupce, které se mají pro experiment zahrnout .

      Vyberte Další.

    7. Formulář Potvrzení podrobností je souhrn informací, které byly dříve vyplněny ve formulářích Základní informace a Nastavení a Náhled . Můžete také vytvořit profil dat pro datovou sadu pomocí výpočetních prostředků s povolenou profilací. Přečtěte si další informace o profilaci dat.

      Vyberte Další.

  3. Jakmile se zobrazí, vyberte nově vytvořenou datovou sadu. Můžete také zobrazit náhled datové sady a ukázkové statistiky.

  4. Ve formuláři Konfigurovat úlohu vyberte Vytvořit nový a jako název experimentu zadejte Tutorial-automl-deploy .

  5. Vyberte cílový sloupec; toto je sloupec, u kterého chcete provádět předpovědi.

  6. Vyberte výpočetní typ pro profilaci dat a trénovací úlohu. Můžete vybrat výpočetní cluster nebo výpočetní instanci.

  7. V rozevíracím seznamu existujících výpočetních prostředků vyberte výpočetní prostředky. Pokud chcete vytvořit nový výpočetní výkon, postupujte podle pokynů v kroku 8.

  8. Vyberte Vytvořit nový výpočetní objekt , abyste pro tento experiment nakonfigurovali výpočetní kontext.

    Pole Description
    Název výpočetních prostředků Zadejte jedinečný název, který identifikuje váš výpočetní kontext.
    Priorita virtuálního počítače Virtuální počítače s nízkou prioritou jsou levnější, ale nezaručují výpočetní uzly.
    Typ virtuálního počítače Vyberte procesor nebo GPU pro typ virtuálního počítače.
    Velikost virtuálního počítače Vyberte velikost virtuálního počítače pro výpočetní prostředky.
    Minimální nebo maximální počet uzlů Pokud chcete profilovat data, musíte zadat 1 nebo více uzlů. Zadejte maximální počet uzlů pro výpočetní prostředky. Výchozí hodnota je 6 uzlů pro službu AzureML Compute.
    Rozšířená nastavení Tato nastavení umožňují nakonfigurovat uživatelský účet a existující virtuální síť pro experiment.

    Vyberte Vytvořit. Vytvoření nového výpočetního prostředí může trvat několik minut.

    Poznámka

    Název výpočetních prostředků bude indikovat, jestli je povolené profilování výpočetních prostředků, které vyberete nebo vytvoříte. (Další podrobnosti najdete v profilaci dat oddílu).

    Vyberte Další.

  9. Ve formuláři Typ úkolu a nastavení vyberte typ úkolu: klasifikaci, regresi nebo prognózu. Další informace najdete v podporovaných typech úloh .

    1. Pro klasifikaci můžete také povolit hluboké učení.

      Pokud je povolené hluboké učení, ověřování je omezené na train_validation rozdělení. Přečtěte si další informace o možnostech ověřování.

    2. Pro prognózování můžete:

      1. Povolte hluboké učení.

      2. Vybrat sloupec času: Tento sloupec obsahuje časová data, která se mají použít.

      3. Vybrat horizont prognózy: Udává, kolik časových jednotek (minuty, hodiny, dny, týdny, měsíce a roky) bude model schopen předpovědět v budoucnu. Čím dál je model nutný k predikci do budoucnosti, tím méně přesný se stane. Přečtěte si další informace o prognózování a horizontu prognóz.

  10. (Volitelné) Zobrazit nastavení konfigurace přidání: Další nastavení, která můžete použít k lepšímu řízení trénovací úlohy. V opačném případě se výchozí hodnoty použijí na základě výběru experimentu a dat.

    Další konfigurace Description
    Primární metrika Hlavní metrika použitá pro vyhodnocování modelu Přečtěte si další informace o metrikách modelu.
    Vysvětlit nejlepší model Pokud chcete zobrazit vysvětlení doporučeného nejlepšího modelu, vyberte možnost povolit nebo zakázat.
    Tato funkce není v současné době dostupná pro určité algoritmy prognózování.
    Blokovaný algoritmus Vyberte algoritmy, které chcete vyloučit z trénovací úlohy.

    Povolení algoritmů je dostupné jenom pro experimenty se sadou SDK.
    Podívejte se na podporované algoritmy pro každý typ úlohy.
    Kritérium ukončení Pokud jsou splněna některá z těchto kritérií, úloha trénování se zastaví.
    Doba trénování (hodiny): Jak dlouho se má trénovací úloha spouštět.
    Prahová hodnota skóre metriky: Minimální skóre metrik pro všechny kanály Tím zajistíte, že pokud máte definovanou cílovou metriku, kterou chcete dosáhnout, neutratíte více času na trénovací úloze, než je potřeba.
    Souběžnost Maximální počet souběžných iterací: Maximální počet kanálů (iterace) pro testování v trénovací úloze. Úloha nebude spouštět více než zadaný počet iterací. Přečtěte si další informace o tom, jak automatizované strojové učení provádí v clusterech několik podřízených úloh.
  11. (Volitelné) Zobrazit nastavení featurizace: Pokud se rozhodnete povolit automatickou funkci ve formuláři Další nastavení konfigurace, použijí se výchozí techniky featurizace. V nastavení zobrazení featurizace můžete tyto výchozí hodnoty změnit a odpovídajícím způsobem přizpůsobit. Zjistěte, jak přizpůsobit featurizace.

    Snímek obrazovky s dialogovým oknem Vybrat typ úlohy s označeným nastavením zobrazení featurizace

  12. Formulář [Volitelné] Ověření a testování vám umožní provést následující akce.

    1. Zadejte typ ověření, který se má použít pro vaši trénovací úlohu. Přečtěte si další informace o křížové ověřování.

      1. Úlohy prognózování podporují pouze křížové ověřování k-fold.
    2. Zadejte testovací datovou sadu (Preview) pro vyhodnocení doporučeného modelu, který pro vás automatizované strojové učení generuje na konci experimentu. Při zadání testovacích dat se testovací úloha automaticky aktivuje na konci experimentu. Tato testovací úloha je určená pouze pro nejlepší model, který doporučil automatizované strojové učení. Zjistěte, jak získat výsledky úlohy vzdáleného testu.

      Důležité

      Poskytnutí testovací datové sady pro vyhodnocení vygenerovaných modelů je funkce Preview. Tato funkce je experimentální funkce Preview a může se kdykoli změnit.

      • Testovací data jsou považována za samostatnou od trénování a ověřování, aby nedošlo k předsudkům výsledků testovací úlohy doporučeného modelu. Přečtěte si další informace o předsudkech během ověřování modelu.
      • Můžete zadat vlastní testovací datovou sadu nebo zvolit procento trénovací datové sady. Testovací data musí být ve formě tabulkové sady Azure Machine LearningDataset.
      • Schéma testovací datové sady by mělo odpovídat trénovací datové sadě. Cílový sloupec je volitelný, ale pokud žádný cílový sloupec není označený jako žádný testovací metrika, nevypočítává se.
      • Testovací datová sada by neměla být stejná jako trénovací datová sada nebo ověřovací datová sada.
      • Úlohy prognózování nepodporují rozdělení trénování a testování.

      Snímek obrazovky znázorňující formulář, kde vybrat ověřovací data a testovací data

Přizpůsobení featurizace

Ve formuláři Featurization můžete povolit nebo zakázat automatickou featuraci a přizpůsobit nastavení automatického featurizace experimentu. Pokud chcete tento formulář otevřít, přečtěte si krok 10 v části Vytvoření a spuštění experimentu .

Následující tabulka shrnuje aktuálně dostupné přizpůsobení prostřednictvím studia.

Sloupec Přizpůsobení
Zahrnuje Určuje sloupce, které se mají zahrnout pro trénování.
Typ funkce Změňte typ hodnoty vybraného sloupce.
Impute s Vyberte, jakou hodnotu chcete přičítat chybějícím hodnotám v datech.

studio Azure Machine Learning vlastní featurace

Spuštění experimentu a zobrazení výsledků

Vyberte Dokončit a spusťte experiment. Proces přípravy experimentu může trvat až 10 minut. U každého kanálu může další 2 až 3 minuty trvat, než se dokončí úlohy trénování.

Poznámka

Algoritmy automatizovaného strojového učení mají vlastní náhodnost, která může způsobit mírné variace konečného skóre metrik doporučeného modelu, například přesnost. Automatizované strojové učení také provádí operace s daty, jako je rozdělení trénování, rozdělení ověření trénování nebo křížové ověření v případě potřeby. Pokud tedy spustíte experiment se stejným nastavením konfigurace a primární metrikou vícekrát, pravděpodobně se v každém experimentu zobrazí konečné skóre metriky.

Zobrazení podrobností o experimentu

Otevře se obrazovka Podrobnosti úlohy na kartě Podrobnosti . Na této obrazovce se zobrazí souhrn úlohy experimentu včetně stavového řádku v horní části vedle čísla úlohy.

Na kartě Modely je seznam vytvořených modelů seřazený podle skóre metriky. Ve výchozím nastavení se na prvním místě seznamu zobrazí model, který na základě zvolené metriky získá nejvyšší skóre. Když trénovací úloha vyzkouší další modely, přidají se do seznamu. Tady můžete rychle porovnat metriky pro zatím vytvořené modely.

Podrobnosti úlohy

Zobrazení podrobností o trénovací úloze

Přejděte k podrobnostem o některém z dokončených modelů a zobrazte podrobnosti o trénovací úloze. Na kartě Model se zobrazí podrobnosti, jako je souhrn modelu a hyperparametry použité pro vybraný model.

Podrobnosti o hyperparametrech

Můžete také zobrazit grafy metrik výkonu specifické pro model na kartě Metriky. Další informace o grafech

Podrobnosti iterace

Na kartě Transformace dat můžete zobrazit diagram toho, jaká data předzpracovává, inženýrská funkce, techniky škálování a algoritmus strojového učení použitý k vygenerování tohoto modelu.

Důležité

Karta Transformace dat je ve verzi Preview. Tato schopnost by měla být považována za experimentální a kdykoli se může změnit.

Transformace dat

Zobrazení výsledků úlohy vzdáleného testu (Preview)

Pokud jste zadali testovací datovou sadu nebo jste se rozhodli pro rozdělení trénování a testování během nastavení experimentu– ve formuláři Ověření a testování , automatizované strojové učení automaticky testuje doporučený model ve výchozím nastavení. V důsledku toho automatizované strojové učení vypočítá testovací metriky a určí kvalitu doporučeného modelu a jeho predikce.

Důležité

Testování modelů pomocí testovací datové sady pro vyhodnocení vygenerovaných modelů je funkce Preview. Tato funkce je experimentální funkce Preview a může se kdykoli změnit.

Pokud chcete zobrazit metriky testovací úlohy doporučeného modelu,

  1. Přejděte na stránku Modely a vyberte nejlepší model.
  2. Vyberte kartu Výsledky testu (Preview).
  3. Vyberte požadovanou úlohu a zobrazte kartu Metriky . Karta Výsledky testů automaticky otestovaného doporučeného modelu

Zobrazení předpovědí testů používaných k výpočtu testovacích metrik:

  1. Přejděte do dolní části stránky a výběrem odkazu v části Výstupní datová sada otevřete datovou sadu.
  2. Na stránce Datové sady vyberte kartu Prozkoumat a zobrazte předpovědi z testovací úlohy.
    1. Případně můžete soubor predikce zobrazit nebo stáhnout z karty Výstupy + protokoly , rozbalte složku Predikce a vyhledejte soubor predicted.csv .

Soubor predikcí lze také zobrazit nebo stáhnout z karty Výstupy + protokoly, rozbalte složku Predikce a vyhledejte predictions.csv soubor.

Testovací úloha modelu vygeneruje soubor predictions.csv, který je uložený ve výchozím úložišti dat vytvořeným s pracovním prostorem. Toto úložiště dat je viditelné pro všechny uživatele se stejným předplatným. Testovací úlohy se nedoporučuje pro scénáře, pokud některé z informací použitých pro testovací úlohu nebo vytvořené testovací úlohou musí zůstat soukromé.

Testování existujícího automatizovaného modelu ML (Preview)

Důležité

Testování modelů pomocí testovací datové sady pro vyhodnocení vygenerovaných modelů je funkce Preview. Tato funkce je experimentální funkce Preview a může se kdykoli změnit.

Po dokončení experimentu můžete otestovat modely, které pro vás automatizované strojové učení generuje. Pokud chcete otestovat jiný automatizovaný model strojového učení, nikoli doporučený model, můžete to provést pomocí následujících kroků.

  1. Vyberte existující automatizovanou úlohu experimentu ML.

  2. Přejděte na kartu Modely úlohy a vyberte dokončený model, který chcete otestovat.

  3. Na stránce Podrobnosti modelu vyberte tlačítko Test model(Preview) a otevřete podokno Testovací model .

  4. V podokně Testovací model vyberte výpočetní cluster a testovací datovou sadu, kterou chcete použít pro testovací úlohu.

  5. Klikněte na tlačítko Testovat. Schéma testovací datové sady by mělo odpovídat trénovací datové sadě, ale cílový sloupec je volitelný.

  6. Po úspěšném vytvoření testovací úlohy modelu se na stránce Podrobnosti zobrazí zpráva o úspěchu. Výběrem karty Výsledky testu zobrazíte průběh úlohy.

  7. Pokud chcete zobrazit výsledky testovací úlohy, otevřete stránku Podrobnosti a postupujte podle kroků v části Zobrazení výsledků úlohy vzdáleného testu .

    Formulář testovacího modelu

Vysvětlení modelů (Preview)

Pokud chcete lépe porozumět vašemu modelu, můžete zjistit, které datové funkce (nezpracované nebo inženýrované) ovlivnily předpovědi modelu pomocí řídicího panelu vysvětlení modelu.

Řídicí panel vysvětlení modelu poskytuje celkovou analýzu vytrénovaného modelu spolu s jeho predikcemi a vysvětleními. Umožňuje také přejít k podrobnostem o jednotlivých datových bodech a jeho důležitosti jednotlivých funkcí. Přečtěte si další informace o vizualizacích řídicích panelů vysvětlení.

Vysvětlení konkrétního modelu

  1. Na kartě Modely vyberte model, který chcete pochopit.

  2. Vyberte tlačítko Vysvětlit model a zadejte výpočetní prostředky, které lze použít k vygenerování vysvětlení.

  3. Zkontrolujte stav na kartě Podřízené úlohy .

  4. Po dokončení přejděte na kartu Vysvětlení (Preview), která obsahuje řídicí panel vysvětlení.

    Řídicí panel vysvětlení modelu

Úpravy a odesílání úloh (Preview)

Důležité

Možnost kopírovat, upravovat a odesílat nový experiment na základě existujícího experimentu je funkce preview. Tato funkce je experimentální funkce Preview a může se kdykoli změnit.

Ve scénářích, ve kterých byste chtěli vytvořit nový experiment na základě nastavení existujícího experimentu, nabízí automatizované strojové učení možnost provést pomocí tlačítka Upravit a odeslat v uživatelském rozhraní studia.

Tato funkce je omezená na experimenty zahájené z uživatelského rozhraní studia a vyžaduje schéma dat pro nový experiment tak, aby odpovídalo původnímu experimentu.

Tlačítko Upravit a odeslat otevře průvodce vytvořením nové úlohy automatizovaného strojového učení s předem vyplněnými daty, výpočetními prostředky a nastavením experimentu. Jednotlivé formuláře můžete procházet a podle potřeby upravovat výběry pro nový experiment.

Nasazení modelu

Jakmile budete mít nejlepší model, je čas ho nasadit jako webovou službu, která bude vytvářet předpovědi na základě nových dat.

Tip

Pokud chcete nasadit model vygenerovaný prostřednictvím automl balíčku pomocí sady Python SDK, musíte ho zaregistrovat do pracovního prostoru.

Jakmile je model zaregistrovaný, vyhledejte ho v studiu výběrem modelů v levém podokně. Po otevření modelu můžete v horní části obrazovky vybrat tlačítko Nasadit a postupovat podle pokynů popsaných v kroku 2 části Nasazení modelu .

Automatizované strojové učení pomáhá s nasazením modelu bez psaní kódu:

  1. Máte několik možností nasazení.

    • Možnost 1: Nasaďte nejlepší model podle vámi definovaných kritérií metrik.

      1. Po dokončení experimentu přejděte na stránku nadřazené úlohy výběrem úlohy 1 v horní části obrazovky.
      2. Vyberte model uvedený v části Nejlepší souhrn modelu .
      3. V levém horním rohu okna vyberte Nasadit .
    • Možnost 2: Pokud chcete nasadit konkrétní iteraci modelu z tohoto experimentu.

      1. Na kartě Modely vyberte požadovaný model.
      2. V levém horním rohu okna vyberte Nasadit .
  2. Vyplňte podokno Nasadit model .

    Pole Hodnota
    Název Zadejte jedinečný název nasazení.
    Description Zadejte popis, abyste lépe identifikovali, k čemu toto nasazení slouží.
    Typ výpočetních prostředků Vyberte typ koncového bodu, který chcete nasadit: Azure Kubernetes Service (AKS) nebo Azure Container Instance (ACI).
    Název výpočetních prostředků Platí jenom pro AKS: Vyberte název clusteru AKS, do kterého chcete nasadit.
    Povolit ověřování Vyberte, pokud chcete povolit ověřování založené na tokenech nebo klíčích.
    Použití vlastních prostředků nasazení Tuto funkci povolte, pokud chcete nahrát vlastní soubor s hodnocením a skriptem prostředí. V opačném případě automatizované strojové učení poskytuje tyto prostředky ve výchozím nastavení. Další informace o hodnoticích skriptech

    Důležité

    Názvy souborů musí být pod 32 znaky a musí začínat a končit alfanumerickými znaky. Jinak můžou obsahovat pomlčky, podtržítka, tečky a alfanumerické znaky. Mezery nejsou povolené.

    Nabídka Upřesnit nabízí výchozí funkce nasazení, jako jsou nastavení shromažďování dat nebo využití prostředků. Pokud chcete tato výchozí nastavení přepsat, můžete to udělat v této nabídce.

  3. Vyberte Nasadit. Dokončení nasazení může trvat přibližně 20 minut. Po zahájení nasazení se zobrazí karta Shrnutí modelu. Průběh nasazení můžete sledovat v části Stav nasazení.

Teď máte funkční webovou službu pro generování předpovědí. Předpovědi můžete otestovat dotazováním služby s využitím integrované podpory služby Azure Machine Learning v Power BI.

Další kroky