Kurz: Návrhář – trénování regresního modelu bez kódu
Trénujte model lineární regrese, který predikuje ceny aut pomocí návrháře služby Azure Machine Learning. Tento kurz je první částí z dvoudílné série.
Tento kurz používá návrháře služby Azure Machine Learning, kde najdete další informace v tématu Co je návrhář služby Azure Machine Learning?
V první části kurzu se naučíte:
- Vytvořte nový kanál.
- Import dat
- Příprava dat
- Trénování modelu strojového učení
- Vyhodnocení modelu strojového učení
Ve druhé části kurzu nasadíte model jako koncový bod odvozování v reálném čase, abyste předpověděli cenu libovolného vozu na základě technických specifikací, které ho odešlete.
Poznámka
Dokončená verze tohoto kurzu je k dispozici jako ukázkový kanál.
Pokud ho chcete najít, přejděte do návrháře ve vašem pracovním prostoru. V části Nový kanál vyberte Sample 1 – Regression: Automobile Price Prediction(Basic).
Důležité
Pokud se v tomto dokumentu nezobrazují grafické prvky, jako jsou tlačítka v studiu nebo návrháři, možná nemáte správnou úroveň oprávnění k pracovnímu prostoru. Obraťte se na správce předplatného Azure a ověřte, že máte udělenou správnou úroveň přístupu. Další informace najdete v tématu Správa uživatelů a rolí.
Vytvoření nového kanálu
Kanály Služby Azure Machine Learning organizují několik kroků zpracování dat a strojového učení do jednoho prostředku. Kanály umožňují uspořádat, spravovat a opakovaně používat složité pracovní postupy strojového učení napříč projekty a uživateli.
K vytvoření kanálu Azure Machine Learning potřebujete pracovní prostor Azure Machine Learning. V této části se dozvíte, jak tyto prostředky vytvořit.
Vytvoření nového pracovního prostoru
K používání návrháře potřebujete pracovní prostor Služby Azure Machine Learning. Pracovní prostor je prostředek nejvyšší úrovně pro Azure Machine Learning, který poskytuje centralizované místo pro práci se všemi artefakty, které vytvoříte ve službě Azure Machine Learning. Pokyny k vytvoření pracovního prostoru najdete v tématu Vytvoření prostředků pracovního prostoru.
Poznámka
Pokud váš pracovní prostor používá virtuální síť, musíte použít další kroky konfigurace, které musíte použít k používání návrháře. Další informace najdete v tématu Použití studio Azure Machine Learning ve virtuální síti Azure.
Vytvoření kanálu
Poznámka
Návrhář podporuje dva typy komponent, klasické předem připravené komponenty a vlastní komponenty. Tyto dva typy komponent nejsou kompatibilní.
Klasické předem připravené komponenty poskytují předem připravené komponenty pro zpracování dat a tradiční úlohy strojového učení, jako je regrese a klasifikace. Tento typ komponenty se bude dál podporovat, ale nebude mít přidané žádné nové součásti.
Vlastní komponenty umožňují poskytnout vlastní kód jako součást. Podporuje sdílení mezi pracovními prostory a bezproblémové vytváření v rozhraních studio, rozhraní příkazového řádku a sady SDK.
Tento článek se týká klasických předem připravených komponent.
Přihlaste se k ml.azure.com a vyberte pracovní prostor, se kterým chcete pracovat.
Výběr návrháře –>předem připravená verze Classic
Vyberte Vytvořit nový kanál pomocí klasických předem připravených komponent.
Klikněte na ikonu tužky vedle automaticky generovaného názvu konceptu kanálu a přejmenujte ho na Predikci cen automobilů. Název nemusí být jedinečný.
Nastavení výchozího cílového výpočetního objektu
Úlohy kanálu v cílovém výpočetním objektu, což je výpočetní prostředek připojený k vašemu pracovnímu prostoru. Jakmile vytvoříte cílový výpočetní objekt, můžete ho znovu použít pro budoucí úlohy.
Důležité
Připojené výpočetní prostředky se nepodporují, místo toho použijte výpočetní instance nebo clustery .
Pro celý kanál můžete nastavit výchozí cílový výpočetní objekt , který bude ve výchozím nastavení informovat všechny komponenty, aby používaly stejný výpočetní cíl. Cílové výpočetní objekty ale můžete zadat na základě jednotlivých modulů.
Vyberte
Nastavení napravo od plátna pro otevření podokna Nastavení
Vyberte Vytvořit výpočetní instanci Azure ML.
Pokud už máte dostupný cílový výpočetní objekt, můžete ho vybrat z rozevíracího seznamu Vybrat výpočetní instanci Azure ML a spustit tento kanál.
Zadejte název výpočetního prostředku.
Vyberte Vytvořit.
Poznámka
Vytvoření výpočetního prostředku trvá přibližně pět minut. Po vytvoření prostředku ho můžete znovu použít a přeskočit tuto dobu čekání na budoucí úlohy.
Výpočetní prostředek se při nečinnosti automaticky škáluje na nula uzlů, aby se ušetřily náklady. Když ho použijete znovu po zpoždění, může docházet k přibližně pěti minutám čekání při vertikálním navýšení kapacity.
Import dat
V návrháři je k dispozici několik ukázkových datových sad, se kterými můžete experimentovat. Pro účely tohoto kurzu použijte údaje o cenách automobilů (Raw).
Vlevo od plátna kanálu je paleta datových sad a komponent. Vyberte komponenta –>ukázková data.
Vyberte datovou sadu Automobile price data (Raw) a přetáhněte je na plátno.
Vizualizace dat
Data můžete vizualizovat, abyste porozuměli datové sadě, kterou budete používat.
Klikněte pravým tlačítkem myši na data cen automobilů (Raw) a vyberte Náhled dat.
Výběrem různých sloupců v okně dat zobrazíte informace o jednotlivých sloupcích.
Každý řádek představuje automobil a proměnné přidružené k jednotlivým automobilům se zobrazují jako sloupce. V této datové sadě je 205 řádků a 26 sloupců.
Příprava dat
Datové sady obvykle před analýzou vyžadují určité předběžné zpracování. Při kontrole datové sady jste si možná všimli některých chybějících hodnot. Tyto chybějící hodnoty musí být vyčištěny, aby model mohl správně analyzovat data.
Odebrání sloupce
Při trénování modelu musíte udělat něco o chybějících datech. V této datové sadě chybí sloupec normalizovaných ztrát mnoho hodnot, takže tento sloupec z modelu úplně vyloučíte.
V paletě datových sad a komponent vlevo od plátna klikněte na Součást a vyhledejte v komponentě Vybrat sloupce v datové sadě .
Přetáhněte komponentu Vybrat sloupce v datové sadě na plátno. Zahoďte komponentu pod komponentu datové sady.
Připojte datovou sadu Automobile Price Data (Raw) k komponentě Vybrat sloupce v datové sadě . Přetáhněte z výstupního portu datové sady, což je malý kruh v dolní části datové sady na plátně, na vstupní port Vybrat sloupce v datové sadě, což je malý kruh v horní části komponenty.
Tip
Tok dat vytvoříte prostřednictvím kanálu, když připojíte výstupní port jedné komponenty ke vstupnímu portu jiného.
Vyberte komponentu Vybrat sloupce v datové sadě .
Kliknutím na ikonu šipky v části Nastavení napravo od plátna otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Vybrat sloupce v datové sadě otevřít podokno podrobností.
Vpravo od podokna vyberte Upravit sloupec .
Rozbalte rozevírací seznam Názvy sloupců vedle položky Zahrnout a vyberte Všechny sloupce.
Vyberte tlačítko + pro přidání nového pravidla.
V rozevíracích nabídkách vyberte Vyloučit a Sloupce názvy.
Do textového pole zadejte normalizované ztráty .
V pravém dolním rohu vyberte Uložit a zavřete selektor sloupců.
V podokně Podrobností o komponentě Datové sady vyberte sloupce rozbalte Informace o uzlu.
Vyberte textové pole Komentář a zadejte Vyloučit normalizované ztráty.
Komentáře se zobrazí v grafu, které vám pomůžou uspořádat kanál.
Vyčištění chybějících dat
Vaše datová sada stále chybí hodnoty po odebrání sloupce normalizované ztráty . Zbývající chybějící data můžete odebrat pomocí komponenty Vyčistit chybějící data .
Tip
Čištění chybějících hodnot ze vstupních dat je předpokladem pro použití většiny komponent v návrháři.
V paletě datových sad a komponent vlevo od plátna klikněte na Komponenta a vyhledejte komponentu Vyčistit chybějící data .
Přetáhněte komponentu Vyčistit chybějící data na plátno kanálu. Připojte ho k komponentě Vybrat sloupce v datové sadě .
Vyberte komponentu Vyčistit chybějící data .
Kliknutím na ikonu šipky v části Nastavení napravo od plátna otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Vyčistit chybějící data otevřít podokno podrobností.
Vpravo od podokna vyberte Upravit sloupec .
V zobrazeném okně Sloupce, které chcete vyčistit , rozbalte rozevírací nabídku vedle položky Zahrnout. Vybrat, Všechny sloupce
Vyberte Uložit.
V podokně Podrobností o komponentě Vyčistit chybějící data v režimu čištění vyberte Odebrat celý řádek.
V podokně Podrobností o komponentě Vyčistit chybějící data rozbalte informace o uzlu.
Vyberte textové pole Komentář a zadejte Odebrat chybějící řádky hodnot.
Kanál by teď měl vypadat nějak takto:
Trénování modelu strojového učení
Teď, když máte k dispozici komponenty pro zpracování dat, můžete nastavit trénovací komponenty.
Protože chcete predikovat cenu, což je číslo, můžete použít regresní algoritmus. V tomto příkladu použijete lineární regresní model.
Rozdělení dat
Rozdělení dat je běžným úkolem strojového učení. Data rozdělíte do dvou samostatných datových sad. Jedna datová sada model vytrénuje a druhá otestuje, jak dobře model fungoval.
V paletě datových sad a komponent vlevo od plátna klikněte na Součást a vyhledejte komponentu Split Data .
Přetáhněte komponentu Split Data na plátno kanálu.
Připojte levý port komponenty Vyčistit chybějící data k komponentě Rozdělit data .
Důležité
Ujistěte se, že se levý výstupní port Vyčistit chybějící data připojuje k rozděleným datům. Levý port obsahuje vyčištěná data. Pravý port obsahuje zahozená data.
Vyberte komponentu Rozdělit data .
Kliknutím na ikonu šipky v části Nastavení napravo od plátna otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Rozdělit data otevřít podokno podrobností.
V podokně Podrobností o rozdělení dat nastavte zlomek řádků v první výstupní datové sadě na hodnotu 0,7.
Tato možnost rozdělí 70 procent dat na trénování modelu a 30 procent pro jeho testování. Datová sada 70 % bude přístupná přes levý výstupní port. Zbývající data budou dostupná přes správný výstupní port.
V podokně Podrobností o rozdělení dat rozbalte informace o uzlu.
Vyberte textové pole Komentář a zadejte Rozdělení datové sady na trénovací sadu (0.7) a testovací sadu (0.3).
Trénování modelu
Vytrénujte model tím, že mu poskytnete datovou sadu, která zahrnuje cenu. Algoritmus vytvoří model, který vysvětluje vztah mezi funkcemi a cenou, jak jsou prezentovány trénovacími daty.
V paletě datových sad a komponent vlevo od plátna klikněte na Komponenta a vyhledejte komponentu Lineární regrese .
Přetáhněte komponentu lineární regrese na plátno kanálu.
Na levé straně plátna v datových sadách a paletě komponent klikněte na Komponenta a vyhledejte komponentu Trénování modelu .
Přetáhněte komponentu Trénování modelu na plátno kanálu.
Připojte výstup komponenty Lineární regrese k levému vstupu komponenty Train Model .
Připojte výstup trénovacích dat (levý port) komponenty Split Data ke správnému vstupu komponenty Trénování modelu .
Důležité
Ujistěte se, že se levý výstupní port Split Data připojuje k trénování modelu. Levý port obsahuje trénovací sadu. Pravý port obsahuje testovací sadu.
Vyberte komponentu Trénování modelu .
Kliknutím na ikonu šipky v části Nastavení napravo od plátna otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Trénování modelu otevřít podokno podrobností.
Vpravo od podokna vyberte Upravit sloupec .
V zobrazeném okně sloupec Popisek rozbalte rozevírací nabídku a vyberte Názvy sloupců.
Do textového pole zadejte cenu , která určuje hodnotu, kterou bude model předpovědět.
Důležité
Ujistěte se, že název sloupce zadáte přesně. Nevyučujte cenu.
Váš kanál by měl vypadat takto:
Přidání komponenty Score Model
Jakmile model vytrénujete pomocí 70 procent dat, můžete ho použít k určení skóre dalších 30 procent, abyste viděli, jak dobře funguje model.
Na levé straně plátna v datových sadách a paletě komponent klikněte na Komponenta a vyhledejte komponentu Score Model .
Přetáhněte komponentu Score Model na plátno kanálu.
Připojte výstup komponenty Trénování modelu k levému vstupnímu portu modelu skóre. Připojte výstup testovacích dat (pravý port) komponenty Split Data ke správnému vstupnímu portu modelu skóre.
Přidání komponenty Vyhodnotit model
Pomocí komponenty Vyhodnotit model můžete vyhodnotit, jak dobře model hodnotil testovací datovou sadu.
V paletě datových sad a komponent vlevo od plátna klikněte na Komponenta a vyhledejte komponentu Vyhodnotit model .
Přetáhněte komponentu Vyhodnotit model na plátno kanálu.
Připojte výstup komponenty Score Model k levému vstupu vyhodnocení modelu.
Konečný kanál by měl vypadat přibližně takto:
Odeslání kanálu
Teď, když je váš kanál všechno nastavené, můžete odeslat úlohu kanálu pro trénování modelu strojového učení. Můžete odeslat platnou úlohu kanálu v libovolném okamžiku, která se dá použít ke kontrole změn kanálu během vývoje.
V horní části plátna vyberte Odeslat.
V dialogovém okně Nastavit úlohu kanálu vyberte Vytvořit nový.
Poznámka
Experimenty seskupují podobné úlohy kanálu dohromady. Pokud kanál spustíte několikrát, můžete pro následné úlohy vybrat stejný experiment.
Jako název nového experimentu zadejte Tutorial-CarPrices.
Vyberte Odeslat.
V levém podokně plátna se zobrazí seznam odeslání a v pravém horním rohu stránky se zobrazí oznámení. Pokud chcete přejít na stránku podrobností úlohy pro ladění, můžete vybrat odkaz na podrobnosti úlohy .
Pokud se jedná o první úlohu, může trvat až 20 minut, než se kanál dokončí. Výchozí nastavení výpočetních prostředků má minimální velikost 0 uzlů, což znamená, že návrhář musí přidělovat prostředky po nečinnosti. Opakované úlohy kanálu budou trvat méně času, protože výpočetní prostředky jsou již přiděleny. Návrhář navíc používá výsledky uložené v mezipaměti pro každou komponentu k dalšímu zlepšení efektivity.
Zobrazit popisky s skóre
Na stránce podrobností úlohy můžete zkontrolovat stav úlohy kanálu, výsledky a protokoly.
Po dokončení úlohy můžete zobrazit výsledky úlohy kanálu. Nejprve se podívejte na předpovědi generované regresním modelem.
Klikněte pravým tlačítkem myši na komponentu Skóre modelu a výběremdatové sady s skórenáhledu> zobrazte jeho výstup.
Tady vidíte predikované ceny a skutečné ceny z testovacích dat.
Vyhodnocení modelů
Pomocí modelu vyhodnocení zjistíte, jak dobře trénovaný model prováděl testovací datovou sadu.
- Klikněte pravým tlačítkem myši na komponentu Vyhodnotit model a výběremnáhledu výsledků vyhodnocenídat> zobrazte jeho výstup.
Pro váš model se zobrazují následující statistiky:
- Střední absolutní chyba (MAE):: Průměr absolutních chyb. Chyba je rozdíl mezi predikovanou hodnotou a skutečnou hodnotou.
- Základní střední kvadratická chyba (RMSE): Druhá odmocnina průměru kvadratické chyby předpovědí provedených v testovací datové sadě.
- Relativní absolutní chyba: Průměr absolutních chyb relativních k absolutnímu rozdílu mezi skutečnými hodnotami a průměrem všech skutečných hodnot
- Relativní kvadratická chyba: Průměr kvadratických chyb relativních ke kvadratickému rozdílu mezi skutečnými hodnotami a průměrem všech skutečných hodnot
- Koeficient určení: Tato statistická metrika označuje, jak dobře model odpovídá datům.
Pro každou statistiku chyb platí, že menší hodnota je lepší. Menší hodnota označuje, že predikce jsou blíže skutečným hodnotám. U koeficientu určení je čím blíž k jedné hodnotě (1,0), tím lepší je predikce.
Vyčištění prostředků
Tuto část přeskočte, pokud chcete pokračovat v části 2 kurzu a nasazovat modely.
Důležité
Prostředky, které jste vytvořili, můžete využít jako předpoklady pro jiné kurzy a články s postupy pro Azure Machine Learning.
Odstranit vše
Pokud nechcete používat nic, co jste vytvořili, odstraňte celou skupinu prostředků, abyste nemuseli účtovat žádné poplatky.
V Azure Portal vyberte skupiny prostředků na levé straně okna.
V seznamu vyberte skupinu prostředků, kterou jste vytvořili.
Vyberte Odstranit skupinu prostředků.
Odstraněním skupiny prostředků se odstraní také všechny prostředky, které jste vytvořili v návrháři.
Odstranění jednotlivých prostředků
V návrháři, ve kterém jste experiment vytvořili, odstraňte jednotlivé prostředky tak, že je vyberete a pak vyberete tlačítko Odstranit .
Cílový výpočetní objekt, který jste zde vytvořili , automaticky škáluje na nula uzlů, když se nepoužívá. Tato akce se provede, aby se minimalizovaly poplatky. Pokud chcete odstranit cílový výpočetní objekt, postupujte takto:
Datové sady můžete zrušit registraci z pracovního prostoru tak, že vyberete každou datovou sadu a vyberete Zrušit registraci.
Pokud chcete datovou sadu odstranit, přejděte do účtu úložiště pomocí Azure Portal nebo Průzkumník služby Azure Storage a odstraňte je ručně.
Další kroky
Ve dvou částech se dozvíte, jak nasadit model jako koncový bod v reálném čase.