Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Důležité
Tento článek poskytuje informace o použití Azure Machine Learning SDK verze 1. Sada SDK v1 je od 31. března 2025 zastaralá. Podpora bude ukončena 30. června 2026. Do tohoto data můžete nainstalovat a používat sadu SDK v1. Vaše stávající pracovní postupy využívající sadu SDK v1 budou fungovat i po datu ukončení podpory. Mohou však být vystaveny bezpečnostním rizikům nebo zásadním změnám v případě změn architektury v produktu.
Doporučujeme přejít na SDK v2 před 30. červnem 2026. Další informace o sadě SDK v2 najdete v tématu Co je Azure Machine Learning CLI a Python SDK v2? a referenční informace k sadě SDK v2.
Tento článek vysvětluje, jak pomocí návrháře služby Azure Machine Learning trénovat model lineární regrese, který predikuje ceny aut. Tento kurz je první částí z dvoudílné série.
Další informace o návrháři najdete v tématu Co je návrhář služby Azure Machine Learning?
Poznámka:
Návrhář podporuje dva typy komponent: klasické předem připravené komponenty (v1) a vlastní komponenty (v2). Tyto dva typy součástí nejsou kompatibilní.
Klasické předem připravené komponenty jsou určené především pro zpracování dat a tradiční úlohy strojového učení, jako je regrese a klasifikace. Tento typ komponenty se podporuje i nadále, ale nebudou se přidávat žádné nové komponenty.
Vlastní komponenty umožňují zabalit vlastní kód jako součást. Podporuje sdílení komponent mezi pracovními prostory a bezproblémové vytváření v rozhraních Studio, CLI v2 a SDK v2.
Pro nové projekty důrazně doporučujeme používat vlastní komponenty, které jsou kompatibilní se službou Azure Machine Learning V2 a budou nadále přijímat nové aktualizace.
Tento článek se týká klasických předem připravených komponent a není kompatibilní s rozhraním příkazového řádku v2 a sadou SDK v2.
V tomto návodu se naučíte, jak:
- Vytvoření nového kanálu.
- Import dat.
- Příprava dat.
- Trénování modelu strojového učení
- Vyhodnocení modelu strojového učení
Ve druhé části tutoriálu nasadíte svůj model jako koncový bod, který umožňuje odvozování v reálném čase, abyste předpověděli cenu jakéhokoli vozu na základě technických specifikací, které mu pošlete.
Poznámka:
Pokud chcete zobrazit dokončenou verzi tohoto kurzu jako ukázkový kanál, přečtěte si téma Použití regrese k predikci cen aut pomocí návrháře služby Azure Machine Learning.
Důležité
Pokud v tomto dokumentu nevidíte grafické prvky, jako jsou tlačítka v studiu nebo návrháři, možná nemáte správnou úroveň oprávnění k pracovnímu prostoru. Obraťte se na správce předplatného Azure a ověřte, jestli vám byla udělena správná úroveň přístupu. Další informace najdete v tématu Správa uživatelů a rolí.
Vytvoření nového kanálu
Kanály Azure Machine Learning uspořádají několik kroků strojového učení a zpracování dat do jednoho prostředku. Kanály umožňují uspořádat, spravovat a opakovaně používat složité pracovní postupy strojového učení napříč projekty a uživateli.
K vytvoření kanálu Azure Machine Learning potřebujete pracovní prostor Azure Machine Learning. V této části se dozvíte, jak tyto prostředky vytvořit.
Vytvořit nový pracovní prostor
K používání návrháře potřebujete pracovní prostor Azure Machine Learning. Pracovní prostor je prostředek nejvyšší úrovně pro Azure Machine Learning. Poskytuje centralizované místo pro práci se všemi artefakty, které vytvoříte ve službě Azure Machine Learning. Informace o tom, jak vytvořit pracovní prostor, najdete v tématu Vytvoření prostředků pracovního prostoru.
Poznámka:
Pokud váš pracovní prostor používá virtuální síť, je potřeba provést další kroky konfigurace pro použití návrháře. Další informace najdete v tématu Použití studio Azure Machine Learning ve virtuální síti Azure.
Vytvoření kanálu
Přihlaste se k nástroji Azure Machine Learning Studio a vyberte pracovní prostor, který chcete použít.
V nabídce bočního panelu vyberte Návrhář . V nabídce Předem připravená verze Classic zvolte Vytvořit nové potrubí pomocí klasických předem připravených komponent.
Vyberte ikonu tužky vedle automaticky generovaného názvu konceptu potrubí a přejmenujte ho na predikci ceny automobilu. Název nemusí být jedinečný.
Importovat data
V návrháři je k dispozici několik ukázkových datových sad, se kterými můžete experimentovat. Pro účely tohoto kurzu použijte údaje o cenách automobilů (Raw).
Vlevo od plátna kanálu je paleta datových sad a komponent. Vyberte součást>ukázková data.
Vyberte datovou sadu Automobile price data (Raw) a přetáhněte ji na plátno.
Vizualizace dat
Data můžete vizualizovat, abyste pochopili datovou sadu, kterou budete používat.
Klikněte pravým tlačítkem myši na data cen automobilů (Raw) a vyberte Náhled dat.
Výběrem různých sloupců v okně dat zobrazíte informace o jednotlivých sloupcích.
Každý řádek představuje automobil a proměnné přidružené k jednotlivým automobilům se zobrazují jako sloupce. V této datové sadě je 205 řádků a 26 sloupců.
Příprava dat
Datové sady obvykle před analýzou vyžadují určité předběžné zpracování. Při kontrole datové sady jste si možná všimli některých chybějících hodnot. Tyto chybějící hodnoty musí být vyčištěny, aby model mohl správně analyzovat data.
Odebrání sloupce
Při trénování modelu musíte udělat něco s chybějícími daty. V této datové sadě chybí sloupec normalized-losses mnoho hodnot, takže tento sloupec z modelu úplně vyloučíte.
V datové sadě a paletě součástí vlevo od plátna vyberte Komponenta a vyhledejte komponentu Vybrat sloupce v datové sadě .
Přetáhněte komponentu Vybrat sloupce v datové sadě na plátno. Zahoďte komponentu pod komponentu datové sady.
Připojte datovou sadu Automobile price data (Raw) ke komponentě Vybrat sloupce v datové sadě. Přetáhněte z výstupního portu datové sady, což je malý kruh v dolní části datové sady na plátně, na vstupní port Vybrat sloupce v datové sadě, což je malý kruh v horní části komponenty.
Návod
Tok dat vytvoříte prostřednictvím kanálu, když připojíte výstupní port jedné komponenty ke vstupnímu portu jiného.
Vyberte komponentu Vybrat sloupce v datové sadě .
Vyberte ikonu šipky pod rozhraním potrubí napravo od plátna a otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Vybrat sloupce v datové sadě otevřít podokno podrobností.
Vyberte Upravit sloupec napravo od podokna.
Rozbalte rozevírací seznam Názvy sloupců vedle položky Zahrnout a vyberte Všechny sloupce.
Vyberte tlačítko + pro přidání nového pravidla.
V rozevíracích nabídkách vyberte Vyloučit a Sloupce názvy.
Do textového pole zadejte normalizované ztráty .
V pravém dolním rohu vyberte Uložit a zavřete selektor sloupců.
V podokně Podrobností o komponentě Datová sada vyberte sloupce a rozbalte informace o uzlu.
Vyberte textové pole Komentář a zadejte Vyloučit normalizované ztráty.
Komentáře se zobrazí na grafu, které vám pomohou s uspořádáním pipeline.
Vyčištění chybějících dat
Vaše datová sada stále chybí hodnoty po odebrání sloupce normalized-losses . Zbývající chybějící data můžete odebrat pomocí komponenty Vyčistit chybějící data .
Návod
Čištění chybějících hodnot ze vstupních dat je předpokladem pro použití většiny součástí v návrháři.
V datové sadě a paletě součástí vlevo od plátna vyberte Komponenta a vyhledejte komponentu Vyčistit chybějící data .
Přetáhněte komponentu Vyčistit chybějící data na plátno kanálu. Připojte ho ke komponentě Vybrat sloupce v datové sadě .
Vyberte komponentu Vyčistit chybějící data .
Vyberte ikonu šipky pod rozhraním potrubí napravo od plátna a otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Vyčistit chybějící data otevřít podokno podrobností.
Vyberte Upravit sloupec napravo od podokna.
V okně Sloupce, které se mají vyčistit , rozbalte rozevírací nabídku vedle položky Zahrnout. Vyberte Všechny sloupce.
Vyberte Uložit.
V podokně Podrobnosti o komponentě Vyčistit chybějící data v režimu čištění vyberte Odebrat celý řádek.
V podokně Podrobnosti o komponentě Vyčistit chybějící data rozbalte informace o uzlu.
Vyberte textové pole Komentář a zadejte Odebrat chybějící řádky hodnot.
Váš kanál by teď měl vypadat nějak takto:
Trénování modelu strojového učení
Teď, když máte k dispozici komponenty pro zpracování dat, můžete nastavit trénovací komponenty.
Protože chcete predikovat cenu, což je číslo, můžete použít regresní algoritmus. V tomto příkladu použijete lineární regresní model.
Rozdělení dat
Rozdělení dat je běžnou úlohou strojového učení. Data rozdělíte do dvou samostatných datových sad. Jedna datová sada trénuje model a druhý testuje, jak dobře model fungoval.
V datových sadách a paletě komponent vlevo od plátna vyberte Komponenta a vyhledejte komponentu Rozdělit data .
Přetáhněte komponentu Rozdělit data na plátno kanálu.
Připojte levý port komponenty Vyčistit chybějící data ke komponentě Rozdělit data .
Důležité
Ujistěte se, že se levý výstupní port funkce Vyčištění chybějících dat připojuje k rozdělení dat. Levý port obsahuje vyčištěná data. Pravý port obsahuje zahozená data.
Vyberte komponentu Rozdělit data .
Vyberte ikonu šipky pod rozhraním potrubí napravo od plátna a otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Rozdělit data otevřít podokno podrobností.
V podokně Podrobností rozdělení dat nastavte zlomek řádků v první výstupní datové sadě na hodnotu 0,7.
Tato možnost rozdělí 70 procent dat na trénování modelu a 30 procent pro jeho testování. Datová sada s 70 procenty je přístupná přes levý výstupní port. Zbývající data jsou k dispozici přes správný výstupní port.
V podokně Podrobnosti o rozdělení dat rozšiřte Informace o uzlu.
Vyberte textové pole Komentář a zadejte Rozdělit datovou sadu na trénovací sadu (0,7) a testovací sadu (0.3).
Trénování modelu
Vytrénujte model tím, že jí poskytnete datovou sadu, která zahrnuje cenu. Algoritmus vytvoří model, který vysvětluje vztah mezi funkcemi a cenou, jak je znázorněno trénovacími daty.
V datové sadě a paletě komponent vlevo od plátna vyberte Komponenta a vyhledejte komponentu Lineární regrese .
Přetáhněte komponentu Lineární regrese na plátno kanálu.
V datové sadě a paletě součástí vlevo od plátna vyberte Komponenta a vyhledejte komponentu Train Model .
Přetáhněte komponentu Trénování modelu na plátno kanálu.
Připojte výstup komponenty Lineární regrese k levému vstupu komponenty Trénování modelu .
Připojte výstup trénovacích dat (levý port) komponenty Rozdělit data ke správnému vstupu komponenty Trénování modelu .
Důležité
Ujistěte se, že se levý výstupní port rozdělených dat připojuje k trénování modelu. Levý port obsahuje trénovací sadu. Pravý port obsahuje testovací sadu.
Vyberte komponentu Trénování modelu .
Výběrem ikony šipky v části Nastavení kanálu napravo od plátna otevřete podokno podrobností komponenty. Případně můžete poklikáním na komponentu Train Model (Trénovat model ) otevřít podokno podrobností.
Vyberte Upravit sloupec napravo od podokna.
V okně Sloupec Popisek, které se zobrazí, rozbalte rozevírací nabídku a vyberte Názvy sloupců.
Do textového pole zadejte cenu , která určuje hodnotu, kterou bude model predikovat.
Důležité
Ujistěte se, že přesně zadáte název sloupce. - Nepište price velkými písmeny.
Kanál by měl vypadat takto:
Přidání komponenty Score Model
Jakmile model vytrénujete pomocí 70 procent dat, můžete ho použít k určení skóre ostatních 30 procent a zjistit, jak dobře funguje váš model.
V paletě datových sad a komponent vlevo od plátna vyberte Komponent a vyhledejte komponent Score Model .
Přetáhněte komponentu Určení skóre modelu na plátno kanálu.
Připojte výstup komponenty Trénování modelu k levému vstupnímu portu určení skóre modelu. Připojte výstup testovacích dat (pravý port) komponenty Split Data ke správnému vstupnímu portu modelu určení skóre.
Přidání komponenty Vyhodnotit model
Pomocí komponenty Vyhodnotit model vyhodnoťte, jak dobře model vyhodnocoval testovací datovou sadu.
Na levé straně plátna v datových sadách a paletě komponent vyberte Komponenta a vyhledejte komponentu Vyhodnotit model .
Přetáhněte komponentu Vyhodnotit model na plátno kanálu.
Připojte výstup komponenty Určení skóre modelu k levému vstupu vyhodnocení modelu.
Konečný kanál by měl vypadat přibližně takto:
Odeslání kanálu
V horním rohu vyberte Konfigurovat a odeslat potrubí.
Jakmile se zobrazí krok za krokem průvodce, prostřednictvím něj odešlete úlohu pipeline.
V části Základy můžete nakonfigurovat experiment, zobrazovaný název úlohy, popis úlohy atd.
V části Vstupy a výstupy můžete přiřadit hodnotu vstupům a výstupům, které jsou povýšeny na úroveň kanálu. V tomto příkladu je prázdný, protože jsme nezvýšili žádný vstup ani výstup na úroveň kanálu.
V nastavení modulu runtime můžete pro kanál nakonfigurovat výchozí úložiště dat a výchozí výpočetní prostředky. Jedná se o výchozí úložiště dat a výpočetní prostředek pro všechny komponenty v tomto kanálu. Pokud však pro komponentu nastavíte jiný výpočetní objekt nebo úložiště dat explicitně, systém respektuje nastavení na úrovni komponenty. V opačném případě použije výchozí hodnotu.
Krok Zkontrolovat a odeslat je posledním krokem ke kontrole všech nastavení před odesláním. Průvodce si pamatuje vaši poslední konfiguraci, kdykoliv odešlete potrubí.
Po odeslání pipeline úlohy se nahoře zobrazí zpráva s odkazem na podrobnosti úlohy. Výběrem tohoto odkazu můžete zkontrolovat podrobnosti o úloze.
Zobrazení popisků se skóre
Na stránce podrobností úlohy můžete zkontrolovat stav úlohy pracovního postupu, výsledky a protokoly.
Po dokončení úlohy můžete zobrazit výsledky úlohy kanálu. Nejprve se podívejte na předpovědi generované regresním modelem.
Klikněte pravým tlačítkem myši na komponentu Score Model (Určení skóre modelu) a vyberte náhled datové sady Scored (Skóre dat>) a zobrazte její výstup.
Tady vidíte predikované ceny a skutečné ceny z testovacích dat.
Vyhodnocení modelů
Pomocí testovací datové sady můžete zjistit, jak dobře trénovaný model fungoval s testovací datovou sadou.
- Klikněte pravým tlačítkem myši na komponentu Vyhodnotit model a výběrem náhledu výsledků vyhodnocení dat>zobrazte jeho výstup.
Pro váš model se zobrazují následující statistiky:
- Střední absolutní chyba (MAE):: Průměr absolutních chyb. Chyba je rozdíl mezi predikovanou hodnotou a skutečnou hodnotou.
- Odmocnina střední kvadratické chyby (RMSE): Druhá odmocnina průměru kvadratických chyb předpovědí na základě testovací datové sady
- Relativní absolutní chyba: Průměr absolutních chyb relativních k absolutnímu rozdílu mezi skutečnými hodnotami a průměrem všech skutečných hodnot
- Relativní kvadratická chyba: Průměr kvadratických chyb relativních ke kvadratickému rozdílu mezi skutečnými hodnotami a průměrem všech skutečných hodnot
- Koeficient stanovení: Tato statistická metrika označuje, jak dobře model odpovídá datům.
Pro každou statistiku chyb platí, že menší hodnota je lepší. Menší hodnota označuje, že předpovědi jsou blíže skutečným hodnotám. Pro koeficient určení je čím blíže jeho hodnota k jedné (1,0), tím lepší predikce.
Vyčištění prostředků
Pokud chcete pokračovat v části 2 kurzu, nasazení modelů přeskočte tuto část.
Důležité
Prostředky, které jste vytvořili, můžete použít jako předpoklady pro další kurzy a články s postupy služby Azure Machine Learning.
Odstranit vše
Pokud nemáte v úmyslu používat nic, co jste vytvořili, odstraňte celou skupinu prostředků, takže vám nebudou účtovány žádné poplatky.
Na webu Azure Portal vyberte v části Služby Azureskupiny prostředků.
Vyberte skupinu prostředků, kterou jste vytvořili.
Vyberte Odstranit skupinu prostředků.
Odstraněním skupiny prostředků se odstraní také všechny prostředky, které jste vytvořili v návrháři.
Odstranění jednotlivých prostředků
V návrháři, ve kterém jste experiment vytvořili, odstraňte jednotlivé prostředky tak, že je vyberete a pak vyberete tlačítko Odstranit .
Cílový výpočetní objekt, který jste zde vytvořili, automaticky škáluje na nula uzlů, když se nepoužívá. Tato akce se provede, aby se minimalizovaly poplatky. Pokud chcete odstranit cílový výpočetní objekt, postupujte takto:
Pokud chcete datovou sadu odstranit, přejděte na účet úložiště pomocí webu Azure Portal nebo Průzkumník služby Azure Storage a odstraňte tyto prostředky ručně.
Další krok
V druhé části se dozvíte, jak model nasadit jako koncový bod v reálném čase.