core Balíček

Obsahuje základní funkce pro kanály Azure Machine Learning, což jsou konfigurovatelné pracovní postupy strojového učení.

Kanály služby Azure Machine Learning umožňují vytvářet pracovní postupy strojového učení, které se dají použít jako šablona pro scénáře strojového učení. Tento balíček obsahuje základní funkce pro práci s kanály Azure ML a obvykle se používá společně s třídami v steps balíčku.

Kanál strojového PipelineStep učení je reprezentován kolekcí objektů, které lze sekvencovat a paralelizovat nebo vytvářet s explicitními závislostmi mezi kroky. Kroky kanálu slouží k definování objektu Pipeline , který představuje pracovní postup, který se má provést. Kanály můžete vytvářet a pracovat v Jupyter Notebook nebo jiném integrovaném vývojovém prostředí s nainstalovanou sadou Azure ML SDK.

Kanály Azure ML umožňují zaměřit se spíše na strojové učení než na infrastrukturu. Pokud chcete začít vytvářet kanál, přečtěte si téma https://aka.ms/pl-first-pipeline.

Další informace o výhodách kanálu Machine Learning a o tom, jak souvisí s dalšími kanály nabízenými Azure, najdete v tématu Co jsou kanály ML ve službě Azure Machine Learning Service?

Moduly

builder

Definuje třídy pro vytvoření kanálu služby Azure Machine Learning.

Graf kanálu se skládá z kroků kanálu (PipelineStep), volitelných dat kanálu (PipelineData) vytvořených nebo využívaných v každém kroku a volitelné sekvence provádění kroků (StepSequence).

graph

Definuje třídy pro vytváření grafů kanálů služby Azure Machine Learning.

Grafy kanálů Azure ML se vytvářejí pro Pipeline objekty, když použijete PipelineStep (a odvozené třídy), PipelineDataa PipelineData objekty. V typických případech použití nebudete muset přímo používat třídy v tomto modulu.

Graf spuštění kanálu se skládá z uzlů modulů, které představují základní jednotky, jako je zdroj dat nebo krok. Uzly můžou mít vstupní a výstupní porty a přidružené parametry. Hrany definují relace mezi dvěma porty uzlů v grafu.

module

Obsahuje třídy pro vytváření a správu obnovitelných výpočetních jednotek kanálu služby Azure Machine Learning.

Moduly umožňují vytvářet výpočetní jednotky v objektu Pipeline, který může mít vstupy, výstupy a spoléhat se na parametry a konfiguraci prostředí. Modul může mít verze a používat ho v různých kanálech Azure Machine Learning na rozdíl od PipelineStep (a odvozených tříd), které se používají v jednom kanálu.

Moduly jsou navržené tak, aby se opakovaně používaly v několika kanálech, a můžou se vyvíjet tak, aby přizpůsobily konkrétní výpočetní logiku různým případům použití. Krok v kanálu se dá použít v rychlých iteracích ke zlepšení algoritmu a po dosažení cíle se algoritmus obvykle publikuje jako modul umožňující opakované použití.

module_step_base

Obsahuje funkci pro přidání kroku do kanálu pomocí verze .Module

pipeline

Definuje třídu pro vytváření opakovaně použitelných pracovních postupů služby Azure Machine Learning.

pipeline_draft

Definuje třídy pro správu proměnlivých kanálů.

pipeline_endpoint

Definuje třídy pro správu kanálů, včetně správy verzí a koncových bodů.

pipeline_output_dataset

Obsahuje funkci pro zvýšení úrovně zprostředkujícího výstupu na datovou sadu Azure Machine Learning.

Zprostředkující data (výstup) v kanálu se ve výchozím nastavení nestane datovou sadou služby Azure Machine Learning. Pokud chcete zvýšit úroveň mezilehlých dat na datovou sadu služby Azure Machine Learning, zavolejte as_dataset metodu ve třídě PipelineData a vraťte PipelineOutputFileDataset objekt. Z objektu PipelineOutputFileDataset pak můžete vytvořit PipelineOutputTabularDataset objekt .

run

Definuje třídy pro odeslané kanály, včetně tříd pro kontrolu stavu a načítání podrobností o spuštění.

schedule

Definuje třídy pro plánování odesílání kanálů služby Azure Machine Learning.

Třídy

InputPortBinding

Definuje vazbu ze zdroje na vstup kroku kanálu.

InputPortBinding lze použít jako vstup do kroku. Zdrojem může být PipelineData, PortDataReference, DataReference, PipelineDatasetnebo OutputPortBinding.

InputPortBinding je užitečné k určení názvu vstupu kroku, pokud by se měl lišit od názvu objektu bind (tj. aby se zabránilo duplicitním názvům vstupu a výstupu nebo protože krokový skript potřebuje vstup, aby měl určitý název). Dá se také použít k určení bind_mode vstupů PythonScriptStep .

Inicializujte InputPortBinding.

Module

Představuje výpočetní jednotku použitou v kanálu Azure Machine Learning.

Modul je kolekce souborů, která se spustí na cílovém výpočetním objektu, a popis rozhraní. Kolekce souborů může být skript, binární soubory nebo jakékoli jiné soubory potřebné ke spuštění na cílovém výpočetním objektu. Rozhraní modulu popisuje vstupy, výstupy a definice parametrů. Neváže je na konkrétní hodnoty nebo data. K modulu je přidružený snímek, který zachycuje kolekci souborů definovaných pro modul.

Inicializace modulu

ModuleVersion

Představuje skutečnou výpočetní jednotku v rámci objektu Module.

Tuto třídu byste neměli používat přímo. Místo toho použijte jednu z metod Module publikování třídy .

Inicializace ModuleVersion.

ModuleVersionDescriptor

Definuje verzi a ID objektu ModuleVersion.

Inicializace ModuleVersionDescriptor.

OutputPortBinding

Definuje pojmenovaný výstup kroku kanálu.

OutputPortBinding se dá použít k určení typu dat, která se vytvoří v kroku, a způsobu vytváření dat. Pomocí příkazu InputPortBinding lze určit, že výstup kroku je povinným vstupem jiného kroku.

Inicializujte OutputPortBinding.

Pipeline

Představuje kolekci kroků, které je možné provést jako opakovaně použitelný pracovní postup služby Azure Machine Learning.

Kanál slouží k vytváření a správě pracovních postupů, které spojují různé fáze strojového učení. Každá fáze strojového učení, jako je příprava dat a trénování modelu, se může skládat z jednoho nebo více kroků v kanálu.

Přehled důvodů a kdy používat kanály najdete v tématu https://aka.ms/pl-concept.

Přehled o vytváření kanálu najdete v tématu https://aka.ms/pl-first-pipeline.

Inicializace kanálu

PipelineData

Představuje průběžná data v kanálu Služby Azure Machine Learning.

Data použitá v kanálu lze vytvořit v jednom kroku a využívat v jiném kroku poskytnutím objektu PipelineData jako výstupu jednoho kroku a vstupu jednoho nebo několika následných kroků.

Pokud používáte data kanálu, ujistěte se, že použitý adresář existoval.

Příklad Pythonu, který zajistí existenci adresáře, předpokládejme, že máte výstupní port s názvem output_folder v jednom kroku kanálu chcete zapsat nějaká data do relativní cesty v této složce.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData používají podkladová dataReference , což už není doporučený přístup pro přístup k datům a jejich doručování. Místo toho použijte OutputFileDatasetConfig . Ukázku najdete tady: Pipeline using OutputFileDatasetConfig.

Inicializujte PipelineData.

PipelineDataset

Funguje jako adaptér pro datovou sadu a kanál.

Poznámka

Tato třída je zastaralá. Informace o používání datové sady s kanálem najdete v tématu https://aka.ms/pipeline-with-dataset.

Toto je interní třída. Tuto třídu byste neměli vytvářet přímo, ale spíše volat metody instance as_* třídy Dataset nebo OutputDatasetConfig.

Fungovat jako adaptér pro datovou sadu a kanál.

Toto je interní třída. Tuto třídu byste neměli vytvářet přímo, ale spíše volat metody instance as_* třídy Dataset nebo OutputDatasetConfig.

PipelineDraft

Představuje proměnlivý kanál, který lze použít k odesílání spuštění a vytváření publikovaných kanálů.

K iteraci v kanálech použijte PipelineDrafts. Kanály PipelineDraft se dají vytvořit od začátku, z jiného kanálu PipelineDraft nebo z existujících kanálů: Pipeline, PublishedPipelinenebo PipelineRun.

Inicializujte PipelineDraft.

PipelineEndpoint

Pipeline Představuje pracovní postup, který lze aktivovat z jedinečné adresy URL koncového bodu.

PipelineEndpoints se dají použít k vytváření nových verzí objektů se PublishedPipeline zachováním stejného koncového bodu. Koncové body kanálu mají jedinečný název v rámci pracovního prostoru.

Pomocí atributu koncového bodu objektu PipelineEndpoint můžete aktivovat nová spuštění kanálu z externích aplikací pomocí volání REST. Informace o ověřování při volání koncových bodů REST najdete v tématu https://aka.ms/pl-restep-auth.

Další informace o vytváření a spouštění kanálů strojového učení najdete v tématu https://aka.ms/pl-first-pipeline.

Inicializujte PipelineEndpoint.

PipelineParameter

Definuje parametr při spuštění kanálu.

Použijte PipelineParameters k vytvoření univerzálních kanálů, které je možné později znovu odeslat s různými hodnotami parametrů.

Inicializace parametrů kanálu

PipelineRun

Představuje spuštění objektu Pipeline.

Tuto třídu je možné použít ke správě, kontrole stavu a načítání podrobností o spuštění po odeslání spuštění kanálu. Slouží get_steps k načtení StepRun objektů vytvořených spuštěním kanálu. Mezi další použití patří načtení objektu přidruženého Graph ke spuštění kanálu, načtení stavu spuštění kanálu a čekání na dokončení spuštění.

Inicializujte spuštění kanálu.

PipelineStep

Představuje krok spuštění v kanálu služby Azure Machine Learning.

Kanály se vytváří z několika kroků kanálu, což jsou odlišné výpočetní jednotky v kanálu. Každý krok může běžet nezávisle a používat izolované výpočetní prostředky. Každý krok má obvykle své vlastní pojmenované vstupy, výstupy a parametry.

Třída PipelineStep je základní třída, ze které dědí další předdefinované třídy kroků navržené pro běžné scénáře, jako PythonScriptStepjsou , DataTransferStepa HyperDriveStep.

Přehled o tom, jak kanály a kroky kanálu souvisejí, najdete v tématu Co jsou kanály ML.

Inicializace pipelineStep.

PortDataReference

Modeluje data přidružená k výstupu dokončeného steprunu.

Objekt PortDataReference lze použít ke stažení výstupních dat vytvořených objektem StepRun. Dá se také použít jako krokový vstup v budoucím kanálu.

Inicializuje portDataReference.

PublishedPipeline

Představuje kanál, který se má odeslat bez kódu Pythonu, který ho zkonstruoval.

Kromě toho lze k opětovnému odeslání Pipeline souboru s různými PipelineParameter hodnotami a vstupy použít PublishedPipeline.

Inicializace PublishedPipeline.

:p aram koncový bod Adresa URL koncového bodu REST pro odeslání spuštění kanálu pro tento kanál. :type endpoint: str :p aram total_run_steps: Počet kroků v tomto kanálu :type total_run_steps: int :p aram workspace: Pracovní prostor publikovaného kanálu. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Jestli pokračovat v provádění dalších kroků ve spuštění kanálu

Pokud krok selže, výchozí hodnota je false.

Schedule

Definuje plán odeslání kanálu.

Po publikování kanálu je možné použít plán k odeslání kanálu v zadaném intervalu nebo při zjištění změn v umístění úložiště objektů blob.

Inicializovat plán.

ScheduleRecurrence

Definuje frekvenci, interval a čas spuštění kanálu Schedule.

ScheduleRecurrence také umožňuje určit časové pásmo a hodiny, minuty nebo týdenní dny opakování.

Inicializuje opakování plánu.

Umožňuje také zadat časové pásmo a hodiny, minuty nebo týdenní dny opakování.

StepRun

Spuštění kroku v Pipeline.

Tuto třídu je možné použít ke správě, kontrole stavu a načtení podrobností o spuštění, jakmile se odešle nadřazené spuštění kanálu a kanál odešle krok.

Inicializace spuštění kroku

StepRunOutput

Představuje výstup vytvořený objektem StepRun v kanálu.

StepRunOutput se dá použít pro přístup k vytvořenému PortDataReference v kroku.

Inicializujte StepRunOutput.

StepSequence

Představuje seznam kroků v Pipeline a pořadí, ve kterém se mají provést.

Při inicializaci kanálu použijte stepSequence k vytvoření pracovního postupu, který obsahuje kroky ke spuštění v určitém pořadí.

Inicializace stepSequence.

TrainingOutput

Definuje specializovaný výstup určitých kroků kanálu pro použití v kanálu.

TrainingOutput umožňuje zpřístupnit metriku nebo model automatizovaného strojového učení jako výstup kroku, který bude využit dalším krokem v kanálu Azure Machine Learning. Lze použít s AutoMLStep nebo HyperDriveStep.

Inicializace TrainingOutput.

param model_file: Konkrétní soubor modelu, který se má zahrnout do výstupu. Jenom pro HyperDriveStep .

Výčty

TimeZone

Vytvoří výčet platných časových pásem pro opakování Schedule.