Dela via


core Paket

Innehåller grundläggande funktioner för Azure Machine Learning-pipelines, som är konfigurerbara arbetsflöden för maskininlärning.

Med Azure Machine Learning-pipelines kan du skapa återanvändbara maskininlärningsarbetsflöden som kan användas som mall för dina maskininlärningsscenarier. Det här paketet innehåller huvudfunktionerna för att arbeta med Azure ML-pipelines och används vanligtvis tillsammans med klasserna i steps paketet.

En maskininlärningspipeline representeras av en samling PipelineStep objekt som kan sekvenseras och parallelliseras, eller skapas med explicita beroenden mellan stegen. Pipelinesteg används för att definiera ett Pipeline objekt som representerar arbetsflödet som ska köras. Du kan skapa och arbeta med pipelines i en Jupyter Notebook eller någon annan IDE med Azure ML SDK installerat.

Med Azure ML-pipelines kan du fokusera på maskininlärning i stället för infrastruktur. Information om hur du kommer igång med att skapa en pipeline finns i https://aka.ms/pl-first-pipeline.

Mer information om fördelarna med Machine Learning-pipelinen och hur den är relaterad till andra pipelines som erbjuds av Azure finns i Vad är ML-pipelines i Azure Machine Learning Service?

Moduler

builder

Definierar klasser för att skapa en Azure Machine Learning-pipeline.

Ett pipelinediagram består av pipelinesteg (PipelineStep), valfria pipelinedata (PipelineData) som produceras eller används i varje steg och en valfri stegkörningssekvens (StepSequence).

graph

Definierar klasser för att skapa Azure Machine Learning-pipelinediagram.

Azure ML-pipelinediagram skapas för Pipeline objekt när du använder PipelineStep (och härledda klasser), PipelineDataoch PipelineData objekt. I vanliga användningsfall behöver du inte använda klasserna direkt i den här modulen.

Ett pipeline-körningsdiagram består av modulnoder som representerar grundläggande enheter, till exempel en datakälla eller ett steg. Noder kan ha indataportar och utdataportar och associerade parametrar. Kanter definierar relationer mellan två nodportar i en graf.

module

Innehåller klasser för att skapa och hantera återanvändbara beräkningsenheter för en Azure Machine Learning-pipeline.

Med moduler kan du skapa beräkningsenheter i en Pipeline, som kan ha indata, utdata och förlita sig på parametrar och en miljökonfiguration för att fungera. En modul kan versionshanteras och användas i olika Azure Machine Learning-pipelines till skillnad från PipelineStep (och härledda klasser) som används i en pipeline.

Moduler är utformade för att återanvändas i flera pipelines och kan utvecklas för att anpassa en specifik beräkningslogik för olika användningsfall. Ett steg i en pipeline kan användas i snabba iterationer för att förbättra en algoritm, och när målet har uppnåtts publiceras algoritmen vanligtvis som en modul för att aktivera återanvändning.

module_step_base

Innehåller funktioner för att lägga till ett steg i en pipeline med hjälp av en version av en Module.

pipeline

Definierar klassen för att skapa återanvändbara Azure Machine Learning-arbetsflöden.

pipeline_draft

Definierar klasser för hantering av föränderliga pipelines.

pipeline_endpoint

Definierar klasser för hantering av pipelines, inklusive versionshantering och slutpunkter.

pipeline_output_dataset

Innehåller funktioner för att främja mellanliggande utdata till en Azure Machine Learning-datauppsättning.

Mellanliggande data (utdata) i en pipeline blir som standard inte en Azure Machine Learning-datauppsättning. Om du vill höja upp mellanliggande data till en Azure Machine Learning-datauppsättning anropar as_dataset du metoden i klassen PipelineData för att returnera ett PipelineOutputFileDataset objekt. Från ett PipelineOutputFileDataset-objekt kan du sedan skapa ett PipelineOutputTabularDataset objekt.

run

Definierar klasser för skickade pipelines, inklusive klasser för att kontrollera status och hämta körningsinformation.

schedule

Definierar klasser för schemaläggning av inskickade Azure Machine Learning-pipelines.

Klasser

InputPortBinding

Definierar en bindning från en källa till indata från ett pipelinesteg.

En InputPortBinding kan användas som indata till ett steg. Källan kan vara , PipelineDataPortDataReference, DataReference, PipelineDataseteller OutputPortBinding.

InputPortBinding är användbart för att ange namnet på stegindata, om det ska vara annorlunda än namnet på bindningsobjektet (dvs. för att undvika duplicerade indata-/utdatanamn eller för att stegskriptet behöver en indata för att ha ett visst namn). Den kan också användas för att ange bind_mode för PythonScriptStep indata.

Initiera InputPortBinding.

Module

Representerar en beräkningsenhet som används i en Azure Machine Learning-pipeline.

En modul är en samling filer som körs på ett beräkningsmål och en beskrivning av ett gränssnitt. Samlingen av filer kan vara skript, binärfiler eller andra filer som krävs för att köras på beräkningsmålet. Modulgränssnittet beskriver indata, utdata och parameterdefinitioner. Den binder dem inte till specifika värden eller data. En modul har en associerad ögonblicksbild som samlar in den samling filer som definierats för modulen.

Initiera modulen.

ModuleVersion

Representerar den faktiska beräkningsenheten i en Module.

Du bör inte använda den här klassen direkt. Använd i stället någon av publiceringsmetoderna för Module klassen.

Initiera ModuleVersion.

ModuleVersionDescriptor

Definierar versionen och ID:t för en ModuleVersion.

Initiera ModuleVersionDescriptor.

OutputPortBinding

Definierar ett namngivet utdata från ett pipelinesteg.

OutputPortBinding kan användas för att ange vilken typ av data som ska skapas i ett steg och hur data ska skapas. Det kan användas med InputPortBinding för att ange att stegutdata är nödvändiga indata för ett annat steg.

Initiera OutputPortBinding.

Pipeline

Representerar en samling steg som kan köras som ett återanvändbart Azure Machine Learning-arbetsflöde.

Använd en pipeline för att skapa och hantera arbetsflöden som sammanfogar olika maskininlärningsfaser. Varje maskininlärningsfas, till exempel förberedelse av data och modellträning, kan bestå av ett eller flera steg i en pipeline.

En översikt över varför och när du ska använda Pipelines finns i https://aka.ms/pl-concept.

En översikt över hur du skapar en pipeline finns i https://aka.ms/pl-first-pipeline.

Initiera pipeline.

PipelineData

Representerar mellanliggande data i en Azure Machine Learning-pipeline.

Data som används i pipeline kan produceras i ett steg och förbrukas i ett annat steg genom att tillhandahålla ett PipelineData-objekt som utdata från ett steg och indata från ett eller flera efterföljande steg.

Observera att om du använder pipelinedata kontrollerar du att katalogen som används finns.

Ett Python-exempel för att säkerställa att katalogen finns, anta att du har en utdataport med namnet output_folder i ett pipelinesteg. Du vill skriva data till en relativ sökväg i den här mappen.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData använder underliggande DataReference som inte längre är den rekommenderade metoden för dataåtkomst och leverans. Använd OutputFileDatasetConfig i stället. Du hittar exempel här: Pipeline med OutputFileDatasetConfig.

Initiera PipelineData.

PipelineDataset

Fungerar som ett kort för datauppsättning och pipeline.

Anteckning

Den här klassen är inaktuell. Läs mer om hur du använder datauppsättning med pipeline i https://aka.ms/pipeline-with-dataset.

Det här är en intern klass. Du bör inte skapa den här klassen direkt utan anropa instansmetoderna as_* i datauppsättningen eller OutputDatasetConfig-klasserna.

Fungera som ett kort för datauppsättning och pipeline.

Det här är en intern klass. Du bör inte skapa den här klassen direkt utan anropa instansmetoderna as_* i datauppsättningen eller OutputDatasetConfig-klasserna.

PipelineDraft

Representerar en föränderlig pipeline som kan användas för att skicka körningar och skapa publicerade pipelines.

Använd PipelineDrafts för att iterera i pipelines. PipelineDrafts kan skapas från grunden, en annan PipelineDraft eller befintliga pipelines: Pipeline, PublishedPipelineeller PipelineRun.

Initiera PipelineDraft.

PipelineEndpoint

Representerar ett Pipeline arbetsflöde som kan utlösas från en unik slutpunkts-URL.

PipelineEndpoints kan användas för att skapa nya versioner av en PublishedPipeline samtidigt som samma slutpunkt bibehålls. PipelineEndpoints är unikt namngivna i en arbetsyta.

Med hjälp av slutpunktsattributet för ett PipelineEndpoint-objekt kan du utlösa nya pipelinekörningar från externa program med REST-anrop. Information om hur du autentiserar när du anropar REST-slutpunkter finns i https://aka.ms/pl-restep-auth.

Mer information om hur du skapar och kör maskininlärningspipelines finns i https://aka.ms/pl-first-pipeline.

Initiera PipelineEndpoint.

PipelineParameter

Definierar en parameter i en pipelinekörning.

Använd PipelineParameters för att skapa mångsidiga pipelines som kan skickas senare med varierande parametervärden.

Initiera pipelineparametrar.

PipelineRun

Representerar en körning av en Pipeline.

Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när en pipelinekörning har skickats. Använd get_steps för att hämta de StepRun objekt som skapas av pipelinekörningen. Andra användningsområden är att hämta objektet Graph som är associerat med pipelinekörningen, hämta status för pipelinekörningen och vänta på att körningen ska slutföras.

Initiera en pipelinekörning.

PipelineStep

Representerar ett körningssteg i en Azure Machine Learning-pipeline.

Pipelines skapas från flera pipelinesteg, som är distinkta beräkningsenheter i pipelinen. Varje steg kan köras oberoende av varandra och använda isolerade beräkningsresurser. Varje steg har vanligtvis egna namngivna indata, utdata och parametrar.

Klassen PipelineStep är basklassen från vilken andra inbyggda stegklasser som PythonScriptSteputformats för vanliga scenarier ärver, till exempel , DataTransferStepoch HyperDriveStep.

En översikt över hur pipelines och pipelinesteg relaterar finns i Vad är ML-pipelines.

Initiera PipelineStep.

PortDataReference

Modellerar data som är associerade med utdata från en slutförd StepRun.

Ett PortDataReference-objekt kan användas för att ladda ned utdata som skapades av en StepRun. Det kan också användas som stegindata i en framtida pipeline.

Initiera PortDataReference.

PublishedPipeline

Representerar en pipeline som ska skickas utan Den Python-kod som skapade den.

Dessutom kan en PublishedPipeline användas för att skicka om en Pipeline med olika PipelineParameter värden och indata.

Initiera PublishedPipeline.

:p ramslutpunkt REST-slutpunktens URL för att skicka pipelinekörningar för den här pipelinen. :type endpoint: str :p aram total_run_steps: Antalet steg i den här pipelinen :type total_run_steps: int :p aram workspace: Arbetsytan för den publicerade pipelinen. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Om du vill fortsätta köra andra steg i PipelineRun

Om ett steg misslyckas är standardvärdet falskt.

Schedule

Definierar ett schema som du vill skicka en pipeline för.

När en pipeline har publicerats kan ett schema användas för att skicka pipelinen med ett angivet intervall eller när ändringar på en Blob Storage-plats identifieras.

Initiera Schema.

ScheduleRecurrence

Definierar frekvens, intervall och starttid för en pipeline Schedule.

Med ScheduleRecurrence kan du också ange tidszon och timmar eller minuter eller veckodagar för upprepningen.

Initiera en upprepning av schemat.

Det gör det också möjligt att ange tidszon och timmar eller minuter eller veckodagar för upprepningen.

StepRun

En körning av ett steg i en Pipeline.

Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när den överordnade pipelinekörningen har skickats och pipelinen har skickat stegkörningen.

Initiera en StepRun.

StepRunOutput

Representerar utdata som skapats av en StepRun i en pipeline.

StepRunOutput kan användas för att komma åt som PortDataReference skapats av steget.

Initiera StepRunOutput.

StepSequence

Representerar en lista över steg i en Pipeline och i vilken ordning de ska köras.

Använd en StepSequence när du initierar en pipeline för att skapa ett arbetsflöde som innehåller steg som ska köras i en viss ordning.

Initiera StepSequence.

TrainingOutput

Definierar specialiserade utdata för vissa PipelineSteg för användning i en pipeline.

TrainingOutput gör det möjligt att göra ett automatiserat maskininlärningsmått eller en modell tillgängligt som ett stegs utdata som kan användas med ett annat steg i en Azure Machine Learning-pipeline. Kan användas med AutoMLStep eller HyperDriveStep.

Initiera TrainingOutput.

param model_file: Den specifika modellfilen som ska ingå i utdata. Endast för HyperDriveStep .

Uppräkningar

TimeZone

Räknar upp giltiga tidszoner för en upprepning Schedule.