core Paket

Innehåller grundläggande funktioner för Azure Machine Learning-pipelines, som är konfigurerbara arbetsflöden för maskininlärning.

Med Azure Machine Learning-pipelines kan du skapa återanvändbara arbetsflöden för maskininlärning som kan användas som mall för dina maskininlärningsscenarier. Det här paketet innehåller kärnfunktionerna för att arbeta med Azure ML-pipelines och används vanligtvis tillsammans med klasserna i steps paketet.

En maskininlärningspipeline representeras av en samling PipelineStep objekt som kan sekvenseras och parallelliseras, eller skapas med explicita beroenden mellan steg. Pipelinesteg används för att definiera ett Pipeline objekt som representerar arbetsflödet som ska köras. Du kan skapa och arbeta med pipelines i en Jupyter Notebook eller någon annan IDE med Azure ML SDK installerat.

Med Azure ML-pipelines kan du fokusera på maskininlärning snarare än infrastruktur. Information om hur du kommer igång med att skapa en pipeline finns i https://aka.ms/pl-first-pipeline.

Mer information om fördelarna med Machine Learning Pipeline och hur den är relaterad till andra pipelines som erbjuds av Azure finns i Vad är ML-pipelines i Azure Machine Learning-tjänsten?

Moduler

builder

Definierar klasser för att skapa en Azure Machine Learning-pipeline.

Ett pipelinediagram består av pipelinesteg (PipelineStep), valfria pipelinedata (PipelineData) som skapas eller förbrukas i varje steg och en valfri stegkörningssekvens (StepSequence).

graph

Definierar klasser för att skapa Azure Machine Learning-pipelinediagram.

Azure ML-pipelinediagram skapas för Pipeline objekt när du använder PipelineStep (och härledda klasser), PipelineDataoch PipelineData -objekt. I vanliga användningsfall behöver du inte använda klasserna direkt i den här modulen.

Ett pipelinekörningsdiagram består av modulnoder som representerar grundläggande enheter, till exempel en datakälla eller ett steg. Noder kan ha indataportar, utdataportar och associerade parametrar. Kanter definierar relationer mellan två nodportar i en graf.

module

Innehåller klasser för att skapa och hantera återanvändbara beräkningsenheter för en Azure Machine Learning-pipeline.

Med moduler kan du skapa beräkningsenheter i en Pipeline, som kan ha indata, utdata och förlita sig på parametrar och en miljökonfiguration för att fungera. En modul kan versionshanteras och användas i olika Azure Machine Learning-pipelines till skillnad från PipelineStep (och härledda klasser) som används i en pipeline.

Moduler är utformade för att återanvändas i flera pipelines och kan utvecklas för att anpassa en specifik beräkningslogik för olika användningsfall. Ett steg i en pipeline kan användas i snabba iterationer för att förbättra en algoritm, och när målet har uppnåtts publiceras algoritmen vanligtvis som en modul för att möjliggöra återanvändning.

module_step_base

Innehåller funktioner för att lägga till ett steg i en pipeline med hjälp av en version av en Module.

pipeline

Definierar klassen för att skapa återanvändbara Azure Machine Learning-arbetsflöden.

pipeline_draft

Definierar klasser för hantering av föränderliga pipelines.

pipeline_endpoint

Definierar klasser för hantering av pipelines, inklusive versionshantering och slutpunkter.

pipeline_output_dataset

Innehåller funktioner för att höja upp mellanliggande utdata till en Azure Machine Learning-datauppsättning.

Mellanliggande data (utdata) i en pipeline blir som standard inte en Azure Machine Learning-datauppsättning. Om du vill flytta upp mellanliggande data till en Azure Machine Learning-datauppsättning anropar as_dataset du metoden i klassen PipelineData för att returnera ett PipelineOutputFileDataset -objekt. Från ett PipelineOutputFileDataset-objekt kan du sedan skapa ett PipelineOutputTabularDataset -objekt.

run

Definierar klasser för skickade pipelines, inklusive klasser för att kontrollera status och hämta körningsinformation.

schedule

Definierar klasser för schemaläggning av inlämningar av Azure Machine Learning-pipelines.

Klasser

InputPortBinding

Definierar en bindning från en källa till indata för ett pipelinesteg.

En InputPortBinding kan användas som indata till ett steg. Källan kan vara , PipelineDataPortDataReference, DataReference, PipelineDataseteller OutputPortBinding.

InputPortBinding är användbart för att ange namnet på stegindata, om det ska skilja sig från namnet på bindningsobjektet (d.v.s. för att undvika dubbletter av indata-/utdatanamn eller för att stegskriptet behöver en indata för att ha ett visst namn). Den kan också användas för att ange bind_mode för PythonScriptStep indata.

Initiera InputPortBinding.

Module

Representerar en beräkningsenhet som används i en Azure Machine Learning-pipeline.

En modul är en samling filer som körs på ett beräkningsmål och en beskrivning av ett gränssnitt. Samlingen med filer kan vara skript, binärfiler eller andra filer som krävs för att köras på beräkningsmålet. Modulgränssnittet beskriver indata, utdata och parameterdefinitioner. Den binder dem inte till specifika värden eller data. En modul har en ögonblicksbild som är associerad med den, som samlar in den samling filer som definierats för modulen.

Initiera modulen.

ModuleVersion

Representerar den faktiska beräkningsenheten i en Module.

Du bör inte använda den här klassen direkt. Använd i stället någon av publiceringsmetoderna för Module klassen.

Initiera ModuleVersion.

ModuleVersionDescriptor

Definierar versionen och ID:t för en ModuleVersion.

Initiera ModuleVersionDescriptor.

OutputPortBinding

Definierar ett namngivet utdata från ett pipelinesteg.

OutputPortBinding kan användas för att ange vilken typ av data som ska skapas i ett steg och hur data ska skapas. Du kan använda den med InputPortBinding för att ange att stegutdata är nödvändiga indata för ett annat steg.

Initiera OutputPortBinding.

Pipeline

Representerar en samling steg som kan köras som ett återanvändbart Azure Machine Learning-arbetsflöde.

Använd en pipeline för att skapa och hantera arbetsflöden som sammanfogar olika maskininlärningsfaser. Varje maskininlärningsfas, till exempel förberedelse av data och modellträning, kan bestå av ett eller flera steg i en pipeline.

En översikt över varför och när du ska använda pipelines finns i https://aka.ms/pl-concept.

En översikt över hur du skapar en pipeline finns i https://aka.ms/pl-first-pipeline.

Initiera pipeline.

PipelineData

Representerar mellanliggande data i en Azure Machine Learning-pipeline.

Data som används i pipeline kan skapas i ett steg och användas i ett annat steg genom att tillhandahålla ett PipelineData-objekt som utdata från ett steg och indata för ett eller flera efterföljande steg.

Observera att om du använder pipelinedata kontrollerar du att katalogen som används finns.

Ett python-exempel för att säkerställa att katalogen finns, anta att du har en utdataport med namnet output_folder i ett pipelinesteg. Du vill skriva data till en relativ sökväg i den här mappen.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData använder underliggande DataReference som inte längre är den rekommenderade metoden för dataåtkomst och -leverans. Använd OutputFileDatasetConfig i stället. Du hittar exempel här: Pipeline med OutputFileDatasetConfig.

Initiera PipelineData.

PipelineDataset

Fungerar som ett kort för datauppsättning och pipeline.

Anteckning

Den här klassen är inaktuell. Läs mer om hur du använder datauppsättning med pipeline https://aka.ms/pipeline-with-dataseti .

Det här är en intern klass. Du bör inte skapa den här klassen direkt utan snarare anropa instansmetoderna as_* i klasserna Dataset eller OutputDatasetConfig.

Fungera som ett kort för datauppsättning och pipeline.

Det här är en intern klass. Du bör inte skapa den här klassen direkt utan snarare anropa instansmetoderna as_* i klasserna Dataset eller OutputDatasetConfig.

PipelineDraft

Representerar en föränderlig pipeline som kan användas för att skicka körningar och skapa publicerade pipelines.

Använd PipelineDrafts för att iterera i pipelines. PipelineDrafts kan skapas från grunden, en annan PipelineDraft eller befintliga pipelines: Pipeline, PublishedPipelineeller PipelineRun.

Initiera PipelineDraft.

PipelineEndpoint

Representerar ett Pipeline arbetsflöde som kan utlösas från en unik slutpunkts-URL.

PipelineEndpoints kan användas för att skapa nya versioner av en PublishedPipeline samtidigt som samma slutpunkt bibehålls. PipelineEndpoints namnges unikt på en arbetsyta.

Med hjälp av slutpunktsattributet för ett PipelineEndpoint-objekt kan du utlösa nya pipelinekörningar från externa program med REST-anrop. Information om hur du autentiserar när du anropar REST-slutpunkter finns i https://aka.ms/pl-restep-auth.

Mer information om hur du skapar och kör maskininlärningspipelines finns i https://aka.ms/pl-first-pipeline.

Initiera PipelineEndpoint.

PipelineParameter

Definierar en parameter i en pipelinekörning.

Använd PipelineParameters för att skapa mångsidiga pipelines som kan skickas på nytt senare med varierande parametervärden.

Initiera pipelineparametrar.

PipelineRun

Representerar en körning av en Pipeline.

Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när en pipelinekörning har skickats. Använd get_steps för att hämta de StepRun objekt som skapas av pipelinekörningen. Andra användningsområden är att hämta objektet Graph som är associerat med pipelinekörningen, hämta status för pipelinekörningen och vänta på att körningen ska slutföras.

Initiera en pipelinekörning.

PipelineStep

Representerar ett körningssteg i en Azure Machine Learning-pipeline.

Pipelines skapas från flera pipelinesteg, som är distinkta beräkningsenheter i pipelinen. Varje steg kan köras oberoende av varandra och använda isolerade beräkningsresurser. Varje steg har vanligtvis sina egna namngivna indata, utdata och parametrar.

Klassen PipelineStep är basklassen från vilken andra inbyggda stegklasser som är utformade för vanliga scenarier ärver, till exempel PythonScriptStep, DataTransferStepoch HyperDriveStep.

En översikt över hur Pipelines och PipelineSteps relaterar finns i Vad är ML-pipelines?

Initiera PipelineSteg.

PortDataReference

Modellerar data som är associerade med utdata från en slutförd StepRun.

Ett PortDataReference-objekt kan användas för att ladda ned utdata som skapades av en StepRun. Den kan också användas som stegindata i en framtida pipeline.

Initiera PortDataReference.

PublishedPipeline

Representerar en pipeline som ska skickas utan Python-koden som skapade den.

Dessutom kan en PublishedPipeline användas för att skicka om en Pipeline med olika PipelineParameter värden och indata.

Initiera PublishedPipeline.

:p ramslutpunkt REST-slutpunktens URL för att skicka pipelinekörningar för den här pipelinen. :type endpoint: str :p aram total_run_steps: Antalet steg i den här pipelinen :type total_run_steps: int :p aram workspace: Arbetsytan för den publicerade pipelinen. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Om du vill fortsätta köra andra steg i PipelineRun

Om ett steg misslyckas är standardvärdet falskt.

Schedule

Definierar ett schema som en pipeline ska skickas till.

När en pipeline har publicerats kan ett schema användas för att skicka pipelinen med ett angivet intervall eller när ändringar till en Blob Storage-plats identifieras.

Initiera schema.

ScheduleRecurrence

Definierar frekvens, intervall och starttid för en pipeline Schedule.

Med ScheduleRecurrence kan du också ange tidszon och timmar eller minuter eller veckodagar för upprepningen.

Initiera ett återkommande schema.

Det gör det också möjligt att ange tidszonen och timmar eller minuter eller veckodagar för upprepningen.

StepRun

En körning av ett steg i en Pipeline.

Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när den överordnade pipelinekörningen har skickats och pipelinen har skickat in stegkörningen.

Initiera en StepRun.

StepRunOutput

Representerar utdata som skapats av en StepRun i en pipeline.

StepRunOutput kan användas för att komma åt den PortDataReference som skapats av steget.

Initiera StepRunOutput.

StepSequence

Representerar en lista med steg i en Pipeline och i vilken ordning de ska köras.

Använd en StepSequence när du initierar en pipeline för att skapa ett arbetsflöde som innehåller steg som ska köras i en viss ordning.

Initiera StepSequence.

TrainingOutput

Definierar en specialiserad utdata för vissa PipelineSteg för användning i en pipeline.

TrainingOutput gör det möjligt att göra ett automatiserat maskininlärningsmått eller en modell tillgängligt som ett steg utdata som ska användas av ett annat steg i en Azure Machine Learning Pipeline. Kan användas med AutoMLStep eller HyperDriveStep.

Initiera TrainingOutput.

param model_file: Den specifika modellfil som ska ingå i utdata. Endast för HyperDriveStep .

Uppräkningar

TimeZone

Räknar upp giltiga tidszoner för en upprepning Schedule.