core Paket
Innehåller grundläggande funktioner för Azure Machine Learning-pipelines, som är konfigurerbara arbetsflöden för maskininlärning.
Med Azure Machine Learning-pipelines kan du skapa återanvändbara arbetsflöden för maskininlärning som kan användas som mall för dina maskininlärningsscenarier. Det här paketet innehåller kärnfunktionerna för att arbeta med Azure ML-pipelines och används vanligtvis tillsammans med klasserna i steps paketet.
En maskininlärningspipeline representeras av en samling PipelineStep objekt som kan sekvenseras och parallelliseras, eller skapas med explicita beroenden mellan steg. Pipelinesteg används för att definiera ett Pipeline objekt som representerar arbetsflödet som ska köras. Du kan skapa och arbeta med pipelines i en Jupyter Notebook eller någon annan IDE med Azure ML SDK installerat.
Med Azure ML-pipelines kan du fokusera på maskininlärning snarare än infrastruktur. Information om hur du kommer igång med att skapa en pipeline finns i https://aka.ms/pl-first-pipeline.
Mer information om fördelarna med Machine Learning Pipeline och hur den är relaterad till andra pipelines som erbjuds av Azure finns i Vad är ML-pipelines i Azure Machine Learning-tjänsten?
Moduler
builder |
Definierar klasser för att skapa en Azure Machine Learning-pipeline. Ett pipelinediagram består av pipelinesteg (PipelineStep), valfria pipelinedata (PipelineData) som skapas eller förbrukas i varje steg och en valfri stegkörningssekvens (StepSequence). |
graph |
Definierar klasser för att skapa Azure Machine Learning-pipelinediagram. Azure ML-pipelinediagram skapas för Pipeline objekt när du använder PipelineStep (och härledda klasser), PipelineDataoch PipelineData -objekt. I vanliga användningsfall behöver du inte använda klasserna direkt i den här modulen. Ett pipelinekörningsdiagram består av modulnoder som representerar grundläggande enheter, till exempel en datakälla eller ett steg. Noder kan ha indataportar, utdataportar och associerade parametrar. Kanter definierar relationer mellan två nodportar i en graf. |
module |
Innehåller klasser för att skapa och hantera återanvändbara beräkningsenheter för en Azure Machine Learning-pipeline. Med moduler kan du skapa beräkningsenheter i en Pipeline, som kan ha indata, utdata och förlita sig på parametrar och en miljökonfiguration för att fungera. En modul kan versionshanteras och användas i olika Azure Machine Learning-pipelines till skillnad från PipelineStep (och härledda klasser) som används i en pipeline. Moduler är utformade för att återanvändas i flera pipelines och kan utvecklas för att anpassa en specifik beräkningslogik för olika användningsfall. Ett steg i en pipeline kan användas i snabba iterationer för att förbättra en algoritm, och när målet har uppnåtts publiceras algoritmen vanligtvis som en modul för att möjliggöra återanvändning. |
module_step_base |
Innehåller funktioner för att lägga till ett steg i en pipeline med hjälp av en version av en Module. |
pipeline |
Definierar klassen för att skapa återanvändbara Azure Machine Learning-arbetsflöden. |
pipeline_draft |
Definierar klasser för hantering av föränderliga pipelines. |
pipeline_endpoint |
Definierar klasser för hantering av pipelines, inklusive versionshantering och slutpunkter. |
pipeline_output_dataset |
Innehåller funktioner för att höja upp mellanliggande utdata till en Azure Machine Learning-datauppsättning. Mellanliggande data (utdata) i en pipeline blir som standard inte en Azure Machine Learning-datauppsättning. Om du vill flytta upp mellanliggande data till en Azure Machine Learning-datauppsättning anropar as_dataset du metoden i klassen PipelineData för att returnera ett PipelineOutputFileDataset -objekt. Från ett PipelineOutputFileDataset-objekt kan du sedan skapa ett PipelineOutputTabularDataset -objekt. |
run |
Definierar klasser för skickade pipelines, inklusive klasser för att kontrollera status och hämta körningsinformation. |
schedule |
Definierar klasser för schemaläggning av inlämningar av Azure Machine Learning-pipelines. |
Klasser
InputPortBinding |
Definierar en bindning från en källa till indata för ett pipelinesteg. En InputPortBinding kan användas som indata till ett steg. Källan kan vara , PipelineDataPortDataReference, DataReference, PipelineDataseteller OutputPortBinding. InputPortBinding är användbart för att ange namnet på stegindata, om det ska skilja sig från namnet på bindningsobjektet (d.v.s. för att undvika dubbletter av indata-/utdatanamn eller för att stegskriptet behöver en indata för att ha ett visst namn). Den kan också användas för att ange bind_mode för PythonScriptStep indata. Initiera InputPortBinding. |
Module |
Representerar en beräkningsenhet som används i en Azure Machine Learning-pipeline. En modul är en samling filer som körs på ett beräkningsmål och en beskrivning av ett gränssnitt. Samlingen med filer kan vara skript, binärfiler eller andra filer som krävs för att köras på beräkningsmålet. Modulgränssnittet beskriver indata, utdata och parameterdefinitioner. Den binder dem inte till specifika värden eller data. En modul har en ögonblicksbild som är associerad med den, som samlar in den samling filer som definierats för modulen. Initiera modulen. |
ModuleVersion |
Representerar den faktiska beräkningsenheten i en Module. Du bör inte använda den här klassen direkt. Använd i stället någon av publiceringsmetoderna för Module klassen. Initiera ModuleVersion. |
ModuleVersionDescriptor |
Definierar versionen och ID:t för en ModuleVersion. Initiera ModuleVersionDescriptor. |
OutputPortBinding |
Definierar ett namngivet utdata från ett pipelinesteg. OutputPortBinding kan användas för att ange vilken typ av data som ska skapas i ett steg och hur data ska skapas. Du kan använda den med InputPortBinding för att ange att stegutdata är nödvändiga indata för ett annat steg. Initiera OutputPortBinding. |
Pipeline |
Representerar en samling steg som kan köras som ett återanvändbart Azure Machine Learning-arbetsflöde. Använd en pipeline för att skapa och hantera arbetsflöden som sammanfogar olika maskininlärningsfaser. Varje maskininlärningsfas, till exempel förberedelse av data och modellträning, kan bestå av ett eller flera steg i en pipeline. En översikt över varför och när du ska använda pipelines finns i https://aka.ms/pl-concept. En översikt över hur du skapar en pipeline finns i https://aka.ms/pl-first-pipeline. Initiera pipeline. |
PipelineData |
Representerar mellanliggande data i en Azure Machine Learning-pipeline. Data som används i pipeline kan skapas i ett steg och användas i ett annat steg genom att tillhandahålla ett PipelineData-objekt som utdata från ett steg och indata för ett eller flera efterföljande steg. Observera att om du använder pipelinedata kontrollerar du att katalogen som används finns. Ett python-exempel för att säkerställa att katalogen finns, anta att du har en utdataport med namnet output_folder i ett pipelinesteg. Du vill skriva data till en relativ sökväg i den här mappen.
PipelineData använder underliggande DataReference som inte längre är den rekommenderade metoden för dataåtkomst och -leverans. Använd OutputFileDatasetConfig i stället. Du hittar exempel här: Pipeline med OutputFileDatasetConfig. Initiera PipelineData. |
PipelineDataset |
Fungerar som ett kort för datauppsättning och pipeline. Anteckning Den här klassen är inaktuell. Läs mer om hur du använder datauppsättning med pipeline https://aka.ms/pipeline-with-dataseti . Det här är en intern klass. Du bör inte skapa den här klassen direkt utan snarare anropa instansmetoderna as_* i klasserna Dataset eller OutputDatasetConfig. Fungera som ett kort för datauppsättning och pipeline. Det här är en intern klass. Du bör inte skapa den här klassen direkt utan snarare anropa instansmetoderna as_* i klasserna Dataset eller OutputDatasetConfig. |
PipelineDraft |
Representerar en föränderlig pipeline som kan användas för att skicka körningar och skapa publicerade pipelines. Använd PipelineDrafts för att iterera i pipelines. PipelineDrafts kan skapas från grunden, en annan PipelineDraft eller befintliga pipelines: Pipeline, PublishedPipelineeller PipelineRun. Initiera PipelineDraft. |
PipelineEndpoint |
Representerar ett Pipeline arbetsflöde som kan utlösas från en unik slutpunkts-URL. PipelineEndpoints kan användas för att skapa nya versioner av en PublishedPipeline samtidigt som samma slutpunkt bibehålls. PipelineEndpoints namnges unikt på en arbetsyta. Med hjälp av slutpunktsattributet för ett PipelineEndpoint-objekt kan du utlösa nya pipelinekörningar från externa program med REST-anrop. Information om hur du autentiserar när du anropar REST-slutpunkter finns i https://aka.ms/pl-restep-auth. Mer information om hur du skapar och kör maskininlärningspipelines finns i https://aka.ms/pl-first-pipeline. Initiera PipelineEndpoint. |
PipelineParameter |
Definierar en parameter i en pipelinekörning. Använd PipelineParameters för att skapa mångsidiga pipelines som kan skickas på nytt senare med varierande parametervärden. Initiera pipelineparametrar. |
PipelineRun |
Representerar en körning av en Pipeline. Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när en pipelinekörning har skickats. Använd get_steps för att hämta de StepRun objekt som skapas av pipelinekörningen. Andra användningsområden är att hämta objektet Graph som är associerat med pipelinekörningen, hämta status för pipelinekörningen och vänta på att körningen ska slutföras. Initiera en pipelinekörning. |
PipelineStep |
Representerar ett körningssteg i en Azure Machine Learning-pipeline. Pipelines skapas från flera pipelinesteg, som är distinkta beräkningsenheter i pipelinen. Varje steg kan köras oberoende av varandra och använda isolerade beräkningsresurser. Varje steg har vanligtvis sina egna namngivna indata, utdata och parametrar. Klassen PipelineStep är basklassen från vilken andra inbyggda stegklasser som är utformade för vanliga scenarier ärver, till exempel PythonScriptStep, DataTransferStepoch HyperDriveStep. En översikt över hur Pipelines och PipelineSteps relaterar finns i Vad är ML-pipelines? Initiera PipelineSteg. |
PortDataReference |
Modellerar data som är associerade med utdata från en slutförd StepRun. Ett PortDataReference-objekt kan användas för att ladda ned utdata som skapades av en StepRun. Den kan också användas som stegindata i en framtida pipeline. Initiera PortDataReference. |
PublishedPipeline |
Representerar en pipeline som ska skickas utan Python-koden som skapade den. Dessutom kan en PublishedPipeline användas för att skicka om en Pipeline med olika PipelineParameter värden och indata. Initiera PublishedPipeline. :p ramslutpunkt REST-slutpunktens URL för att skicka pipelinekörningar för den här pipelinen. :type endpoint: str :p aram total_run_steps: Antalet steg i den här pipelinen :type total_run_steps: int :p aram workspace: Arbetsytan för den publicerade pipelinen. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Om du vill fortsätta köra andra steg i PipelineRun Om ett steg misslyckas är standardvärdet falskt. |
Schedule |
Definierar ett schema som en pipeline ska skickas till. När en pipeline har publicerats kan ett schema användas för att skicka pipelinen med ett angivet intervall eller när ändringar till en Blob Storage-plats identifieras. Initiera schema. |
ScheduleRecurrence |
Definierar frekvens, intervall och starttid för en pipeline Schedule. Med ScheduleRecurrence kan du också ange tidszon och timmar eller minuter eller veckodagar för upprepningen. Initiera ett återkommande schema. Det gör det också möjligt att ange tidszonen och timmar eller minuter eller veckodagar för upprepningen. |
StepRun |
En körning av ett steg i en Pipeline. Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när den överordnade pipelinekörningen har skickats och pipelinen har skickat in stegkörningen. Initiera en StepRun. |
StepRunOutput |
Representerar utdata som skapats av en StepRun i en pipeline. StepRunOutput kan användas för att komma åt den PortDataReference som skapats av steget. Initiera StepRunOutput. |
StepSequence |
Representerar en lista med steg i en Pipeline och i vilken ordning de ska köras. Använd en StepSequence när du initierar en pipeline för att skapa ett arbetsflöde som innehåller steg som ska köras i en viss ordning. Initiera StepSequence. |
TrainingOutput |
Definierar en specialiserad utdata för vissa PipelineSteg för användning i en pipeline. TrainingOutput gör det möjligt att göra ett automatiserat maskininlärningsmått eller en modell tillgängligt som ett steg utdata som ska användas av ett annat steg i en Azure Machine Learning Pipeline. Kan användas med AutoMLStep eller HyperDriveStep. Initiera TrainingOutput. param model_file: Den specifika modellfil som ska ingå i utdata. Endast för HyperDriveStep . |
Uppräkningar
TimeZone |
Räknar upp giltiga tidszoner för en upprepning Schedule. |
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för