core Paket
Innehåller grundläggande funktioner för Azure Machine Learning-pipelines, som är konfigurerbara arbetsflöden för maskininlärning.
Med Azure Machine Learning-pipelines kan du skapa återanvändbara maskininlärningsarbetsflöden som kan användas som mall för dina maskininlärningsscenarier. Det här paketet innehåller huvudfunktionerna för att arbeta med Azure ML-pipelines och används vanligtvis tillsammans med klasserna i steps paketet.
En maskininlärningspipeline representeras av en samling PipelineStep objekt som kan sekvenseras och parallelliseras, eller skapas med explicita beroenden mellan stegen. Pipelinesteg används för att definiera ett Pipeline objekt som representerar arbetsflödet som ska köras. Du kan skapa och arbeta med pipelines i en Jupyter Notebook eller någon annan IDE med Azure ML SDK installerat.
Med Azure ML-pipelines kan du fokusera på maskininlärning i stället för infrastruktur. Information om hur du kommer igång med att skapa en pipeline finns i https://aka.ms/pl-first-pipeline.
Mer information om fördelarna med Machine Learning-pipelinen och hur den är relaterad till andra pipelines som erbjuds av Azure finns i Vad är ML-pipelines i Azure Machine Learning Service?
Moduler
builder |
Definierar klasser för att skapa en Azure Machine Learning-pipeline. Ett pipelinediagram består av pipelinesteg (PipelineStep), valfria pipelinedata (PipelineData) som produceras eller används i varje steg och en valfri stegkörningssekvens (StepSequence). |
graph |
Definierar klasser för att skapa Azure Machine Learning-pipelinediagram. Azure ML-pipelinediagram skapas för Pipeline objekt när du använder PipelineStep (och härledda klasser), PipelineDataoch PipelineData objekt. I vanliga användningsfall behöver du inte använda klasserna direkt i den här modulen. Ett pipeline-körningsdiagram består av modulnoder som representerar grundläggande enheter, till exempel en datakälla eller ett steg. Noder kan ha indataportar och utdataportar och associerade parametrar. Kanter definierar relationer mellan två nodportar i en graf. |
module |
Innehåller klasser för att skapa och hantera återanvändbara beräkningsenheter för en Azure Machine Learning-pipeline. Med moduler kan du skapa beräkningsenheter i en Pipeline, som kan ha indata, utdata och förlita sig på parametrar och en miljökonfiguration för att fungera. En modul kan versionshanteras och användas i olika Azure Machine Learning-pipelines till skillnad från PipelineStep (och härledda klasser) som används i en pipeline. Moduler är utformade för att återanvändas i flera pipelines och kan utvecklas för att anpassa en specifik beräkningslogik för olika användningsfall. Ett steg i en pipeline kan användas i snabba iterationer för att förbättra en algoritm, och när målet har uppnåtts publiceras algoritmen vanligtvis som en modul för att aktivera återanvändning. |
module_step_base |
Innehåller funktioner för att lägga till ett steg i en pipeline med hjälp av en version av en Module. |
pipeline |
Definierar klassen för att skapa återanvändbara Azure Machine Learning-arbetsflöden. |
pipeline_draft |
Definierar klasser för hantering av föränderliga pipelines. |
pipeline_endpoint |
Definierar klasser för hantering av pipelines, inklusive versionshantering och slutpunkter. |
pipeline_output_dataset |
Innehåller funktioner för att främja mellanliggande utdata till en Azure Machine Learning-datauppsättning. Mellanliggande data (utdata) i en pipeline blir som standard inte en Azure Machine Learning-datauppsättning. Om du vill höja upp mellanliggande data till en Azure Machine Learning-datauppsättning anropar as_dataset du metoden i klassen PipelineData för att returnera ett PipelineOutputFileDataset objekt. Från ett PipelineOutputFileDataset-objekt kan du sedan skapa ett PipelineOutputTabularDataset objekt. |
run |
Definierar klasser för skickade pipelines, inklusive klasser för att kontrollera status och hämta körningsinformation. |
schedule |
Definierar klasser för schemaläggning av inskickade Azure Machine Learning-pipelines. |
Klasser
InputPortBinding |
Definierar en bindning från en källa till indata från ett pipelinesteg. En InputPortBinding kan användas som indata till ett steg. Källan kan vara , PipelineDataPortDataReference, DataReference, PipelineDataseteller OutputPortBinding. InputPortBinding är användbart för att ange namnet på stegindata, om det ska vara annorlunda än namnet på bindningsobjektet (dvs. för att undvika duplicerade indata-/utdatanamn eller för att stegskriptet behöver en indata för att ha ett visst namn). Den kan också användas för att ange bind_mode för PythonScriptStep indata. Initiera InputPortBinding. |
Module |
Representerar en beräkningsenhet som används i en Azure Machine Learning-pipeline. En modul är en samling filer som körs på ett beräkningsmål och en beskrivning av ett gränssnitt. Samlingen av filer kan vara skript, binärfiler eller andra filer som krävs för att köras på beräkningsmålet. Modulgränssnittet beskriver indata, utdata och parameterdefinitioner. Den binder dem inte till specifika värden eller data. En modul har en associerad ögonblicksbild som samlar in den samling filer som definierats för modulen. Initiera modulen. |
ModuleVersion |
Representerar den faktiska beräkningsenheten i en Module. Du bör inte använda den här klassen direkt. Använd i stället någon av publiceringsmetoderna för Module klassen. Initiera ModuleVersion. |
ModuleVersionDescriptor |
Definierar versionen och ID:t för en ModuleVersion. Initiera ModuleVersionDescriptor. |
OutputPortBinding |
Definierar ett namngivet utdata från ett pipelinesteg. OutputPortBinding kan användas för att ange vilken typ av data som ska skapas i ett steg och hur data ska skapas. Det kan användas med InputPortBinding för att ange att stegutdata är nödvändiga indata för ett annat steg. Initiera OutputPortBinding. |
Pipeline |
Representerar en samling steg som kan köras som ett återanvändbart Azure Machine Learning-arbetsflöde. Använd en pipeline för att skapa och hantera arbetsflöden som sammanfogar olika maskininlärningsfaser. Varje maskininlärningsfas, till exempel förberedelse av data och modellträning, kan bestå av ett eller flera steg i en pipeline. En översikt över varför och när du ska använda Pipelines finns i https://aka.ms/pl-concept. En översikt över hur du skapar en pipeline finns i https://aka.ms/pl-first-pipeline. Initiera pipeline. |
PipelineData |
Representerar mellanliggande data i en Azure Machine Learning-pipeline. Data som används i pipeline kan produceras i ett steg och förbrukas i ett annat steg genom att tillhandahålla ett PipelineData-objekt som utdata från ett steg och indata från ett eller flera efterföljande steg. Observera att om du använder pipelinedata kontrollerar du att katalogen som används finns. Ett Python-exempel för att säkerställa att katalogen finns, anta att du har en utdataport med namnet output_folder i ett pipelinesteg. Du vill skriva data till en relativ sökväg i den här mappen.
PipelineData använder underliggande DataReference som inte längre är den rekommenderade metoden för dataåtkomst och leverans. Använd OutputFileDatasetConfig i stället. Du hittar exempel här: Pipeline med OutputFileDatasetConfig. Initiera PipelineData. |
PipelineDataset |
Fungerar som ett kort för datauppsättning och pipeline. Anteckning Den här klassen är inaktuell. Läs mer om hur du använder datauppsättning med pipeline i https://aka.ms/pipeline-with-dataset. Det här är en intern klass. Du bör inte skapa den här klassen direkt utan anropa instansmetoderna as_* i datauppsättningen eller OutputDatasetConfig-klasserna. Fungera som ett kort för datauppsättning och pipeline. Det här är en intern klass. Du bör inte skapa den här klassen direkt utan anropa instansmetoderna as_* i datauppsättningen eller OutputDatasetConfig-klasserna. |
PipelineDraft |
Representerar en föränderlig pipeline som kan användas för att skicka körningar och skapa publicerade pipelines. Använd PipelineDrafts för att iterera i pipelines. PipelineDrafts kan skapas från grunden, en annan PipelineDraft eller befintliga pipelines: Pipeline, PublishedPipelineeller PipelineRun. Initiera PipelineDraft. |
PipelineEndpoint |
Representerar ett Pipeline arbetsflöde som kan utlösas från en unik slutpunkts-URL. PipelineEndpoints kan användas för att skapa nya versioner av en PublishedPipeline samtidigt som samma slutpunkt bibehålls. PipelineEndpoints är unikt namngivna i en arbetsyta. Med hjälp av slutpunktsattributet för ett PipelineEndpoint-objekt kan du utlösa nya pipelinekörningar från externa program med REST-anrop. Information om hur du autentiserar när du anropar REST-slutpunkter finns i https://aka.ms/pl-restep-auth. Mer information om hur du skapar och kör maskininlärningspipelines finns i https://aka.ms/pl-first-pipeline. Initiera PipelineEndpoint. |
PipelineParameter |
Definierar en parameter i en pipelinekörning. Använd PipelineParameters för att skapa mångsidiga pipelines som kan skickas senare med varierande parametervärden. Initiera pipelineparametrar. |
PipelineRun |
Representerar en körning av en Pipeline. Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när en pipelinekörning har skickats. Använd get_steps för att hämta de StepRun objekt som skapas av pipelinekörningen. Andra användningsområden är att hämta objektet Graph som är associerat med pipelinekörningen, hämta status för pipelinekörningen och vänta på att körningen ska slutföras. Initiera en pipelinekörning. |
PipelineStep |
Representerar ett körningssteg i en Azure Machine Learning-pipeline. Pipelines skapas från flera pipelinesteg, som är distinkta beräkningsenheter i pipelinen. Varje steg kan köras oberoende av varandra och använda isolerade beräkningsresurser. Varje steg har vanligtvis egna namngivna indata, utdata och parametrar. Klassen PipelineStep är basklassen från vilken andra inbyggda stegklasser som PythonScriptSteputformats för vanliga scenarier ärver, till exempel , DataTransferStepoch HyperDriveStep. En översikt över hur pipelines och pipelinesteg relaterar finns i Vad är ML-pipelines. Initiera PipelineStep. |
PortDataReference |
Modellerar data som är associerade med utdata från en slutförd StepRun. Ett PortDataReference-objekt kan användas för att ladda ned utdata som skapades av en StepRun. Det kan också användas som stegindata i en framtida pipeline. Initiera PortDataReference. |
PublishedPipeline |
Representerar en pipeline som ska skickas utan Den Python-kod som skapade den. Dessutom kan en PublishedPipeline användas för att skicka om en Pipeline med olika PipelineParameter värden och indata. Initiera PublishedPipeline. :p ramslutpunkt REST-slutpunktens URL för att skicka pipelinekörningar för den här pipelinen. :type endpoint: str :p aram total_run_steps: Antalet steg i den här pipelinen :type total_run_steps: int :p aram workspace: Arbetsytan för den publicerade pipelinen. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Om du vill fortsätta köra andra steg i PipelineRun Om ett steg misslyckas är standardvärdet falskt. |
Schedule |
Definierar ett schema som du vill skicka en pipeline för. När en pipeline har publicerats kan ett schema användas för att skicka pipelinen med ett angivet intervall eller när ändringar på en Blob Storage-plats identifieras. Initiera Schema. |
ScheduleRecurrence |
Definierar frekvens, intervall och starttid för en pipeline Schedule. Med ScheduleRecurrence kan du också ange tidszon och timmar eller minuter eller veckodagar för upprepningen. Initiera en upprepning av schemat. Det gör det också möjligt att ange tidszon och timmar eller minuter eller veckodagar för upprepningen. |
StepRun |
En körning av ett steg i en Pipeline. Den här klassen kan användas för att hantera, kontrollera status och hämta körningsinformation när den överordnade pipelinekörningen har skickats och pipelinen har skickat stegkörningen. Initiera en StepRun. |
StepRunOutput |
Representerar utdata som skapats av en StepRun i en pipeline. StepRunOutput kan användas för att komma åt som PortDataReference skapats av steget. Initiera StepRunOutput. |
StepSequence |
Representerar en lista över steg i en Pipeline och i vilken ordning de ska köras. Använd en StepSequence när du initierar en pipeline för att skapa ett arbetsflöde som innehåller steg som ska köras i en viss ordning. Initiera StepSequence. |
TrainingOutput |
Definierar specialiserade utdata för vissa PipelineSteg för användning i en pipeline. TrainingOutput gör det möjligt att göra ett automatiserat maskininlärningsmått eller en modell tillgängligt som ett stegs utdata som kan användas med ett annat steg i en Azure Machine Learning-pipeline. Kan användas med AutoMLStep eller HyperDriveStep. Initiera TrainingOutput. param model_file: Den specifika modellfilen som ska ingå i utdata. Endast för HyperDriveStep . |
Uppräkningar
TimeZone |
Räknar upp giltiga tidszoner för en upprepning Schedule. |