Delen via


core Pakket

Bevat kernfunctionaliteit voor Azure Machine Learning-pijplijnen. Dit zijn configureerbare machine learning-werkstromen.

Met Azure Machine Learning-pijplijnen kunt u herbruikbare machine learning-werkstromen maken die kunnen worden gebruikt als een sjabloon voor uw machine learning-scenario's. Dit pakket bevat de kernfunctionaliteit voor het werken met Azure ML-pijplijnen en wordt doorgaans samen met de klassen in het steps pakket gebruikt.

Een machine learning-pijplijn wordt vertegenwoordigd door een verzameling PipelineStep objecten die kunnen worden gesequentieerd en geparallelliseerd, of die kunnen worden gemaakt met expliciete afhankelijkheden tussen stappen. Pijplijnstappen worden gebruikt om een Pipeline object te definiëren dat de uit te voeren werkstroom vertegenwoordigt. U kunt pijplijnen maken en ermee werken in een Jupyter Notebook of een andere IDE waarop de Azure ML SDK is geïnstalleerd.

Met Azure ML-pijplijnen kunt u zich richten op machine learning in plaats van infrastructuur. Zie https://aka.ms/pl-first-pipelineom aan de slag te gaan met het bouwen van een pijplijn.

Zie Wat zijn ML-pijplijnen in Azure Machine Learning Service? voor meer informatie over de voordelen van de Machine Learning-pijplijn en hoe deze is gerelateerd aan andere pijplijnen die door Azure worden aangeboden.

Modules

builder

Definieert klassen voor het bouwen van een Azure Machine Learning-pijplijn.

Een pijplijngrafiek bestaat uit pijplijnstappen (PipelineStep), optionele pijplijngegevens (PipelineData) die in elke stap worden geproduceerd of gebruikt en een optionele uitvoeringsvolgorde (StepSequence).

graph

Definieert klassen voor het maken van Azure Machine Learning-pijplijngrafieken.

Azure ML-pijplijndiagrammen worden gemaakt voor Pipeline objecten wanneer u (en afgeleide klassen), PipelineDataen PipelineData -objecten gebruikt PipelineStep . In typische gebruiksvoorbeelden hoeft u de klassen in deze module niet rechtstreeks te gebruiken.

Een pijplijnuitvoeringsgrafiek bestaat uit moduleknooppunten die basiseenheden vertegenwoordigen, zoals een gegevensbron of stap. Knooppunten kunnen invoerpoorten en uitvoerpoorten en bijbehorende parameters hebben. Randen definiëren relaties tussen twee knooppuntpoorten in een grafiek.

module

Bevat klassen voor het maken en beheren van herbruikbare rekeneenheden van een Azure Machine Learning-pijplijn.

Met modules kunt u rekeneenheden maken in een Pipeline, die invoer en uitvoer kan hebben en afhankelijk kan zijn van parameters en een omgevingsconfiguratie. Een module kan worden gebruikt in verschillende Azure Machine Learning-pijplijnen, in tegenstelling tot PipelineStep (en afgeleide klassen) die in één pijplijn worden gebruikt.

Modules zijn ontworpen om opnieuw te worden gebruikt in verschillende pijplijnen en kunnen zich ontwikkelen om een specifieke berekeningslogica aan te passen voor verschillende use cases. Een stap in een pijplijn kan worden gebruikt in snelle iteraties om een algoritme te verbeteren. Zodra het doel is bereikt, wordt het algoritme meestal gepubliceerd als een module om hergebruik mogelijk te maken.

module_step_base

Bevat functionaliteit voor het toevoegen van een stap aan een pijplijn met behulp van een versie van een Module.

pipeline

Definieert de klasse voor het maken van herbruikbare Azure Machine Learning-werkstromen.

pipeline_draft

Definieert klassen voor het beheren van veranderlijke pijplijnen.

pipeline_endpoint

Definieert klassen voor het beheren van pijplijnen, waaronder versiebeheer en eindpunten.

pipeline_output_dataset

Bevat functionaliteit voor het promoveren van een tussenliggende uitvoer naar een Azure Machine Learning-gegevensset.

Tussenliggende gegevens (uitvoer) in een pijplijn worden standaard geen Azure Machine Learning-gegevensset. Als u tussenliggende gegevens wilt promoveren naar een Azure Machine Learning-gegevensset, roept u de as_dataset methode op de klasse PipelineData aan om een PipelineOutputFileDataset -object te retourneren. Vanuit een PipelineOutputFileDataset-object kunt u vervolgens een PipelineOutputTabularDataset -object maken.

run

Definieert klassen voor ingediende pijplijnen, inclusief klassen voor het controleren van de status en het ophalen van uitvoeringsdetails.

schedule

Definieert klassen voor het plannen van inzendingen van Azure Machine Learning-pijplijnen.

Klassen

InputPortBinding

Definieert een binding van een bron naar een invoer van een pijplijnstap.

Een InputPortBinding kan worden gebruikt als invoer voor een stap. De bron kan een PipelineData, PortDataReference, DataReference, PipelineDatasetof OutputPortBindingzijn.

InputPortBinding is handig om de naam van de stapinvoer op te geven, als deze anders moet zijn dan de naam van het bindingsobject (dat wil zeggen om dubbele invoer-/uitvoernamen te voorkomen of omdat het stapscript een invoer nodig heeft om een bepaalde naam te hebben). Het kan ook worden gebruikt om de bind_mode voor PythonScriptStep invoer op te geven.

Initialiseer InputPortBinding.

Module

Vertegenwoordigt een rekeneenheid die wordt gebruikt in een Azure Machine Learning-pijplijn.

Een module is een verzameling bestanden die wordt uitgevoerd op een rekendoel en een beschrijving van een interface. De verzameling bestanden kan script, binaire bestanden of andere bestanden zijn die nodig zijn om uit te voeren op het rekendoel. De module-interface beschrijft invoer, uitvoer en parameterdefinities. Ze worden niet gebonden aan specifieke waarden of gegevens. Aan een module is een momentopname gekoppeld, die de verzameling bestanden vastlegt die voor de module zijn gedefinieerd.

Module initialiseren.

ModuleVersion

Vertegenwoordigt de werkelijke rekeneenheid binnen een Module.

Gebruik deze klasse niet rechtstreeks. Gebruik in plaats daarvan een van de publicatiemethoden van de Module klasse.

Initialiseer ModuleVersion.

ModuleVersionDescriptor

Definieert de versie en id van een ModuleVersion.

Initialiseer ModuleVersionDescriptor.

OutputPortBinding

Definieert een benoemde uitvoer van een pijplijnstap.

OutputPortBinding kan worden gebruikt om het type gegevens op te geven dat door een stap wordt geproduceerd en hoe de gegevens worden geproduceerd. Deze kan worden gebruikt met InputPortBinding om op te geven dat de uitvoer van de stap een vereiste invoer van een andere stap is.

Initialiseer OutputPortBinding.

Pipeline

Vertegenwoordigt een verzameling stappen die kunnen worden uitgevoerd als een herbruikbare Azure Machine Learning-werkstroom.

Gebruik een pijplijn om werkstromen te maken en te beheren die verschillende machine learning-fasen aan elkaar koppelen. Elke machine learning-fase, zoals gegevensvoorbereiding en modeltraining, kan bestaan uit een of meer stappen in een pijplijn.

Zie voor een overzicht van waarom en wanneer u Pijplijnen gebruikt https://aka.ms/pl-concept.

Zie voor een overzicht van het maken van een pijplijn https://aka.ms/pl-first-pipeline.

Initialiseer pijplijn.

PipelineData

Vertegenwoordigt tussenliggende gegevens in een Azure Machine Learning-pijplijn.

Gegevens die in de pijplijn worden gebruikt, kunnen in één stap worden geproduceerd en in een andere stap worden gebruikt door een PipelineData-object op te geven als uitvoer van één stap en een invoer van een of meer volgende stappen.

Als u de pijplijngegevens gebruikt, moet u ervoor zorgen dat de gebruikte map bestaat.

Een Python-voorbeeld om ervoor te zorgen dat de map bestaat. Stel dat u een uitvoerpoort hebt met de naam output_folder in één pijplijnstap, wilt u enkele gegevens schrijven naar het relatieve pad in deze map.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData gebruikt onderliggende DataReference . Dit is niet langer de aanbevolen methode voor gegevenstoegang en -levering. Gebruik in plaats daarvan OutputFileDatasetConfig . U vindt hier een voorbeeld: Pijplijn met OutputFileDatasetConfig.

Initialiseer PipelineData.

PipelineDataset

Fungeert als een adapter voor gegevensset en pijplijn.

Notitie

Deze klasse is afgeschaft. Zie voor meer informatie over het gebruik van een gegevensset met pijplijn https://aka.ms/pipeline-with-dataset.

Dit is een interne klasse. U moet deze klasse niet rechtstreeks maken, maar de as_*-exemplaarmethoden aanroepen in de klassen Gegevensset of OutputDatasetConfig.

Fungeren als een adapter voor gegevensset en pijplijn.

Dit is een interne klasse. U moet deze klasse niet rechtstreeks maken, maar de as_*-exemplaarmethoden aanroepen in de klassen Gegevensset of OutputDatasetConfig.

PipelineDraft

Vertegenwoordigt een veranderlijke pijplijn die kan worden gebruikt om uitvoeringen te verzenden en gepubliceerde pijplijnen te maken.

Gebruik PipelineDrafts om pijplijnen te herhalen. PipelineDrafts kunnen helemaal zelf worden gemaakt, een andere PipelineDraft of bestaande pijplijnen: Pipeline, PublishedPipelineof PipelineRun.

Initialiseer PipelineDraft.

PipelineEndpoint

Vertegenwoordigt een Pipeline werkstroom die kan worden geactiveerd vanuit een unieke eindpunt-URL.

PipelineEndpoints kunnen worden gebruikt om nieuwe versies van een PublishedPipeline te maken met behoud van hetzelfde eindpunt. PipelineEndpoints hebben een unieke naam binnen een werkruimte.

Met behulp van het eindpuntkenmerk van een PipelineEndpoint-object kunt u nieuwe pijplijnuitvoeringen activeren vanuit externe toepassingen met REST-aanroepen. Zie voor meer informatie over het verifiëren bij het aanroepen van REST-eindpunten https://aka.ms/pl-restep-auth.

Zie voor meer informatie over het maken en uitvoeren van machine learning-pijplijnen https://aka.ms/pl-first-pipeline.

Initialiseer PipelineEndpoint.

PipelineParameter

Definieert een parameter in een pijplijnuitvoering.

Gebruik PipelineParameters om veelzijdige pijplijnen te maken die later opnieuw kunnen worden ingediend met verschillende parameterwaarden.

Pijplijnparameters initialiseren.

PipelineRun

Vertegenwoordigt een uitvoering van een Pipeline.

Deze klasse kan worden gebruikt voor het beheren, controleren van de status en het ophalen van uitvoeringsdetails zodra een pijplijnuitvoering is verzonden. Gebruik get_steps om de StepRun objecten op te halen die door de pijplijnuitvoering worden gemaakt. Andere toepassingen zijn het ophalen van het Graph object dat is gekoppeld aan de pijplijnuitvoering, het ophalen van de status van de pijplijnuitvoering en het wachten op voltooiing van de uitvoering.

Initialiseer een pijplijnuitvoering.

PipelineStep

Vertegenwoordigt een uitvoeringsstap in een Azure Machine Learning-pijplijn.

Pijplijnen worden samengesteld uit meerdere pijplijnstappen. Dit zijn afzonderlijke rekenkundige eenheden in de pijplijn. Elke stap kan onafhankelijk worden uitgevoerd en geïsoleerde rekenresources worden gebruikt. Elke stap heeft doorgaans zijn eigen benoemde invoer, uitvoer en parameters.

De klasse PipelineStep is de basisklasse waarvan andere ingebouwde stapklassen die zijn ontworpen voor algemene scenario's overnemen, zoals PythonScriptStep, DataTransferStepen HyperDriveStep.

Zie Wat zijn ML-pijplijnen voor een overzicht van de relatie tussen pijplijnen en pijplijnstappen.

Initialiseer PipelineStep.

PortDataReference

Modelleert gegevens die zijn gekoppeld aan een uitvoer van een voltooide StepRun.

Een PortDataReference-object kan worden gebruikt om de uitvoergegevens te downloaden die zijn geproduceerd door een StepRun. Het kan ook worden gebruikt als een stapinvoer in een toekomstige pijplijn.

Initialiseer PortDataReference.

PublishedPipeline

Vertegenwoordigt een pijplijn die moet worden verzonden zonder de Python-code waarmee deze is samengesteld.

Bovendien kan een PublishedPipeline worden gebruikt om een Pipeline opnieuw in te dienen met verschillende PipelineParameter waarden en invoer.

Initialiseer PublishedPipeline.

:p aram-eindpunt De REST-eindpunt-URL voor het verzenden van pijplijnuitvoeringen voor deze pijplijn. :type eindpunt: str :p aram total_run_steps: Het aantal stappen in deze pijplijn:type total_run_steps: int :p aram-werkruimte: De werkruimte van de gepubliceerde pijplijn. :type werkruimte: azureml.core.Workspace :p aram continue_on_step_failure: of u wilt doorgaan met de uitvoering van andere stappen in de PipelineRun

Als een stap mislukt, is de standaardwaarde false.

Schedule

Definieert een schema voor het verzenden van een pijplijn.

Zodra een pijplijn is gepubliceerd, kan een planning worden gebruikt om de pijplijn met een opgegeven interval te verzenden of wanneer wijzigingen in een Blob-opslaglocatie worden gedetecteerd.

Planning initialiseren.

ScheduleRecurrence

Definieert de frequentie, het interval en de begintijd van een pijplijn Schedule.

Met ScheduleRecurrence kunt u ook de tijdzone en de uren of minuten of weekdagen voor het terugkeerpatroon opgeven.

Initialiseer een schema-terugkeerpatroon.

Hiermee kunt u ook de tijdzone en de uren of minuten of weekdagen voor het terugkeerpatroon opgeven.

StepRun

Een uitvoering van een stap in een Pipeline.

Deze klasse kan worden gebruikt voor het beheren, controleren van de status en het ophalen van uitvoeringsdetails zodra de bovenliggende pijplijn is verzonden en de pijplijn de stapuitvoering heeft verzonden.

Initialiseer een StepRun.

StepRunOutput

Vertegenwoordigt een uitvoer die is gemaakt door een StepRun in een pijplijn.

StepRunOutput kan worden gebruikt voor toegang tot de PortDataReference die door de stap is gemaakt.

Initialiseer StepRunOutput.

StepSequence

Vertegenwoordigt een lijst met stappen in een Pipeline en de volgorde waarin deze moeten worden uitgevoerd.

Gebruik een StepSequence bij het initialiseren van een pijplijn om een werkstroom te maken die stappen bevat om in een specifieke volgorde uit te voeren.

Initialiseer StepSequence.

TrainingOutput

Definieert een gespecialiseerde uitvoer van bepaalde PipelineSteps voor gebruik in een pijplijn.

TrainingOutput maakt het mogelijk om een geautomatiseerde machine learning-metrische waarde of -model beschikbaar te maken als stapuitvoer die moet worden gebruikt door een andere stap in een Azure Machine Learning-pijplijn. Kan worden gebruikt met AutoMLStep of HyperDriveStep.

Initialiseer TrainingOutput.

param model_file: het specifieke modelbestand dat moet worden opgenomen in de uitvoer. Alleen voor HyperDriveStep .

Enums

TimeZone

Inventariseert de geldige tijdzones voor een terugkeerpatroon Schedule.