RScriptStep Klasse

Hinweis

Dies ist eine experimentelle Klasse und kann sich jederzeit ändern. Weitere Informationen finden Sie unter https://aka.ms/azuremlexperimental.

Erstellt einen Azure ML-Pipelineschritt, der R-Skript ausführt.

Erstellen Sie einen Azure ML-Pipelineschritt, der R-Skript ausführt.

VERALTET. Verwenden Sie stattdessen die CommandStep Ein Beispiel finden Sie unter Ausführen von R-Skripts in Pipelines mit CommandStep.

Konstruktor

RScriptStep(script_name, name=None, arguments=None, compute_target=None, runconfig=None, runconfig_pipeline_params=None, inputs=None, outputs=None, params=None, source_directory=None, use_gpu=False, custom_docker_image=None, cran_packages=None, github_packages=None, custom_url_packages=None, allow_reuse=True, version=None)

Parameter

Name	Beschreibung
script_name Erforderlich	str [Erforderlich] Der Name eines R-Skripts relativ zu `source_directory`.
name Erforderlich	str Der Name des Schritts. Wird nicht angegeben, `script_name` wird verwendet.
arguments Erforderlich	list Befehlszeilenargumente für die R-Skriptdatei. Die Argumente werden über den Parameter in RunConfiguration an die `arguments` Berechnung übergeben. Weitere Informationen zum Behandeln von Argumenten wie Sondersymbolen finden Sie unter .RunConfiguration
compute_target Erforderlich	Union[DsvmCompute, AmlCompute, RemoteCompute, HDInsightCompute, str, tuple] [Erforderlich] Das zu verwendende Computeziel. Wenn nicht angegeben, wird das Ziel aus dem `runconfig` Ziel verwendet. Dieser Parameter kann als Computezielobjekt oder als Zeichenfolgenname eines Computeziels im Arbeitsbereich angegeben werden. Wenn das Computeziel zur Pipelineerstellungszeit nicht verfügbar ist, können Sie ein Tupel von ('Computezielname', 'Computezieltyp') angeben, um das Abrufen des Computezielobjekts zu vermeiden (AmlCompute-Typ ist 'AmlCompute' und RemoteCompute-Typ ist 'VirtualMachine').
runconfig Erforderlich	RunConfiguration [Erforderlich] Führen Sie die Konfiguration aus, die die zum Übermitteln einer Schulung in einem Experiment erforderlichen Informationen kapselt. Dies ist erforderlich, um R-Run-Konfigurationen zu definieren, die definiert werden können.RSection Der RSection ist für diesen Schritt erforderlich.
runconfig_pipeline_params Erforderlich	dict[str, PipelineParameter] Außerkraftsetzungen von Runconfig-Eigenschaften zur Laufzeit mithilfe von Schlüssel-Wert-Paaren mit dem Namen der runconfig-Eigenschaft und PipelineParameter für diese Eigenschaft. Unterstützte Werte: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount'
inputs Erforderlich	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputFileDataset, PipelineOutputTabularDataset, DatasetConsumptionConfig]] Eine Liste der Eingabeportbindungen.
outputs Erforderlich	list[Union[PipelineData, OutputDatasetConfig, PipelineOutputAbstractDataset, OutputPortBinding]] Eine Liste der Ausgabeportbindungen.
params Erforderlich	dict Ein Wörterbuch mit Namen-Wert-Paaren, die als Umgebungsvariablen mit "AML_PARAMETER_" registriert sind.
source_directory Erforderlich	str Ein Ordner mit R-Skript, Conda env und anderen Ressourcen, die im Schritt verwendet werden.
use_gpu Erforderlich	bool Gibt an, ob die Umgebung, in der das Experiment ausgeführt werden soll, GPUs unterstützen soll. Bei "True" wird ein GPU-basiertes Docker-Standardimage in der Umgebung verwendet. Wenn False, wird ein CPU-basiertes Image verwendet. Standardmäßige Docker-Images (CPU oder GPU) werden nur verwendet, wenn ein Benutzer nicht beide Und `base_imagebase_dockerfile` Parameter festgelegt. Diese Einstellung wird nur in Docker-fähigen Computezielen verwendet. Weitere Informationen finden Sie https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.environment.dockersection unter `base_image`.
custom_docker_image Erforderlich	str Der Name des Docker-Images, aus dem das für Schulungen zu verwendende Image erstellt wird. Wenn nicht festgelegt, wird ein CPU-basiertes Standardimage als Basisimage verwendet. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen base_image in DockerSection.
cran_packages Erforderlich	list CRAN-Pakete, die installiert werden sollen. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen RSection.cran_packages.
github_packages Erforderlich	list GitHub-Pakete, die installiert werden sollen. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen RSection.github_packages.
custom_url_packages Erforderlich	list Pakete, die über lokale, verzeichnis- oder benutzerdefinierte URL installiert werden sollen. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen RSection.custom_url_packages.
allow_reuse Erforderlich	bool Gibt an, ob der Schritt vorherige Ergebnisse wiederverwenden soll, wenn er mit denselben Einstellungen erneut ausgeführt wird. Die Wiederverwendung ist standardmäßig aktiviert. Wenn der Schrittinhalt (Skripts/Abhängigkeiten) sowie Eingaben und Parameter unverändert bleiben, wird die Ausgabe aus der vorherigen Ausführung dieses Schritts wiederverwendet. Beim Erneuten Verwenden des Schritts werden die Ergebnisse aus der vorherigen Ausführung sofort allen nachfolgenden Schritten zur Verfügung gestellt, anstatt den Auftrag zur Berechnung zu übermitteln. Wenn Sie Azure Machine Learning-Datasets als Eingaben verwenden, wird die Wiederverwendung bestimmt, ob sich die Definition des Datasets geändert hat, nicht durch die Änderung der zugrunde liegenden Daten.
version Erforderlich	str Ein optionales Versionstag, um eine Änderung der Funktionalität für den Schritt zu kennzeichnen.
script_name Erforderlich	str [Erforderlich] Der Name eines R-Skripts relativ zu `source_directory`.
name Erforderlich	str Der Name des Schritts. Wird nicht angegeben, `script_name` wird verwendet.
arguments Erforderlich	list Befehlszeilenargumente für die R-Skriptdatei. Die Argumente werden über den Parameter in RunConfiguration an die `arguments` Berechnung übergeben. Weitere Informationen zum Behandeln von Argumenten wie Sondersymbolen finden Sie unter .RunConfiguration
compute_target Erforderlich	Union[DsvmCompute, AmlCompute, RemoteCompute, HDInsightCompute, str, tuple] [Erforderlich] Das zu verwendende Computeziel. Wenn nicht angegeben, wird das Ziel aus dem `runconfig` Ziel verwendet. Dieser Parameter kann als Computezielobjekt oder als Zeichenfolgenname eines Computeziels im Arbeitsbereich angegeben werden. Wenn das Computeziel zur Pipelineerstellungszeit nicht verfügbar ist, können Sie ein Tupel von ('Computezielname', 'Computezieltyp') angeben, um das Abrufen des Computezielobjekts zu vermeiden (AmlCompute-Typ ist 'AmlCompute' und RemoteCompute-Typ ist 'VirtualMachine').
runconfig Erforderlich	RunConfiguration [Erforderlich] Führen Sie die Konfiguration aus, die die zum Übermitteln einer Schulung in einem Experiment erforderlichen Informationen kapselt. Dies ist erforderlich, um R-Run-Konfigurationen zu definieren, die definiert werden können.RSection Der RSection ist für diesen Schritt erforderlich.
runconfig_pipeline_params Erforderlich	dict[str, PipelineParameter] Außerkraftsetzungen von Runconfig-Eigenschaften zur Laufzeit mithilfe von Schlüssel-Wert-Paaren mit dem Namen der runconfig-Eigenschaft und PipelineParameter für diese Eigenschaft. Unterstützte Werte: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount'
inputs Erforderlich	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputFileDataset, PipelineOutputTabularDataset, DatasetConsumptionConfig]] Eine Liste der Eingabeportbindungen.
outputs Erforderlich	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Eine Liste der Ausgabeportbindungen.
params Erforderlich	dict Ein Wörterbuch mit Namen-Wert-Paaren, die als Umgebungsvariablen mit "AML_PARAMETER_" registriert sind.
source_directory Erforderlich	str Ein Ordner mit R-Skript, Conda env und anderen Ressourcen, die im Schritt verwendet werden.
use_gpu Erforderlich	bool Gibt an, ob die Umgebung, in der das Experiment ausgeführt werden soll, GPUs unterstützen soll. Bei "True" wird ein GPU-basiertes Docker-Standardimage in der Umgebung verwendet. Wenn False, wird ein CPU-basiertes Image verwendet. Standardmäßige Docker-Images (CPU oder GPU) werden nur verwendet, wenn ein Benutzer nicht beide Und `base_imagebase_dockerfile` Parameter festgelegt. Diese Einstellung wird nur in Docker-fähigen Computezielen verwendet. Weitere Informationen finden Sie https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.environment.dockersection unter `base_image`.
custom_docker_image Erforderlich	str Der Name des Docker-Images, aus dem das für Schulungen zu verwendende Image erstellt wird. Wenn nicht festgelegt, wird ein CPU-basiertes Standardimage als Basisimage verwendet. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen base_image in DockerSection.
cran_packages Erforderlich	list CRAN-Pakete, die installiert werden sollen. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen RSection.cran_packages.
github_packages Erforderlich	list GitHub-Pakete, die installiert werden sollen. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen RSection.github_packages.
custom_url_packages Erforderlich	list Pakete, die über lokale, verzeichnis- oder benutzerdefinierte URL installiert werden sollen. Dies ist veraltet und wird in einer zukünftigen Version entfernt. Verwenden Sie stattdessen RSection.custom_url_packages.
allow_reuse Erforderlich	bool Gibt an, ob der Schritt vorherige Ergebnisse wiederverwenden soll, wenn er mit denselben Einstellungen erneut ausgeführt wird. Die Wiederverwendung ist standardmäßig aktiviert. Wenn der Schrittinhalt (Skripts/Abhängigkeiten) sowie Eingaben und Parameter unverändert bleiben, wird die Ausgabe aus der vorherigen Ausführung dieses Schritts wiederverwendet. Beim Erneuten Verwenden des Schritts werden die Ergebnisse aus der vorherigen Ausführung sofort allen nachfolgenden Schritten zur Verfügung gestellt, anstatt den Auftrag zur Berechnung zu übermitteln. Wenn Sie Azure Machine Learning-Datasets als Eingaben verwenden, wird die Wiederverwendung bestimmt, ob sich die Definition des Datasets geändert hat, nicht durch die Änderung der zugrunde liegenden Daten.
version Erforderlich	str Ein optionales Versionstag, um eine Änderung der Funktionalität für den Schritt zu kennzeichnen.

Hinweise

Ein RScriptStep ist ein einfacher, integrierter Schritt zum Ausführen von R-Skripts für ein Computeziel. Es verwendet einen Skriptnamen und andere optionale Parameter wie Argumente für das Skript, Computeziel, Eingaben und Ausgaben. Verwenden Sie eine RunConfiguration , um Anforderungen für den RScriptStep anzugeben, z. B. benutzerdefinierte Docker-Image, erforderliche Cran/GitHub-Pakete.

Die bewährte Methode für die Arbeit mit RScriptStep besteht darin, einen separaten Ordner für Skripts und alle abhängigen Dateien zu verwenden, die dem Schritt zugeordnet sind, und diesen Ordner mit dem source_directory Parameter angeben. Im Anschluss an diese bewährte Methode gibt es zwei Vorteile. Zunächst hilft es, die Größe der für den Schritt erstellten Momentaufnahme zu verringern, da nur das, was für den Schritt erforderlich ist, momentaufnahmet wird. Zweitens kann die Ausgabe des Schritts aus einer vorherigen Ausführung wiederverwendet werden, wenn es keine Änderungen an dem Gibt, die source_directory einen erneuten Upload der Momentaufnahme auslösen würden.

Das folgende Codebeispiel zeigt, wie Sie einen RScriptStep in einem Machine Learning-Schulungsszenario verwenden.


   from azureml.core.runconfig import RunConfiguration
   from azureml.core.environment import Environment, RSection, RCranPackage
   from azureml.pipeline.steps import RScriptStep

   rc = RunConfiguration()
   rc.framework='R'
   rc.environment.r = RSection()                            # R details with required packages
   rc.environment.docker.enabled = True                     # to enable docker image
   rc.environment.docker.base_image = '<custom user image>' # to use custom image

   cran_package1 = RCranPackage()
   cran_package1.name = "ggplot2"
   cran_package1.repository = "www.customurl.com"
   cran_package1.version = "2.1"
   rc.environment.r.cran_packages = [cran_package1]

   trainStep = RScriptStep(script_name="train.R",
                           arguments=["--input", blob_input_data, "--output", output_data1],
                           inputs=[blob_input_data],
                           outputs=[output_data1],
                           compute_target=compute_target,
                           use_gpu=False,
                           runconfig=rc,
                           source_directory=project_folder)

Weitere Informationen zum Erstellen von Pipelines finden Sie https://aka.ms/pl-first-pipeline im Allgemeinen. Weitere Informationen zu RSection finden Sie https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.environment.rsection unter .

Methoden

create_node

Erstellen Sie einen Knoten für RScriptStep, und fügen Sie ihn dem angegebenen Diagramm hinzu.

VERALTET. Verwenden Sie stattdessen die CommandStep Ein Beispiel finden Sie unter Ausführen von R-Skripts in Pipelines mit CommandStep.

Diese Methode soll nicht direkt verwendet werden. Wenn eine Pipeline mit diesem Schritt instanziiert wird, übergibt Azure ML automatisch die für diese Methode erforderlichen Parameter, sodass ein Schritt zu einem Pipelinediagramm hinzugefügt werden kann, das den Workflow darstellt.

create_node

Erstellen Sie einen Knoten für RScriptStep, und fügen Sie ihn dem angegebenen Diagramm hinzu.

VERALTET. Verwenden Sie stattdessen die CommandStep Ein Beispiel finden Sie unter Ausführen von R-Skripts in Pipelines mit CommandStep.

create_node(graph, default_datastore, context)

Parameter

Name	Beschreibung
graph Erforderlich	Graph Das Graph-Objekt, dem der Knoten hinzugefügt werden soll.
default_datastore Erforderlich	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Der Standarddatenspeicher.
context Erforderlich	<xref:azureml.pipeline.core._GraphContext> Der Diagrammkontext.

Gibt zurück

Typ	Beschreibung
Node	Der erstellte Knoten.

Feedback

War diese Seite hilfreich?

Freigeben über

RScriptStep Klasse

Konstruktor

Parameter

Hinweise

Methoden

create_node

Parameter

Gibt zurück

Feedback