Erstellen von Aufträgen und Eingabedaten für Batchendpunkte

Artikel
02/07/2025

Wenn Sie Batchendpunkte in Azure Machine Learning verwenden, können Sie lange Batchvorgänge für große Mengen von Eingabedaten ausführen. Die Daten können sich an verschiedenen Orten befinden, z. B. in unterschiedlichen Regionen. Bestimmte Arten von Batchendpunkten können auch literale Parameter als Eingaben empfangen.

Dieser Artikel beschreibt, wie Sie Parametereingaben für Batchendpunkte festlegen und Bereitstellungsaufträge erstellen. Der Prozess unterstützt das Arbeiten mit Daten aus verschiedenen Quellen, z. B. Datenressourcen, Datenspeicher, Speicherkonten und lokale Dateien.

Voraussetzungen

Sie benötigen einen Batchendpunkt und eine Bereitstellung. Einzelheiten zum Erstellen dieser Ressourcen finden Sie unter Bereitstellen von MLflow-Modellen in Batchbereitstellungen in Azure Machine Learning.
Sie müssen über Berechtigungen zum Ausführen einer Batchendpunktbereitstellung verfügen. Zum Ausführen einer Bereitstellung können Sie die Rollen AzureML – Wissenschaftliche Fachkraft für Daten, Mitwirkender und Besitzer verwenden. Informationen zu den spezifischen Berechtigungen, die für benutzerdefinierte Rollendefinitionen erforderlich sind, finden Sie unter Autorisierung für Batchendpunkte.
Anmeldeinformationen zum Aufrufen eines Endpunkts. Weitere Informationen finden Sie unter Einrichten der Authentifizierung.
Lesezugriff auf die Eingabedaten von dem Computecluster, auf dem der Endpunkt bereitgestellt ist.

Tipp

Bestimmte Situationen erfordern die Verwendung eines Datenspeichers ohne Anmeldeinformationen oder eines externen Azure Storage-Kontos als Dateneingabe. Stellen Sie in diesen Szenarien sicher, dass Sie Computecluster für den Datenzugriff konfigurieren, da die verwaltete Identität des Computeclusters für die Einbindung des Speicherkontos verwendet wird. Sie verfügen weiterhin über eine detaillierte Zugriffssteuerung, da die Identität des Auftrags (Aufrufer) zum Lesen der zugrunde liegenden Daten verwendet wird.

Einrichten der Authentifizierung

Zum Aufrufen eines Endpunkts benötigen Sie ein gültiges Microsoft Entra-Token. Wenn Sie einen Endpunkt aufrufen, erstellt Azure Machine Learning einen Batchbereitstellungsauftrag unter der mit dem Token verbundenen Identität.

Wenn Sie zum Aufrufen von Endpunkten die Azure Machine Learning-CLI (V2) oder das Azure Machine Learning-SDK für Python (V2) verwenden, müssen Sie das Microsoft Entra-Token nicht manuell abrufen. Bei der Anmeldung authentifiziert das System Ihre Benutzeridentität. Es ruft auch das Token ab und übergibt es für Sie.
Wenn Sie die REST-API zum Aufrufen von Endpunkten verwenden, müssen Sie das Token manuell abrufen.

Sie können Ihre eigenen Anmeldedaten für den Aufruf verwenden, wie in den folgenden Verfahren beschrieben.

Verwenden Sie die Azure CLI, um sich mit interaktiver oder Gerätecode-Authentifizierung anzumelden:

az login

Verwenden Sie das Azure Machine Learning SDK für Python, um sich anzumelden:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(DefaultAzureCredential())

Wenn Ihre Konfiguration außerhalb einer Azure Machine Learning-Computeinstanz ausgeführt wird, müssen Sie den Arbeitsbereich angeben, in dem der Endpunkt bereitgestellt wird:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace = "<workspace-name>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Die einfachste Methode, ein gültiges Token für Ihr Benutzerkonto abzurufen, ist die Verwendung der Azure CLI. Führen Sie in einer Konsole den folgenden Azure CLI-Befehl aus:

az account get-access-token --resource https://ml.azure.com --query "accessToken" --output tsv

Tipp

Wenn Sie mit REST-Anforderungen arbeiten, empfiehlt es sich, einen Dienstprinzipal zum Aufrufen von Batchendpunkten zu verwenden. Weitere Informationen finden Sie unter Ausführen von Aufträgen mithilfe eines Dienstprinzipals.

Weitere Informationen zu verschiedenen Arten von Anmeldeinformationen finden Sie unter Ausführen von Aufträgen mit verschiedenen Arten von Anmeldeinformationen.

Erstellen einfacher Aufträge

Um einen Auftrag von einem Batchendpunkt aus zu erstellen, rufen Sie den Endpunkt auf. Der Aufruf kann über die Azure Machine Learning-CLI, das Azure Machine Learning-SDK für Python oder einen REST-API-Aufruf erfolgen.

Die folgenden Beispiele zeigen die Grundlagen für das Aufrufen eines Batchendpunkts, der einen einzelnen Eingabedatenordner zur Verarbeitung empfängt. Beispiele mit unterschiedlichen Eingaben und Ausgaben finden Sie unter Grundlegendes zu Eingaben und Ausgaben.

Verwenden Sie den invoke-Vorgang unter Batchendpunkten:

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

Verwenden Sie die MLClient.batch_endpoints.invoke()-Methode, um einen Batchendpunkt aufzurufen. Im folgenden Code ist endpoint ein Endpunktobjekt.

from azure.ai.ml import Input

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data")
    }
)

Stellen Sie eine POST-Anforderung an die Aufruf-URL des Endpunkts. Um die Aufruf-URL abzurufen, wechseln Sie zu Azure Machine Learning Studio, und öffnen Sie die Detailseite für den Endpunkt.

Verwenden Sie den folgenden Text in Ihrer Anforderung:

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        }
    }
}

Erstellen Sie die Anforderung:

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Aufrufen einer bestimmten Bereitstellung

Batch-Endpunkte können mehrere Bereitstellungen unter demselben Endpunkt hosten. Der Standardendpunkt wird verwendet, sofern der Benutzer nichts anderes angibt. Sie können die verwendete Bereitstellung mit den folgenden Verfahren ändern.

Verwenden Sie das Argument --deployment-name oder -d, um den Namen der Bereitstellung anzugeben:

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --deployment-name $DEPLOYMENT_NAME \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

Verwenden Sie den Parameter deployment_name, um den Namen der Bereitstellung anzugeben. Im folgenden Code ist deployment ein Bereitstellungsobjekt.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    deployment_name=deployment.name,
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data")
    }
)

Verwenden Sie den folgenden Text in Ihrer Anforderung:

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        }
    }
}

Fügen Sie Ihrer Anforderung den azureml-model-deployment-Headerschlüssel hinzu. Verwenden Sie als Wert den Namen der Bereitstellung, die Sie aufrufen möchten.

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
azureml-model-deployment: <deployment-name>

Konfigurieren der Jobeigenschaften

Sie können einige Auftragseigenschaften zum Aufrufzeitpunkt konfigurieren.

Hinweis

Auftragseigenschaften können derzeit nur in Batchendpunkten mit Pipelinekomponentenbereitstellungen konfiguriert werden.

Konfigurieren des Experimentnamens

Gehen Sie wie folgt vor, um den Namen Ihres Experiments zu konfigurieren.

Verwenden Sie das Argument --experiment-name, um den Namen des Experiments anzugeben:

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
                            --experiment-name "my-batch-job-experiment" \
                            --input https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data

Verwenden Sie den Parameter experiment_name, um den Namen des Experiments anzugeben:

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    experiment_name="my-batch-job-experiment",
    inputs={
        "heart_data": Input(path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"),
    }
)

Geben Sie den Namen des Experiments an, indem Sie den Schlüssel experimentName im Abschnitt properties des Texts verwenden:

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        },
        "properties":
        {
            "experimentName": "my-batch-job-experiment"
        }
    }
}

Erstellen Sie die Anforderung:

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Grundlegendes zu Eingaben und Ausgaben

Batchendpunkte bieten eine dauerhafte API, die Consumer zum Erstellen von Batchaufträgen verwenden können. Dieselbe Schnittstelle kann verwendet werden, um Eingaben und Ausgaben anzugeben, die Ihre Bereitstellung erwartet. Verwenden Sie Eingaben, um alle Informationen zu übergeben, die Ihr Endpunkt zum Ausführen des Auftrags benötigt.

Diagramm, das die Verwendung von Eingaben und Ausgaben in Batchendpunkten zeigt.

Batch-Endpunkte unterstützen zwei Arten von Eingaben:

Dateneingaben oder Zeiger auf einen bestimmten Speicherort oder eine Azure Machine Learning-Ressource
Literaleingaben oder Literalwerte (wie Zahlen oder Zeichenfolgen), die Sie an den Auftrag übergeben möchten

Anzahl und Typ der Eingaben und Ausgaben hängen vom Typ der Batchbereitstellung ab. Modellimplementierungen erfordern immer eine Dateneingabe und erzeugen eine Datenausgabe. Literaleingaben werden in Modellimplementierungen nicht unterstützt. Im Gegensatz dazu bieten Pipelinekomponentenbereitstellungen ein allgemeineres Konstrukt zum Erstellen von Endpunkten. In einer Pipelinekomponentenbereitstellung können Sie eine beliebige Anzahl von Dateneingaben, Literaleingaben und Ausgaben angeben.

In der folgenden Tabelle sind die Eingaben und Ausgaben für Batch-Bereitstellungen zusammengefasst:

Bereitstellungstyp	Anzahl von Eingaben	Unterstützte Eingabetypen	Anzahl von Ausgaben	Unterstützte Ausgabetypen
Modellimplementierung	1	Dateneingaben	1	Datenausgaben
Einsatz von Pipeline-Komponenten	0-N	Dateneingaben und Literaleingaben	0-N	Datenausgaben

Tipp

Eingaben und Ausgaben sind immer benannt. Jeder Name dient als Schlüssel zum Identifizieren der Daten und zum Übergeben des Werts während des Aufrufs. Da Modellimplementierungen immer eine Eingabe und eine Ausgabe erfordern, werden die Namen während des Aufrufs in Modellimplementierungen ignoriert. Sie können einen Namen vergeben, der Ihren Anwendungsfall am besten beschreibt, z. B. sales_estimation.

Näheres zu Dateneingaben

Dateneingaben beziehen sich auf Eingaben, die auf einen Speicherort verweisen, an dem Daten platziert sind. Da Batchendpunkte in der Regel große Datenmengen verbrauchen, können Sie die Eingabedaten nicht als Teil der Aufrufanforderung übergeben. Stattdessen geben Sie den Speicherort an, an dem der Batch-Endpunkt nach den Daten suchen soll. Eingabedaten werden auf der Zielcomputeinstanz eingebunden und gestreamt, um die Leistung zu verbessern.

Batchendpunkte können Dateien lesen, die sich in den folgenden Speichertypen befinden:

Azure Machine Learning-Datenressourcen, einschließlich der Ordnertypen (uri_folder) und Dateitypen (uri_file).
Azure Machine Learning Data Stores, einschließlich Azure Blob Storage, Azure Data Lake Storage Gen1 und Azure Data Lake Storage Gen2.
Azure Storage-Konten, einschließlich Blob Storage, Data Lake Storage Gen1 und Data Lake Storage Gen2.
Lokale Datenordner und Datendateien, wenn Sie zum Aufrufen von Endpunkten die Azure Machine Learning-CLI oder das Azure Machine Learning-SDK für Python verwenden. Die lokalen Daten werden aber in den Standarddatenspeicher Ihres Azure Machine Learning-Arbeitsbereichs hochgeladen.

Wichtig

Hinweis zu veralteten Funktionen: Datenressourcen des Typs FileDataset (V1) wurden als veraltet eingestuft und werden in Zukunft eingestellt. Vorhandene Batchendpunkte, die auf dieser Funktionalität basieren, funktionieren weiterhin. Es gibt jedoch keine Unterstützung für V1-Datasets in Batchendpunkten, die mit folgenden Komponenten erstellt werden:

Versionen der Azure Machine Learning-CLI V2, die allgemein verfügbar sind (2.4.0 und höher).
Versionen der REST-API, die allgemein verfügbar sind (2022-05-01 und höher).

Näheres zu Literaleingaben

Literaleingaben beziehen sich auf Eingaben, die zur Aufrufzeit dargestellt und aufgelöst werden können, z. B. Zeichenfolgen, Zahlen und boolesche Werte. In der Regel verwenden Sie Literaleingaben, um Parameter als Teil der Bereitstellung einer Pipelinekomponente an Ihren Endpunkt zu übergeben. Batchendpunkte unterstützen die folgenden Literaltypen:

string
boolean
float
integer

Wörtliche Eingaben werden nur bei der Bereitstellung von Pipelinekomponenten unterstützt. Einzelheiten zum Angeben von Literalendpunkten finden Sie unter Erstellen von Aufträgen mit Literaleingaben.

Näheres zu Datenausgaben

Datenausgaben beziehen sich auf den Speicherort, an dem die Ergebnisse eines Batchauftrags platziert werden. Jede Ausgabe hat einen identifizierbaren Namen, und Azure Machine Learning weist jeder benannten Ausgabe automatisch einen eindeutigen Pfad zu. Sie können bei Bedarf einen anderen Pfad angeben.

Wichtig

Batchendpunkte unterstützen nur das Schreiben von Ausgaben in Blob Storage-Datenspeicher. Wenn Sie in ein Speicherkonto schreiben müssen, für das hierarchische Namespaces aktiviert sind, wie Data Lake Storage Gen2, können Sie den Speicherdienst als Blob Storage-Datenspeicher registrieren, da die Dienste vollständig kompatibel sind. Auf diese Weise können Sie Ausgaben von Batchendpunkten in Data Lake Storage Gen2 schreiben.

Aufträge mit Dateneingabe erstellen

Die folgenden Beispiele zeigen, wie Aufträge erstellt werden, während Dateneingaben von Datenressourcen, Datenspeichern und Azure Storage-Konten übernommen werden.

Verwenden von Eingabedaten aus einer Datenressource

Azure Machine Learning-Datenressourcen (ehemals als Datasets bezeichnet) werden als Eingaben für Aufträge unterstützt. Führen Sie diese Schritte aus, um einen Batchendpunktauftrag mit Eingabedaten auszuführen, die in einer registrierten Datenressource in Azure Machine Learning gespeichert sind.

Warnung

Datenressourcen des Typs „Tabelle“ (MLTable) werden derzeit nicht unterstützt.

Erstellen Sie dann das Datenobjekt. In diesem Beispiel wird ein Ordner verwendet, der mehrere CSV-Dateien enthält. Sie verwenden Batchendpunkte, um die Dateien parallel zu verarbeiten. Sie können diesen Schritt überspringen, wenn Ihre Daten bereits als Datenressource registriert sind.
1. Erstellen Sie eine Datenressourcendefinition in einer YAML-Datei namens „heart-data.yml“:
```
$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: heart-data
description: An unlabeled data asset for heart classification.
type: uri_folder
path: data
```
2. Erstellen Sie dann das Datenobjekt:
```
az ml data create -f heart-data.yml
```
1. Erstellen Sie eine Datenobjektdefinition:
```
from azure.ai.ml.constants import AssetTypes
from azure.ai.ml.entities import Data

data_path = "heart-classifier-mlflow/data"
data_asset_name = "heart-data"

heart_data_object = Data(
    path=data_path,
    type=AssetTypes.URI_FOLDER,
    description="An unlabeled data asset for heart classification",
    name=data_asset_name
)
```
2. Erstellen Sie dann das Datenobjekt:
```
ml_client.data.create_or_update(heart_data_object)
```
  Zum Abrufen der neu erstellten Datenressource verwenden Sie den folgenden Befehl:
```
heart_data_asset = ml_client.data.get(name=data_asset_name, label="latest")
```
Verwenden Sie die Azure Machine Learning-CLI oder das Azure Machine Learning-SDK für Python, um die Datenressource zu erstellen.
Richten Sie die Eingabe ein:
```
DATA_ASSET_ID=$(az ml data show -n heart-data --label latest | jq -r .id)
```
```
input = Input(path=heart_data_asset.id)
```
Suchen Sie die folgenden Werte, und erstellen Sie dann die ID der Datenressource:
- Abonnement-ID
- Ressourcengruppenname
- Arbeitsbereichname
- Name der Datenressource
- Version der Datenressource
Die ID der Datenressource hat das Format /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/data/<data-asset-name>/versions/<data-asset-version>.
Führen Sie den Endpunkt aus:
Verwenden Sie das Argument --set, um die Eingabe anzugeben. Ersetzen Sie zunächst alle Bindestriche im Namen der Datenressource durch Unterstriche. Schlüssel dürfen nur alphanumerische Zeichen und Unterstriche enthalten.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$DATA_ASSET_ID
```
Für einen Endpunkt, der einer Modellimplementierung dient, können Sie das Argument --input verwenden, um die Dateneingabe anzugeben, da für eine Modellimplementierung immer nur eine Dateneingabe erforderlich ist.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $DATA_ASSET_ID
```
Das Argument --set erzeugt oft lange Befehle, wenn mehrere Eingaben angegeben werden. In solchen Fällen können Sie Ihre Eingaben in einer Datei auflisten und dann beim Aufrufen des Endpunkts auf die Datei verweisen. Sie können beispielsweise eine YAML-Datei namens „inputs.yml“ erstellen, die die folgenden Zeilen enthält:
```
inputs:
  heart_data:
    type: uri_folder
    path: /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/data/heart-data/versions/1
```
Anschließend können Sie den folgenden Befehl ausführen, der das Argument --file verwendet, um die Eingaben anzugeben:
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
Rufen Sie die Methode invoke auf, und verwenden Sie den Parameter inputs, um die erforderlichen Eingaben anzugeben:
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
Um den invoke-Aufruf für eine Modellimplementierung zu optimieren, verwenden Sie den Parameter input, um den Speicherort der Eingabedaten anzugeben:
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
Tipp

Was ist der Unterschied zwischen dem inputs- und dem input-Parameter, wenn Sie einen Endpunkt aufrufen?

Im Allgemeinen können Sie einen inputs = {}-Parameter im Wörterbuch mit der invoke-Methode verwenden, um eine beliebige Anzahl erforderlicher Eingaben für einen Batchendpunkt bereitzustellen, der eine Modellimplementierung oder eine Pipelinebereitstellung enthält.

Bei einer Modellimplementierung können Sie den input-Parameter als schnellere Möglichkeit verwenden, um den Eingabedatenspeicherort für die Bereitstellung anzugeben. Dieser Ansatz funktioniert, da eine Modellimplementierung immer nur eine Dateneingabeentgegennimmt.
Verwenden Sie den folgenden Text in Ihrer Anforderung:
```
{
    "properties": {
        "InputData": {
            "heart_data": {
                "JobInputType" : "UriFolder",
                "Uri": "<data-asset-ID>"
            }
        }
    }
}
```
Erstellen Sie die Anforderung:
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

Verwenden von Eingabedaten aus einem Datenspeicher

Ihre Batchbereitstellungsaufträge können direkt auf Daten verweisen, die sich in Datenspeichern befinden, die bei Azure Machine Learning registriert sind. In diesem Beispiel laden Sie zunächst einige Daten in einen Datenspeicher in Ihrem Azure Machine Learning-Arbeitsbereich hoch. Anschließend führen Sie eine Batchbereitstellung für diese Daten aus.

In diesem Beispiel wird der Standarddatenspeicher verwendet, Sie können aber auch einen anderen Datenspeicher nutzen. In jedem Azure Machine Learning-Arbeitsbereich ist der Name des standardmäßigen Blob-Datenspeichers workspaceblobstore. Wenn Sie in den folgenden Schritten einen anderen Datenspeicher verwenden möchten, ersetzen Sie workspaceblobstore durch den Namen Ihres bevorzugten Datenspeichers.

Laden Sie Beispieldaten in den Datenspeicher hoch. Die Beispieldaten sind im Repository azureml-examples verfügbar. Sie finden die Daten in diesem Repository im Ordner sdk/python/endpoints/batch/deploy-models/heart-classifier-mlflow/data.
1. Öffnen Sie in Azure Machine Learning Studio die Seite mit den Datenressourcen für Ihren standardmäßigen Blob-Datenspeicher, und suchen Sie dann den Namen des Blob-Containers.
2. Verwenden Sie ein Tool wie Azure Storage Explorer oder AzCopy, um die Beispieldaten in einen Ordner mit dem Namen „heart-disease-uci-unlabeled“ in diesem Container hochzuladen.
Richten Sie die Eingabeinformationen ein:
Geben Sie den Dateipfad in die Variable INPUT_PATH ein:
```
DATA_PATH="heart-disease-uci-unlabeled"
INPUT_PATH="azureml://datastores/workspaceblobstore/paths/$DATA_PATH"
```
Geben Sie den Dateipfad in die Variable input ein:
```
data_path = "heart-disease-uci-unlabeled"
input = Input(type=AssetTypes.URI_FOLDER, path=f"azureml://datastores/workspaceblobstore/paths/{data_path}")
```
Wenn sich Ihre Daten in einer Datei befinden, ändern Sie die Eingabetypzuweisung in type=AssetTypes.URI_FILE.
Verwenden Sie den folgenden Text in Ihrer Anforderung. Ersetzen Sie zunächst die Platzhalter durch entsprechende Werte. Ersetzen Sie den Platzhalter <data-path> durch heart-disease-uci-unlabeled.
```
{
    "properties": {
        "InputData": {
            "heart_data": {
                "JobInputType" : "UriFolder",
                "Uri": "/subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/datastores/workspaceblobstore/paths/<data-path>"
            }
        }
    }
}
```
Wenn sich Ihre Daten in einer Datei befinden, verwenden Sie den Typ UriFile für den Wert JobInputType.
Sie sehen, dass der Ordner paths Teil des Eingabepfads ist. Dieses Format gibt an, dass der folgende Wert ein Pfad ist.
Führen Sie den Endpunkt aus:
Verwenden Sie das --set-Argument, um die Eingabe anzugeben:
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$INPUT_PATH
```
Für einen Endpunkt, der einer Modellimplementierung dient, können Sie das Argument --input verwenden, um die Dateneingabe anzugeben, da für eine Modellimplementierung immer nur eine Dateneingabe erforderlich ist.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $INPUT_PATH --input-type uri_folder
```
Das Argument --set erzeugt oft lange Befehle, wenn mehrere Eingaben angegeben werden. In solchen Fällen können Sie Ihre Eingaben in einer Datei auflisten und dann beim Aufrufen des Endpunkts auf die Datei verweisen. Sie können beispielsweise eine YAML-Datei namens „inputs.yml“ erstellen, die die folgenden Zeilen enthält:
```
inputs:
  heart_data:
    type: uri_folder
    path: azureml://datastores/workspaceblobstore/paths/<data-path>
```
Wenn sich Ihre Daten in einer Datei befinden, verwenden Sie stattdessen den Typ uri_file für die Eingabe.

Anschließend können Sie den folgenden Befehl ausführen, der das Argument --file verwendet, um die Eingaben anzugeben:
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
Rufen Sie die invoke-Methode mittels des Parameters inputs auf, um die erforderlichen Eingaben zu machen:
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
Um den invoke-Aufruf für eine Modellimplementierung zu optimieren, verwenden Sie den Parameter input, um den Speicherort der Eingabedaten anzugeben:
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
Tipp

Was ist der Unterschied zwischen dem inputs- und dem input-Parameter, wenn Sie einen Endpunkt aufrufen?

Im Allgemeinen können Sie einen inputs = {}-Parameter im Wörterbuch mit der invoke-Methode verwenden, um eine beliebige Anzahl erforderlicher Eingaben für einen Batchendpunkt bereitzustellen, der eine Modellimplementierung oder eine Pipelinebereitstellung enthält.

Bei einer Modellimplementierung können Sie den input-Parameter als schnellere Möglichkeit verwenden, um den Eingabedatenspeicherort für die Bereitstellung anzugeben. Dieser Ansatz funktioniert, da eine Modellimplementierung immer nur eine Dateneingabeentgegennimmt.
Erstellen Sie die Anforderung:
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

Verwenden von Eingabedaten aus einem Azure Storage-Konto

Azure Machine Learning-Batchendpunkte können Daten aus Cloudstandorten in Azure Storage-Konten lesen, sowohl öffentliche als auch private. Führen Sie die folgenden Schritte aus, um einen Batchendpunktauftrag mit Daten in einem Speicherkonto auszuführen.

Weitere Informationen zur zusätzlichen erforderlichen Konfiguration zum Lesen von Daten aus Speicherkonten finden Sie unter Konfigurieren von Computeclustern für den Datenzugriff.

Richten Sie die Eingabe ein:

Legen Sie die Variable INPUT_DATA fest:

INPUT_DATA="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"

Wenn sich Ihre Daten in einer Datei befinden, verwenden Sie ein Format, das dem folgenden Format ähnelt, um den Eingabepfad zu definieren:

INPUT_DATA="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"

Legen Sie die Variable input fest:

input = Input(
    type=AssetTypes.URI_FOLDER, 
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
)

Wenn sich Ihre Daten in einer Datei befinden, ändern Sie die Eingabetypzuweisung in type=AssetTypes.URI_FILE:

input = Input(
    type=AssetTypes.URI_FILE,
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"
)

Verwenden Sie den folgenden Text in Ihrer Anforderung:

{
   "properties": {
       "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
       }
   }
}

Wenn sich Ihre Daten in einer Datei befinden, ändern Sie den Wert JobInputType in UriFile:

{
   "properties": {
       "InputData": {
           "heart_data": {
               "JobInputType" : "UriFile",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv"
           }
       }
   }
}

Führen Sie den Endpunkt aus:
Verwenden Sie das --set-Argument, um die Eingabe anzugeben:
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.heart_data.type="uri_folder" inputs.heart_data.path=$INPUT_DATA
```
Für einen Endpunkt, der einer Modellimplementierung dient, können Sie das Argument --input verwenden, um die Dateneingabe anzugeben, da für eine Modellimplementierung immer nur eine Dateneingabe erforderlich ist.
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --input $INPUT_DATA --input-type uri_folder
```
Das Argument --set erzeugt oft lange Befehle, wenn mehrere Eingaben angegeben werden. In solchen Fällen können Sie Ihre Eingaben in einer Datei auflisten und dann beim Aufrufen des Endpunkts auf die Datei verweisen. Sie können beispielsweise eine YAML-Datei namens „inputs.yml“ erstellen, die die folgenden Zeilen enthält:
```
inputs:
  heart_data:
    type: uri_folder
    path: https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data
```
Anschließend können Sie den folgenden Befehl ausführen, der das Argument --file verwendet, um die Eingaben anzugeben:
```
az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml
```
Wenn sich Ihre Daten in einer Datei befinden, verwenden Sie den Typ uri_file in der Datei „inputs.yml“ für die Dateneingabe.
Rufen Sie die invoke-Methode mittels des Parameters inputs auf, um die erforderlichen Eingaben zu machen:
```
job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
    inputs={
        "heart_data": input
    }
)
```
Um den invoke-Aufruf für eine Modellimplementierung zu optimieren, verwenden Sie den Parameter input, um den Speicherort der Eingabedaten anzugeben:
```
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input
)
```
Tipp

Was ist der Unterschied zwischen dem inputs- und dem input-Parameter, wenn Sie einen Endpunkt aufrufen?

Im Allgemeinen können Sie einen inputs = {}-Parameter im Wörterbuch mit der invoke-Methode verwenden, um eine beliebige Anzahl erforderlicher Eingaben für einen Batchendpunkt bereitzustellen, der eine Modellimplementierung oder eine Pipelinebereitstellung enthält.

Bei einer Modellimplementierung können Sie den input-Parameter als schnellere Möglichkeit verwenden, um den Eingabedatenspeicherort für die Bereitstellung anzugeben. Dieser Ansatz funktioniert, da eine Modellimplementierung immer nur eine Dateneingabeentgegennimmt.
Erstellen Sie die Anforderung:
```
POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json
```

Arbeitsplätze mit wörtlichen Eingaben schaffen

Für die Bereitstellung von Pipeline-Komponenten können wörtliche Eingaben verwendet werden. Ein Beispiel für eine Batchbereitstellung, die eine einfache Pipeline enthält, finden Sie unter Bereitstellen von Pipelines mit Batchendpunkten.

Das folgende Beispiel zeigt, wie eine Eingabe namens score_mode, vom Typ string und mit einem Wert von append angegeben wird:

Platzieren Sie Ihre Eingaben in einer YAML-Datei, z. B. in einer Datei mit dem Namen „inputs.yml“:

inputs:
  score_mode:
    type: string
    default: append

Führen Sie den folgenden Befehl aus, der das Argument --file verwendet, um die Eingaben anzugeben.

az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs.yml

Sie können auch das Argument --set verwenden, um den Typ und den Standardwert anzugeben. Bei dieser Vorgehensweise werden aber oft lange Befehle erzeugt, wenn mehrere Eingaben angegeben werden:

az ml batch-endpoint invoke --name $ENDPOINT_NAME \
    --set inputs.score_mode.type="string" inputs.score_mode.default="append"

Verwenden Sie den Parameter inputs, um Informationen über die Literaleingabe anzugeben.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name, 
    inputs = { 
        'score_mode': Input(type="string", default="append")
        }
)

Verwenden Sie den folgenden Text in Ihrer Anforderung:

{
    "properties": {
        "InputData": {
            "score_mode": {
                "JobInputType" : "Literal",
                "Value": "append"
            }
        }
    }
}

Erstellen Sie die Anforderung:

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Aufträge mit Datenausgaben erstellen

Das folgende Beispiel zeigt, wie Sie den Speicherort einer Ausgabe mit dem Namen score ändern können. Der Vollständigkeit halber wird mit diesem Beispiel auch eine Eingabe mit dem Namen heart_data konfiguriert.

In diesem Beispiel wird der Standarddatenspeicher workspaceblobstore verwendet. Sie können aber auch jeden anderen Datenspeicher in Ihrem Arbeitsbereich verwenden, solange es sich um ein Blob Storage-Konto handelt. Wenn Sie einen anderen Datenspeicher verwenden möchten, ersetzen Sie workspaceblobstore in den folgenden Schritten durch den Namen Ihres bevorzugten Datenspeichers.

Rufen Sie die ID des Datenspeichers ab.
```
DATA_STORE_ID=$(az ml datastore show -n workspaceblobstore | jq -r '.id')
```
```
from azure.ai.ml import Output

default_ds = ml_client.datastores.get_default()
```
Suchen Sie die folgenden Werte, und erstellen Sie dann die ID des Datenspeichers:
- Abonnement-ID
- Ressourcengruppenname
- Arbeitsbereichname
Die ID des Datenspeichers hat das Format /subscriptions/<subscription-ID>/resourceGroups/<resource-group-name>/providers/Microsoft.MachineLearningServices/workspaces/<workspace-name>/datastores/workspaceblobstore.

Erstellen Sie eine Datenausgabe:

Definieren Sie die Eingabe- und Ausgabewerte in einer Datei mit dem Namen „inputs-and-outputs.yml“. Verwenden Sie die ID des Datenspeichers im Ausgabepfad. Definieren Sie der Vollständigkeit halber auch die Dateneingabe.

inputs:
  heart_data:
    type: uri_folder
    path: https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data
outputs:
  score:
    type: uri_file
    path: <data-store-ID>/paths/batch-jobs/my-unique-path

Legen Sie die Pfadvariable output fest:

data_path = "batch-jobs/my-unique-path"
output = Output(type=AssetTypes.URI_FILE, path=f"{default_ds.id}/paths/{data_path}")

Erstellen Sie der Vollständigkeit halber auch eine Dateneingabe:

input = Input(
    type=AssetTypes.URI_FOLDER,
    path="https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
)

Verwenden Sie den folgenden Text in Ihrer Anforderung. Ersetzen Sie zunächst den Platzhalter <data-path> durch einen eindeutigen Pfad, wie beispielsweise batch-jobs/my-unique-path. Ersetzen Sie außerdem den Platzhalter <data-store-ID> durch die ID Ihres Datenspeichers.

{
    "properties": {
        "InputData": {
           "heart_data": {
               "JobInputType" : "UriFolder",
               "Uri": "https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data"
           }
        },
        "OutputData": {
            "score": {
                "JobOutputType" : "UriFile",
                "Uri": "<data-store-ID>/paths/<data-path>"
            }
        }
    }
}

Hinweis

Sie sehen, dass der Ordner paths Teil des Ausgabepfads ist. Dieses Format gibt an, dass der folgende Wert ein Pfad ist.

Führen Sie die Bereitstellung aus:

Verwenden Sie das Argument --file, um die Eingabe- und Ausgabewerte anzugeben:

az ml batch-endpoint invoke --name $ENDPOINT_NAME --file inputs-and-outputs.yml

Verwenden Sie den Parameter outputs, um Informationen über die Ausgabe anzugeben.

job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   inputs={ "heart_data": input },
   outputs={ "score": output }
)

Erstellen Sie die Anforderung:

POST HTTP/1.1
Host: <endpoint-URI>
Authorization: Bearer <token>
Content-Type: application/json

Teilen über

Erstellen von Aufträgen und Eingabedaten für Batchendpunkte

Voraussetzungen

Einrichten der Authentifizierung

Erstellen einfacher Aufträge

Aufrufen einer bestimmten Bereitstellung

Konfigurieren der Jobeigenschaften

Konfigurieren des Experimentnamens

Grundlegendes zu Eingaben und Ausgaben

Näheres zu Dateneingaben

Näheres zu Literaleingaben

Näheres zu Datenausgaben

Aufträge mit Dateneingabe erstellen

Verwenden von Eingabedaten aus einer Datenressource

Verwenden von Eingabedaten aus einem Datenspeicher

Verwenden von Eingabedaten aus einem Azure Storage-Konto

Arbeitsplätze mit wörtlichen Eingaben schaffen

Aufträge mit Datenausgaben erstellen

Feedback

Zusätzliche Ressourcen

Teilen über

Erstellen von Aufträgen und Eingabedaten für Batchendpunkte

Voraussetzungen

Einrichten der Authentifizierung

Erstellen einfacher Aufträge

Aufrufen einer bestimmten Bereitstellung

Konfigurieren der Jobeigenschaften

Konfigurieren des Experimentnamens

Grundlegendes zu Eingaben und Ausgaben

Näheres zu Dateneingaben

Näheres zu Literaleingaben

Näheres zu Datenausgaben

Aufträge mit Dateneingabe erstellen

Verwenden von Eingabedaten aus einer Datenressource

Verwenden von Eingabedaten aus einem Datenspeicher

Verwenden von Eingabedaten aus einem Azure Storage-Konto

Arbeitsplätze mit wörtlichen Eingaben schaffen

Aufträge mit Datenausgaben erstellen

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen