Erstellen von Datenspeichern

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

In diesem Artikel lernen Sie, wie Sie mit Azure Machine Learning-Datenspeichern eine Verbindung mit Azure-Datenspeicherdiensten herstellen.

Voraussetzungen

Hinweis

Machine Learning-Datenspeicher erstellen nicht die zugrunde liegenden Speicherkontoressourcen. Stattdessen verknüpfen sie ein vorhandenes Speicherkonto für die Verwendung durch Machine Learning. Machine Learning-Datenspeicher sind nicht erforderlich. Wenn Sie Zugriff auf die zugrunde liegenden Daten haben, können Sie Speicher-URIs direkt verwenden.

Erstellen eines Azure-Blobdatenspeichers

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Erstellen eines Azure Data Lake Storage Gen2-Datenspeichers

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Erstellen eines Azure Files-Datenspeichers

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Erstellen eines Azure Data Lake Storage Gen1-Datenspeichers

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Erstellen eines OneLake (Microsoft Fabric)-Datenspeichers (Vorschau)

In diesem Abschnitt werden verschiedene Optionen zum Erstellen eines OneLake-Datenspeichers beschrieben. Der OneLake-Datenspeicher ist Teil von Microsoft Fabric. Derzeit unterstützt Machine Learning die Verbindung mit Microsoft Fabric-Lakehouse-Artefakten, die Ordner oder Dateien und Amazon S3-Verknüpfungen umfassen. Weitere Informationen zu Lakehouses finden Sie unter Was ist ein Lakehouse in Microsoft Fabric?.

Die Erstellung von OneLake-Datenspeichern erfordert die folgenden Informationen aus Ihrer Microsoft Fabric-Instanz:

  • Endpunkt
  • Name oder GUID des Fabric-Arbeitsbereichs
  • Name oder GUID des Artefakts

Die folgenden drei Screenshots beschreiben das Abrufen dieser erforderlichen Informationsressourcen aus Ihrer Microsoft Fabric-Instanz.

OneLake-Arbeitsbereichsname

In Ihrer Microsoft Fabric-Instanz können Sie die Arbeitsbereichsinformationen finden, wie in diesem Screenshot gezeigt. Sie können entweder einen GUID-Wert oder einen „Anzeigenamen“ verwenden, um einen Machine Learning-OneLake-Datenspeicher zu erstellen.

Screenshot der Microsoft Fabric-Arbeitsbereichsdetails in der Microsoft Fabric-Benutzeroberfläche.

OneLake-Endpunkt

Dieser Screenshot zeigt, wie Sie die Endpunktinformationen in Ihrer Microsoft Fabric-Instanz finden können.

Screenshot der Microsoft Fabric-Endpunktdetails in der Microsoft Fabric-Benutzeroberfläche.

OneLake-Artefaktname

Dieser Screenshot zeigt, wie Sie die Artefaktinformationen in Ihrer Microsoft Fabric-Instanz ausfindig machen. Der Screenshot zeigt auch, wie Sie entweder einen GUID-Wert oder einen Anzeigenamen verwenden können, um einen Machine Learning-OneLake-Datenspeicher zu erstellen.

Screenshot, der zeigt, wie Sie Microsoft Fabric Lakehouse-Artefaktdetails in der Microsoft Fabric-Benutzeroberfläche abrufen.

Erstellen eines OneLake-Datenspeichers

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Nächste Schritte