Sdílet prostřednictvím


Vytváření úložišť dat

PLATÍ PRO:Rozšíření Azure CLI ml v2 (aktuální)Python SDK azure-ai-ml v2 (aktuální)

V tomto článku se dozvíte, jak se připojit ke službám úložiště dat Azure pomocí úložišť dat Azure Machine Learning.

Požadavky

Poznámka:

Úložiště dat služby Machine Learning nevytvárují základní prostředky účtu úložiště. Místo toho propojí existující účet úložiště pro použití služby Machine Learning. Úložiště dat služby Machine Learning se nevyžadují. Pokud máte přístup k podkladovým datům, můžete použít identifikátory URI úložiště přímo.

Vytvoření úložiště dat objektů blob v Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Vytvoření úložiště dat OneLake (Microsoft Fabric) (Preview)

Tato část popisuje různé možnosti vytvoření úložiště dat OneLake. Úložiště dat OneLake je součástí Microsoft Fabric. V tuto chvíli Machine Learning podporuje připojení k artefaktům Microsoft Fabric Lakehouse ve složce Soubory, které obsahují složky nebo soubory a zástupce Amazon S3. Další informace o lakehouses naleznete v tématu Co je lakehouse v Microsoft Fabric?.

Vytvoření úložiště dat OneLake vyžaduje následující informace z vaší instance Microsoft Fabric:

  • Koncový bod
  • GUID pracovního prostoru
  • Identifikátor GUID artefaktu

Následující snímky obrazovky popisují načtení těchto požadovaných informačních prostředků z vaší instance Microsoft Fabric.

Snímek obrazovky, který ukazuje, jak kliknout na vlastnosti artefaktu pracovního prostoru Microsoft Fabric v uživatelském rozhraní Microsoft Fabric

Pak na stránce Vlastnosti najdete "Koncový bod", "GUID pracovního prostoru" a "GUID artefaktu" v adrese URL a "CESTA ABFS":

  • Formát adresy URL: https://{your_one_lake_endpoint}/{your_one_lake_workspace_guid}/{your_one_lake_artifact_guid}/Soubory
  • Formát cesty ABFS: abfss://{your_one_lake_workspace_guid}@{your_one_lake_endpoint}/{your_one_lake_artifact_guid}/Soubory

Snímek obrazovky znázorňující cestu URL a ABFS artefaktu OneLake v uživatelském rozhraní Microsoft Fabric

Vytvoření úložiště dat OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Další kroky