Vytváření úložišť dat

PLATÍ PRO:Rozšíření Azure CLI ml v2 (aktuální)Python SDK azure-ai-ml v2 (aktuální)

V tomto článku se dozvíte, jak se připojit ke službám úložiště dat Azure pomocí služby Azure Machine Učení úložiště dat.

Požadavky

Poznámka:

Azure Machine Učení úložiště dat nevytvoří podkladové prostředky účtu úložiště. Místo toho propojí existující účet úložiště pro azure machine Učení použití. To nevyžaduje úložiště dat azure machine Učení. Pokud máte přístup k podkladovým datům, můžete použít identifikátory URI úložiště přímo.

Vytvoření úložiště dat objektů blob v Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Data Lake Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Data Lake Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Vytvoření úložiště dat OneLake (Microsoft Fabric) (Preview)

Tato část popisuje různé možnosti vytvoření úložiště dat OneLake. Úložiště dat OneLake je součástí Microsoft Fabric. V tuto chvíli azure machine Učení podporuje připojení k artefaktům Microsoft Fabric Lakehouse, které obsahují složky / soubory a zástupce Amazon S3. Další informace o Lakehouse naleznete v tématu Co je lakehouse v Microsoft Fabric.

Vytvoření úložiště dat OneLake vyžaduje

  • Koncový bod
  • Název nebo identifikátor GUID pracovního prostoru prostředků infrastruktury
  • Název artefaktu nebo identifikátor GUID

informace z vaší instance Microsoft Fabric. Tyto tři snímky obrazovky popisují načtení těchto požadovaných informačních prostředků z vaší instance Microsoft Fabric:

Název pracovního prostoru OneLake

V instanci Microsoft Fabric najdete informace o pracovním prostoru, jak je znázorněno na tomto snímku obrazovky. K vytvoření úložiště dat Azure Machine Učení OneLake můžete použít hodnotu GUID nebo popisný název.

Screenshot that shows Fabric Workspace details in Microsoft Fabric UI.

Koncový bod OneLake

Tento snímek obrazovky ukazuje, jak najít informace o koncovém bodu v instanci Microsoft Fabric:

Screenshot that shows Fabric endpoint details in Microsoft Fabric UI.

Název artefaktu OneLake

Tento snímek obrazovky ukazuje, jak můžete najít informace o artefaktech v instanci Microsoft Fabric. Snímek obrazovky také ukazuje, jak můžete použít hodnotu GUID nebo popisný název k vytvoření úložiště dat Azure Učení OneLake:

Screenshot showing how to get Fabric LH artifact details in Microsoft Fabric UI.

Vytvoření úložiště dat OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Další kroky