建立資料存放區

適用於:Azure CLI ml 延伸模組 v2 (目前)Python SDK azure-ai-ml v2 (目前)

在本文中,您將瞭解如何使用 Azure 機器學習 資料存放區連線到 Azure 資料記憶體服務。

必要條件

注意

機器學習 數據存放區不會建立基礎記憶體帳戶資源。 相反地,他們會連結現有的記憶體帳戶以供 機器學習 使用。 不需要 機器學習 數據存放區。 如果您有基礎資料的存取權,您可以直接使用儲存體 URI。

建立 Azure Blob 資料存放區

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

建立 Azure Data Lake 儲存體 Gen2 數據存放區

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

建立 Azure 檔案儲存體資料存放區

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

建立 Azure Data Lake 儲存體 Gen1 資料存放區

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

建立 OneLake (Microsoft Fabric) 資料存放區 (預覽)

本節說明建立 OneLake 資料存放區的各種選項。 OneLake 資料存放區是 Microsoft Fabric 的一部分。 目前,機器學習 支援連線到包含資料夾或檔案和 Amazon S3 快捷方式的 Microsoft Fabric Lakehouse 成品。 如需 Lakehouses 的詳細資訊,請參閱 什麼是 Microsoft Fabric 中的 Lakehouse?

OneLake 數據存放區建立需要來自 Microsoft Fabric 實例的下列資訊:

  • 端點
  • 網狀架構工作區名稱或 GUID
  • 成品名稱或 GUID

下列三個螢幕快照說明從 Microsoft Fabric 實例擷取這些必要信息資源。

OneLake 工作區名稱

在您的 Microsoft Fabric 實例中,您可以找到工作區資訊,如此螢幕快照所示。 您可以使用 GUID 值或「易記名稱」來建立 機器學習 OneLake 資料存放區。

顯示 Microsoft Fabric UI 中 Microsoft Fabric 工作區詳細數據的螢幕快照。

OneLake 端點

此螢幕快照顯示如何在 Microsoft Fabric 實例中找到端點資訊。

顯示 Microsoft Fabric UI 中 Microsoft Fabric 端點詳細數據的螢幕快照。

OneLake 成品名稱

此螢幕擷取畫面顯示如何在 Microsoft Fabric 執行個體中找到成品資訊。 此螢幕快照也會顯示如何使用 GUID 值或易記名稱來建立 機器學習 OneLake 資料存放區。

顯示如何在 Microsoft Fabric UI 中取得 Microsoft Fabric Lakehouse 成品詳細數據的螢幕快照。

建立 OneLake 資料存放區

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

下一步