次の方法で共有


データストアの作成

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

この記事では、Azure Machine Learning データストアを使用して Azure データ ストレージ サービスに接続する方法について説明します。

前提条件

Note

Machine Learning データストアでは、基になるストレージ アカウント リソースは作成されません。 代わりに、Machine Learning で使用するために "既存" のストレージ アカウントがリンクされます。 Machine Learning データストアは必要ありません。 基になるデータにアクセスできる場合は、ストレージ URI を直接使用できます。

Azure BLOB データストアを作成する

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Azure Data Lake Storage Gen2 データストアを作成する

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Azure Files データストアを作成する

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Azure Data Lake Storage Gen1 データストアを作成する

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

OneLake (Microsoft Fabric) データストア (プレビュー) を作成する

このセクションでは、OneLake データストアを作成するためのさまざまなオプションについて説明します。 OneLake データストアは Microsoft Fabric の一部です。 現在、Machine Learning では、フォルダーまたはファイルおよび Amazon S3 ショートカットを含む、[ファイル] フォルダー内の Microsoft Fabric レイクハウス成果物への接続がサポートされています。 レイクハウスの詳細については、「Microsoft Fabric のレイクハウスとは?」を参照してください。

OneLake データストアの作成には、Microsoft Fabric インスタンスからの次の情報が必要です。

  • エンドポイント
  • ワークスペース GUID
  • 成果物 GUID

次のスクリーンショットは、Microsoft Fabric インスタンスから必要なこれらの情報リソースを取得する様子を示しています。

Microsoft Fabric UI で Microsoft Fabric ワークスペース成果物の成果物プロパティをクリックする方法を示すスクリーンショット。

次に、[プロパティ] ページの [URL] と [ABFS パス] で "エンドポイント"、"ワークスペース GUID"、"成果物 GUID" を見つけます。

  • URL 形式: https://{your_one_lake_endpoint}/{your_one_lake_workspace_guid}/{your_one_lake_artifact_guid}/Files
  • ABFS パス形式: abfss://{your_one_lake_workspace_guid}@{your_one_lake_endpoint}/{your_one_lake_artifact_guid}/Files

Microsoft Fabric UI の OneLake 成果物の URL と ABFS パスを示すスクリーンショット。

OneLake データストアを作成する

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

次のステップ