Membuat datastore

BERLAKU UNTUK:Ekstensi ml Azure CLI v2 (saat ini)Python SDK azure-ai-ml v2 (saat ini)

Dalam artikel ini, pelajari cara menyambungkan ke layanan penyimpanan data Azure dengan penyimpanan data Azure Pembelajaran Mesin.

Prasyarat

Catatan

Penyimpanan data Azure Pembelajaran Mesin tidak membuat sumber daya akun penyimpanan yang mendasar. Sebagai gantinya, mereka menautkan akun penyimpanan yang ada untuk penggunaan Azure Pembelajaran Mesin. Ini tidak memerlukan penyimpanan data Azure Pembelajaran Mesin. Jika Anda memiliki akses ke data yang mendasar, Anda dapat menggunakan URI penyimpanan secara langsung.

Membuat datastore Azure Blob

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Membuat datastore Azure Data Lake Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Membuat datastore Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Membuat datastore Azure Data Lake Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Membuat datastore OneLake (Microsoft Fabric) (pratinjau)

Bagian ini menjelaskan berbagai opsi untuk membuat datastore OneLake. Datastore OneLake adalah bagian dari Microsoft Fabric. Saat ini, Azure Pembelajaran Mesin mendukung koneksi ke artefak Microsoft Fabric Lakehouse yang menyertakan folder / file dan pintasan Amazon S3. Untuk informasi selengkapnya tentang Lakehouse, kunjungi Apa itu lakehouse di Microsoft Fabric.

Pembuatan datastore OneLake memerlukan

  • Titik akhir
  • Nama ruang kerja fabric atau GUID
  • Nama artefak atau GUID

informasi dari instans Microsoft Fabric Anda. Ketiga cuplikan layar ini menjelaskan pengambilan sumber daya informasi yang diperlukan ini dari instans Microsoft Fabric Anda:

Nama ruang kerja OneLake

Dalam instans Microsoft Fabric, Anda dapat menemukan informasi ruang kerja seperti yang ditunjukkan dalam cuplikan layar ini. Anda dapat menggunakan nilai GUID, atau "nama yang mudah diingat" untuk membuat datastore Azure Pembelajaran Mesin OneLake.

Screenshot that shows Fabric Workspace details in Microsoft Fabric UI.

Titik akhir OneLake

Cuplikan layar ini menunjukkan bagaimana Anda dapat menemukan informasi titik akhir di instans Microsoft Fabric Anda:

Screenshot that shows Fabric endpoint details in Microsoft Fabric UI.

Nama artefak OneLake

Cuplikan layar ini menunjukkan bagaimana Anda dapat menemukan informasi artefak di instans Microsoft Fabric Anda. Cuplikan layar juga memperlihatkan bagaimana Anda dapat menggunakan nilai GUID atau "nama yang mudah diingat" untuk membuat datastore Azure Pembelajaran Mesin OneLake:

Screenshot showing how to get Fabric LH artifact details in Microsoft Fabric UI.

Membuat datastore OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Langkah berikutnya