Creare archivi dati

SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

Questo articolo illustra come connettersi ai servizi di archiviazione dati di Azure con gli archivi dati di Azure Machine Learning.

Prerequisiti

Nota

Gli archivi dati di Machine Learning non creano le risorse dell'account di archiviazione sottostante. Collegano invece un account di archiviazione esistente per l'uso di Machine Learning. Gli archivi dati di Machine Learning non sono necessari. Se si ha accesso ai dati sottostanti, è possibile usare direttamente gli URI di archiviazione.

Creare un archivio dati di BLOB di Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Creare un archivio dati di Azure Data Lake Archiviazione Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Creare un archivio dati di File di Azure

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Creare un archivio dati di Azure Data Lake Archiviazione Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Creare un archivio dati OneLake (Microsoft Fabric) (anteprima)

Questa sezione descrive varie opzioni per creare un archivio dati di OneLake. L'archivio dati di OneLake fa parte di Microsoft Fabric. Al momento, Machine Learning supporta la connessione agli artefatti di Microsoft Fabric lakehouse che includono cartelle o file e collegamenti amazon S3. Per altre informazioni sui lakehouse, vedere Che cos'è una lakehouse in Microsoft Fabric?.

La creazione dell'archivio dati OneLake richiede le informazioni seguenti dall'istanza di Microsoft Fabric:

  • Endpoint
  • Nome o GUID dell'area di lavoro di Fabric
  • Nome o GUID dell'artefatto

I tre screenshot seguenti descrivono il recupero di queste risorse di informazioni necessarie dall'istanza di Microsoft Fabric.

Nome dell'area di lavoro di OneLake

Nell'istanza di Microsoft Fabric è possibile trovare le informazioni sull'area di lavoro, come illustrato in questo screenshot. È possibile usare un valore GUID o un "nome descrittivo" per creare un archivio dati OneLake di Machine Learning.

Screenshot che mostra i dettagli dell'area di lavoro di Microsoft Fabric nell'interfaccia utente di Microsoft Fabric.

Endpoint di OneLake

Questo screenshot mostra come trovare informazioni sull'endpoint nell'istanza di Microsoft Fabric.

Screenshot che mostra i dettagli dell'endpoint di Microsoft Fabric nell'interfaccia utente di Microsoft Fabric.

Nome dell'artefatto di OneLake

Questo screenshot mostra come trovare informazioni sull'artefatto nell'istanza di Microsoft Fabric. Lo screenshot mostra anche come usare un valore GUID o un nome descrittivo per creare un archivio dati OneLake di Machine Learning.

Screenshot che mostra come ottenere i dettagli dell'artefatto di Microsoft Fabric lakehouse nell'interfaccia utente di Microsoft Fabric.

Creare un archivio dati di OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Passaggi successivi