Créer des magasins de données

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)Kit de développement logiciel (SDK) Python azure-ai-ml v2 (préversion)

Dans cet article, découvrez comment vous connecter aux services de stockage de données Azure avec des magasins de données Azure Machine Learning.

Prérequis

Notes

Les magasins de données Azure Machine Learning ne créent pas les ressources de compte de stockage sous-jacentes. Au lieu de cela, ils lient un compte de stockage existant pour l’utilisation d’Azure Machine Learning. Cela ne nécessite pas les magasins de données Azure Machine Learning. Si vous avez accès aux données sous-jacentes, vous pouvez utiliser directement des URI de stockage.

Créer un magasin de données d’objet blob Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Créez un magasin de données Azure Data Lake Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Créez un magasin de données Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Créez un magasin de données Azure Data Lake Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Créer un magasin de données OneLake (Microsoft Fabric) (préversion)

Cette section décrit diverses options pour créer un magasin de données OneLake. Le magasin de données OneLake fait partie de Microsoft Fabric. À ce stade, Azure Machine Learning prend en charge la connexion à des artefacts Microsoft Fabric Lakehouse qui incluent des dossiers / fichiers et des raccourcis Amazon S3. Pour plus d’informations sur Lakehouse, consultez Qu’est-ce qu’un lakehouse dans Microsoft Fabric.

La création d’un magasin de données OneLake nécessite

  • Point de terminaison
  • Nom ou GUID de l’espace de travail Fabric
  • Nom ou GUID de l’artefact

informations de votre instance Microsoft Fabric. Ces trois captures d’écran décrivent la récupération de ces ressources d’informations requises à partir de votre instance Microsoft Fabric :

Nom de l’espace de travail OneLake

Dans votre instance Microsoft Fabric, vous trouverez les informations de l’espace de travail, comme illustré dans cette capture d’écran. Vous pouvez utiliser une valeur GUID ou un « nom convivial » pour créer un magasin de données OneLake Azure Machine Learning.

Screenshot that shows Fabric Workspace details in Microsoft Fabric UI.

Point de terminaison OneLake

Cette capture d’écran montre comment trouver les informations de point de terminaison dans votre instance Microsoft Fabric :

Screenshot that shows Fabric endpoint details in Microsoft Fabric UI.

Nom de l’artefact OneLake

Cette capture d’écran montre comment trouver les informations d’artefact dans votre instance Microsoft Fabric. La capture d’écran montre aussi comment utiliser une valeur GUID ou un « nom convivial » pour créer un magasin de données OneLake Azure Machine Learning :

Screenshot showing how to get Fabric LH artifact details in Microsoft Fabric UI.

Créer un magasin de données OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Étapes suivantes