Créer des magasins de données

S’APPLIQUE À :Extension Azure CLI v2 (actuelle)Kit de développement logiciel (SDK) Python azure-ai-ml v2 (version actuelle)

Dans cet article, découvrez comment vous connecter aux services de stockage de données Azure avec des magasins de données Azure Machine Learning.

Prérequis

Remarque

Les magasins de données Machine Learning ne créent pas les ressources de compte de stockage sous-jacentes. Au lieu de cela, ils lient un compte de stockage existant pour l’utilisation de Machine Learning. Les magasins de données Machine Learning ne sont pas requis. Si vous avez accès aux données sous-jacentes, vous pouvez utiliser directement des URI de stockage.

Créer un magasin de données d’objet blob Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Créez un magasin de données Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Créez un magasin de données Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Créez un magasin de données Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Créer un magasin de données OneLake (Microsoft Fabric) (préversion)

Cette section décrit diverses options pour créer un magasin de données OneLake. Le magasin de données OneLake fait partie de Microsoft Fabric. À ce stade, Machine Learning prend en charge la connexion à des artefacts lakehouse Microsoft Fabric qui incluent des dossiers ou des fichiers et des raccourcis Amazon S3. Pour plus d’informations sur les lakehouses, consultez Qu’est-ce qu’un lakehouse dans Microsoft Fabric.

La création d’un magasin de données OneLake nécessite les informations suivantes de votre instance Microsoft Fabric :

  • Point de terminaison
  • Nom ou GUID de l’espace de travail Fabric
  • Nom ou GUID de l’artefact

Ces trois captures d’écran décrivent la récupération de ces ressources d’informations requises à partir de votre instance Microsoft Fabric.

Nom de l’espace de travail OneLake

Dans votre instance Microsoft Fabric, vous trouverez les informations de l’espace de travail, comme illustré dans cette capture d’écran. Vous pouvez utiliser une valeur GUID ou un « nom convivial » pour créer un magasin de données OneLake Machine Learning.

Capture d’écran montrant les détails de l’espace de travail Microsoft Fabric dans l’interface utilisateur de Microsoft Fabric.

Point de terminaison OneLake

Cette capture d’écran montre comment trouver les informations de point de terminaison dans votre instance Microsoft Fabric.

Capture d’écran montrant les détails du point de terminaison Microsoft Fabric dans l’interface utilisateur de Microsoft Fabric.

Nom de l’artefact OneLake

Cette capture d’écran montre comment trouver les informations d’artefact dans votre instance Microsoft Fabric. La capture d’écran montre aussi comment utiliser une valeur GUID ou un « nom convivial » pour créer un magasin de données OneLake Machine Learning.

Capture d’écran montrant comment obtenir les détails de l’artefact lakeouse Microsoft Fabric dans l’interface utilisateur de Microsoft Fabric.

Créer un magasin de données OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Étapes suivantes