Delen via


Gegevensarchieven maken

VAN TOEPASSING OP:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (current)

In dit artikel leert u hoe u verbinding maakt met Azure Data Storage-services met Azure Machine Learning-gegevensarchieven.

Vereisten

Notitie

Machine Learning-gegevensarchieven maken geen onderliggende opslagaccountbronnen. In plaats daarvan koppelen ze een bestaand opslagaccount voor machine learning-gebruik. Machine Learning-gegevensarchieven zijn niet vereist. Als u toegang hebt tot de onderliggende gegevens, kunt u opslag-URI's rechtstreeks gebruiken.

Een Azure Blob-gegevensarchief maken

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Een Azure Data Lake Storage Gen2-gegevensarchief maken

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Een Azure Files-gegevensarchief maken

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Een Azure Data Lake Storage Gen1-gegevensarchief maken

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Een OneLake-gegevensarchief (Microsoft Fabric) maken (preview)

In deze sectie worden verschillende opties beschreven voor het maken van een OneLake-gegevensarchief. Het OneLake-gegevensarchief maakt deel uit van Microsoft Fabric. Op dit moment ondersteunt Machine Learning verbinding met Microsoft Fabric Lakehouse-artefacten in de map 'Bestanden' die mappen of bestanden en Amazon S3-snelkoppelingen bevatten. Zie Wat is een lakehouse in Microsoft Fabric voor meer informatie over lakehouses.

Voor het maken van oneLake-gegevensopslag zijn de volgende gegevens van uw Microsoft Fabric-exemplaar vereist:

  • Eindpunt
  • Werkruimte-GUID
  • Guid van artefact

In de volgende schermopnamen wordt het ophalen van deze vereiste informatieresources van uw Microsoft Fabric-exemplaar beschreven.

Schermopname die laat zien hoe u klikt in artefacteigenschappen van microsoft Fabric-werkruimteartefacten in de gebruikersinterface van Microsoft Fabric.

Vervolgens vindt u 'Eindpunt', 'Werkruimte-GUID' en 'Artefact-GUID' in 'URL' en 'ABFS-pad' op de pagina Eigenschappen:

  • URL-indeling: https://{your_one_lake_endpoint}/{your_one_lake_workspace_guid}/{your_one_lake_artifact_guid}/Bestanden
  • ABFS-padindeling: abfss://{your_one_lake_workspace_guid}@{your_one_lake_endpoint}/{your_one_lake_artifact_guid}/Bestanden

Schermopname van URL en ABFS-pad van een OneLake-artefact in de gebruikersinterface van Microsoft Fabric.

Een OneLake-gegevensarchief maken

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Volgende stappen