Opprette et datalager

Fullført

I Azure Machine Learning er datalagre abstraksjoner for skydatakilder. De kapsler inn informasjonen som kreves for å koble til datakilder, og lagrer denne tilkoblingsinformasjonen på en sikker måte, slik at du ikke trenger å kode den i skriptene.

Fordelene ved å bruke datalagere er:

  • Gir brukervennlige URIer til datalagringen.
  • Forenkler dataoppdagelse i Azure Machine Learning.
  • Lagrer sikkert tilkoblingsinformasjon, uten å avsløre hemmeligheter og nøkler til dataforskere.

Når du oppretter et datalager med en eksisterende lagringskonto på Azure, har du valget mellom to ulike godkjenningsmetoder:

diagram over to forskjellige godkjenningsmetoder Azure Machine Learning-datalagre bruker til å koble til eksterne datakilder.

  • Legitimasjonsbasert: Bruk et tjenestekontohaver, delt tilgangssignatur (SAS) eller kontonøkkel for å godkjenne tilgang til lagringskontoen.
  • identitetsbasert: Bruk Microsoft Entra-identitet eller administrert identitet.

Forstå typer datalagere

Azure Machine Learning støtter oppretting av datalagre for flere typer Azure-datakilder, inkludert:

  • Azure Blob Storage
  • Deling av Azure-filer
  • Azure Data Lake (generasjon 2)

Bruke de innebygde datalagrene

Hvert arbeidsområde har fire innebygde datalagre (to kobler til Azure Storage BLOB-beholdere og to tilkoblinger til Azure Storage-filressurser), som brukes som systemlagringer av Azure Machine Learning.

I de fleste maskinlæringsprosjekter må du arbeide med datakilder selv. Du kan for eksempel integrere maskinlæringsløsningen med data fra eksisterende programmer eller datateknikksamlebånd.

Opprette et datalager

Datalagre er knyttet til arbeidsområder og brukes til å lagre tilkoblingsinformasjon til lagringstjenester. Når du oppretter et datalager, angir du et navn som kan brukes til å hente tilkoblingsinformasjonen.

Med datalager kan du enkelt koble til lagringstjenester uten å måtte oppgi alle nødvendige detaljer hver gang du vil lese eller skrive data. Det oppretter også et beskyttende lag hvis du vil at brukerne skal bruke dataene, men ikke koble til den underliggende lagringstjenesten direkte.

Opprette et datalager for en Azure Blob Storage-beholder

Du kan opprette et datalager via det grafiske brukergrensesnittet, Azure-kommandolinjegrensesnittet (CLI) eller Python Software Development Kit (SDK).

Avhengig av lagringstjenesten du vil koble til, finnes det ulike alternativer for godkjenning av Azure Machine Learning.

Når du for eksempel vil opprette et datalager for å koble til en Azure Blob Storage-beholder, kan du bruke en kontonøkkel:

blob_datastore = AzureBlobDatastore(
    			name = "blob_example",
    			description = "Datastore pointing to a blob container",
    			account_name = "mytestblobstore",
    			container_name = "data-container",
    			credentials = AccountKeyConfiguration(
        			account_key="XXXxxxXXXxXXXXxxXXX"
    			),
)
ml_client.create_or_update(blob_datastore)

Du kan også opprette et datalager for å koble til en Azure Blob Storage-beholder ved hjelp av et SAS-token for å godkjenne:

blob_datastore = AzureBlobDatastore(
name="blob_sas_example",
description="Datastore pointing to a blob container",
account_name="mytestblobstore",
container_name="data-container",
credentials=SasTokenConfiguration(
sas_token="?xx=XXXX-XX-XX&xx=xxxx&xxx=xxx&xx=xxxxxxxxxxx&xx=XXXX-XX-XXXXX:XX:XXX&xx=XXXX-XX-XXXXX:XX:XXX&xxx=xxxxx&xxx=XXxXXXxxxxxXXXXXXXxXxxxXXXXXxxXXXXXxXXXXxXXXxXXxXX"
),
)
ml_client.create_or_update(blob_datastore)