Udostępnij za pośrednictwem


Tworzenie magazynów danych

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

Z tego artykułu dowiesz się, jak nawiązać połączenie z usługami magazynu danych platformy Azure za pomocą magazynów danych usługi Azure Machine Learning.

Wymagania wstępne

Uwaga

Magazyny danych usługi Machine Learning nie tworzą bazowych zasobów konta magazynu. Zamiast tego łączą istniejące konto magazynu na potrzeby uczenia maszynowego. Magazyny danych usługi Machine Learning nie są wymagane. Jeśli masz dostęp do danych bazowych, możesz bezpośrednio użyć identyfikatorów URI magazynu.

Tworzenie magazynu danych obiektów blob platformy Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Tworzenie magazynu danych usługi Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Tworzenie magazynu danych usługi Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Tworzenie magazynu danych usługi Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Tworzenie magazynu danych usługi OneLake (Microsoft Fabric) (wersja zapoznawcza)

W tej sekcji opisano różne opcje tworzenia magazynu danych OneLake. Magazyn danych OneLake jest częścią usługi Microsoft Fabric. Obecnie usługa Machine Learning obsługuje połączenie z artefaktami lakehouse usługi Microsoft Fabric w folderze "Files", które zawierają foldery lub pliki i skróty Amazon S3. Aby uzyskać więcej informacji na temat lakehouses, zobacz Co to jest lakehouse w usłudze Microsoft Fabric?.

Tworzenie magazynu danych oneLake wymaga następujących informacji z wystąpienia usługi Microsoft Fabric:

  • Punkt końcowy
  • Identyfikator GUID obszaru roboczego
  • Identyfikator GUID artefaktu

Na poniższych zrzutach ekranu opisano pobieranie tych wymaganych zasobów informacji z wystąpienia usługi Microsoft Fabric.

Zrzut ekranu przedstawiający sposób kliknięcia w właściwości artefaktu artefaktu obszaru roboczego usługi Microsoft Fabric w interfejsie użytkownika usługi Microsoft Fabric.

Następnie znajdziesz ciąg "Endpoint", "Workspace GUID" i "Artifact GUID" (Identyfikator GUID artefaktu) na stronie "URL" i "ABFS path":

  • Format adresu URL: https://{your_one_lake_endpoint}{your_one_lake_workspace_guid}//{your_one_lake_artifact_guid}/Pliki
  • Format ścieżki ABFS: abfss://{your_one_lake_workspace_guid}{your_one_lake_endpoint}/@{your_one_lake_artifact_guid}/Pliki

Zrzut ekranu przedstawiający adres URL i ścieżkę ABFS artefaktu OneLake w interfejsie użytkownika usługi Microsoft Fabric.

Tworzenie magazynu danych OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Następne kroki