Создание хранилищ данных

ОБЛАСТЬ ПРИМЕНЕНИЯ:Расширение машинного обучения Azure CLI версии 2 (current)Python SDK azure-ai-ml версии 2 (current)

Из этой статьи вы узнаете, как подключиться к службам хранилища данных Azure с помощью Машинное обучение Azure хранилищ данных.

Необходимые компоненты

Примечание.

Машинное обучение Azure хранилища данных не создают базовые ресурсы учетной записи хранения. Вместо этого они связывают существующую учетную запись хранения для Машинное обучение Azure использования. Для этого не требуется Машинное обучение Azure хранилища данных. Если у вас есть доступ к базовым данным, можно использовать URI хранилища напрямую.

Создание хранилища данных BLOB-объектов Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Создание хранилища данных Azure Data Lake 2-го поколения

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Создание хранилища данных Файлов Azure

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Создание хранилища данных Azure Data Lake 1-го поколения

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Создание хранилища данных OneLake (Microsoft Fabric) (предварительная версия)

В этом разделе описаны различные параметры создания хранилища данных OneLake. Хранилище данных OneLake является частью Microsoft Fabric. В настоящее время Машинное обучение Azure поддерживает подключение к артефактам Microsoft Fabric Lakehouse, которые включают папки и файлы и сочетания клавиш Amazon S3. Дополнительные сведения о Lakehouse см . в статье "Что такое озеро" в Microsoft Fabric.

Требуется создание хранилища данных OneLake

  • Конечная точка
  • Имя рабочей области Fabric или GUID
  • Имя артефакта или GUID

сведения из экземпляра Microsoft Fabric. На этих трех снимках экрана описано получение этих необходимых информационных ресурсов из экземпляра Microsoft Fabric:

Имя рабочей области OneLake

В экземпляре Microsoft Fabric можно найти сведения о рабочей области, как показано на этом снимке экрана. Для Машинное обучение Azure создания хранилища данных OneLake можно использовать значение GUID или понятное имя.

Screenshot that shows Fabric Workspace details in Microsoft Fabric UI.

Конечная точка OneLake

На этом снимке экрана показано, как найти сведения о конечной точке в экземпляре Microsoft Fabric:

Screenshot that shows Fabric endpoint details in Microsoft Fabric UI.

Имя артефакта OneLake

На этом снимке экрана показано, как найти сведения артефакта в экземпляре Microsoft Fabric. На снимке экрана также показано, как использовать значение GUID или понятное имя для создания хранилища данных OneLake Машинное обучение Azure:

Screenshot showing how to get Fabric LH artifact details in Microsoft Fabric UI.

Создание хранилища данных OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Следующие шаги