다음을 통해 공유


데이터 저장소 만들기

적용 대상:Azure CLI ml 확장 v2(현재)Python SDK azure-ai-ml v2(현재)

이 문서에서는 Azure Machine Learning 데이터 저장소에서 Azure 데이터 스토리지 서비스에 연결하는 방법을 알아봅니다.

필수 구성 요소

참고 항목

Machine Learning 데이터 저장소는 기본 스토리지 계정 리소스를 만들지 않습니다 . 대신 Machine Learning 사용을 위해 기존 스토리지 계정을 연결합니다. Machine Learning 데이터 저장소는 필요하지 않습니다. 기본 데이터에 액세스할 수 있는 경우 스토리지 URI를 직접 사용할 수 있습니다.

Azure Blob 데이터 저장소 만들기

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Azure Data Lake Storage Gen2 데이터 저장소 만들기

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Azure Files 데이터 저장소 만들기

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Azure Data Lake Storage Gen1 데이터 저장소 만들기

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

OneLake(Microsoft Fabric) 데이터 저장소 만들기(미리 보기)

이 섹션에서는 OneLake 데이터 저장소를 만드는 다양한 옵션을 설명합니다. OneLake 데이터 저장소는 Microsoft Fabric의 일부입니다. 현재 Machine Learning은 폴더 또는 파일과 Amazon S3 바로 가기를 포함하는 "Files" 폴더의 Microsoft Fabric 레이크하우스 아티팩트에 대한 연결을 지원합니다. 레이크하우스에 대한 자세한 내용은 Microsoft Fabric의 레이크하우스란?을 참조하세요.

OneLake 데이터 저장소를 만들려면 Microsoft Fabric 인스턴스에서 다음 정보가 필요합니다.

  • 엔드포인트
  • 작업 영역 GUID
  • 아티팩트 GUID

다음 스크린샷에서는 Microsoft Fabric 인스턴스에서 이러한 필수 정보 리소스를 검색하는 방법을 설명합니다.

Microsoft Fabric UI에서 Microsoft Fabric 작업 영역 아티팩트의 아티팩트 속성을 클릭하는 방법을 보여 주는 스크린샷.

그런 다음 "속성" 페이지에서 "URL" 및 "ABFS 경로"에서 "엔드포인트", "작업 영역 GUID" 및 "아티팩트 GUID"를 찾습니다.

  • URL 형식: https://{your_one_lake_endpoint}/{your_one_lake_workspace_guid}/{your_one_lake_artifact_guid}/Files
  • ABFS 경로 형식: abfss://{your_one_lake_workspace_guid}@{your_one_lake_endpoint}/{your_one_lake_artifact_guid}/Files

Microsoft Fabric UI에서 OneLake 아티팩트의 URL 및 ABFS 경로를 보여 주는 스크린샷.

OneLake 데이터 저장소 만들기

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

다음 단계