DataReference 클래스

데이터 저장소의 데이터에 대한 참조를 나타냅니다.

DataReference는 데이터 저장소의 경로를 나타내며 실행에서 데이터를 사용할 수 있는 방법과 위치를 설명하는 데 사용할 수 있습니다. 더 이상 Azure Machine Learning에서 데이터 액세스 및 배달에 권장되는 접근 방식이 아닙니다. 데이터 세트 는 데이터 관리 기능이 추가된 통합 인터페이스를 통해 Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database 및 Azure Database for PostgreSQL에서 데이터에 액세스할 수 있도록 지원합니다. 기계 학습 프로젝트에서 데이터를 읽기 위해 데이터 세트를 사용하는 것이 좋습니다.

두 가지 일반적인 시나리오에서 Azure ML 데이터 세트를 사용하는 방법에 대한 자세한 내용은 다음 문서를 참조하세요.

클래스 DataReference 생성자입니다.

생성자

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

매개 변수

Name	Description
datastore 필수	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] 참조할 데이터 저장소입니다.
data_reference_name	str 데이터 참조의 이름입니다. Default value: None
path_on_datastore	str 데이터 참조에 대한 백업 스토리지의 상대 경로입니다. Default value: None
mode	str 데이터 참조에 대한 작업입니다. 지원되는 값은 'mount'(기본값) 및 '다운로드'입니다. 스크립트에 입력 데이터에 대한 특정 경로(예: 하드 코딩된)가 예상되는 경우 '다운로드' 모드를 사용합니다. 이 경우 DataReference를 선언할 때 매개 변수가 있는 `path_on_compute` 경로를 지정합니다. Azure Machine Learning은 스크립트를 실행하기 전에 해당 경로에 지정된 데이터를 다운로드합니다. '탑재' 모드를 사용하면 탑재된 데이터를 사용하여 임시 디렉터리가 만들어지고 환경 변수 $AZUREML_DATAREFERENCE_<data_reference_name> 임시 디렉터리의 경로와 함께 설정됩니다. 파이프라인 단계(예: PythonScriptStep)에 대한 인수 목록에 DataReference를 전달하면 런타임에 참조가 로컬 데이터 경로로 확장됩니다. Default value: mount
path_on_compute	str 데이터 참조에 대한 컴퓨팅 대상의 경로입니다. Default value: None
overwrite	bool 기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: False
datastore 필수	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] 참조할 데이터 저장소입니다.
data_reference_name 필수	str 데이터 참조의 이름입니다.
path_on_datastore 필수	str 데이터 참조에 대한 백업 스토리지의 상대 경로입니다.
mode 필수	str 데이터 참조에 대한 작업입니다. 지원되는 값 'mount'(기본값) 및 '다운로드'입니다. 스크립트에 입력 데이터에 대한 특정 경로(예: 하드 코딩된)가 예상되는 경우 '다운로드' 모드를 사용합니다. 이 경우 DataReference를 선언할 때 매개 변수가 있는 `path_on_compute` 경로를 지정합니다. Azure Machine Learning은 스크립트를 실행하기 전에 해당 경로에 지정된 데이터를 다운로드합니다. '탑재' 모드를 사용하면 탑재된 데이터를 사용하여 임시 디렉터리가 만들어지고 환경 변수 $AZUREML_DATAREFERENCE_<data_reference_name> 임시 디렉터리의 경로와 함께 설정됩니다. 파이프라인 단계(예: PythonScriptStep)에 대한 인수 목록에 DataReference를 전달하면 런타임에 참조가 로컬 데이터 경로로 확장됩니다.
path_on_compute 필수	str 데이터 참조에 대한 컴퓨팅 대상의 경로입니다.
overwrite 필수	bool 기존 데이터를 덮어쓸지 여부를 나타냅니다.

설명

DataReference는 데이터 위치와 대상 컴퓨팅 바인딩(탑재 또는 업로드)에서 데이터가 사용되는 방법을 모두 정의합니다. 데이터 저장소의 데이터 경로는 루트 /, 데이터 저장소 내의 디렉터리 또는 데이터 저장소의 파일일 수 있습니다.

메서드

as_download	데이터 참조 작업을 전환하여 다운로드합니다. DataReference 다운로드는 Azure Blob 및 Azure 파일 공유만 지원합니다. Azure Blob, Azure File Share, Azure Data Lake Gen1 및 Azure Data Lake Gen2에서 데이터를 다운로드하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요.
as_mount	탑재할 데이터 참조 작업을 전환합니다. DataReference 탑재는 Azure Blob만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에 데이터를 탑재하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요.
as_upload	업로드할 데이터 참조 작업을 전환합니다. 데이터 업로드를 지원하는 컴퓨팅 및 데이터 저장소에 대한 자세한 내용은 다음 https://aka.ms/datastore-matrix을 참조하세요.
create	DataPath 및 DataPathComputeBinding을 사용하여 DataReference를 만듭니다.
path	지정된 경로를 기반으로 DataReference 인스턴스를 만듭니다.
to_config	DataReference 개체를 DataReferenceConfiguration 개체로 변환합니다.

as_download

데이터 참조 작업을 전환하여 다운로드합니다.

DataReference 다운로드는 Azure Blob 및 Azure 파일 공유만 지원합니다. Azure Blob, Azure File Share, Azure Data Lake Gen1 및 Azure Data Lake Gen2에서 데이터를 다운로드하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요.

as_download(path_on_compute=None, overwrite=False)

매개 변수

Name	Description
path_on_compute	str 데이터 참조에 대한 컴퓨팅의 경로입니다. Default value: None
overwrite	bool 기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: False

반환

형식	Description
DataReference	새 데이터 참조 개체입니다.

as_mount

탑재할 데이터 참조 작업을 전환합니다.

DataReference 탑재는 Azure Blob만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에 데이터를 탑재하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요.

as_mount()

반환

형식	Description
DataReference	새 데이터 참조 개체입니다.

as_upload

업로드할 데이터 참조 작업을 전환합니다.

데이터 업로드를 지원하는 컴퓨팅 및 데이터 저장소에 대한 자세한 내용은 다음 https://aka.ms/datastore-matrix을 참조하세요.

as_upload(path_on_compute=None, overwrite=False)

매개 변수

Name	Description
path_on_compute	str 데이터 참조에 대한 컴퓨팅의 경로입니다. Default value: None
overwrite	bool 기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: False

반환

형식	Description
DataReference	새 데이터 참조 개체입니다.

create

DataPath 및 DataPathComputeBinding을 사용하여 DataReference를 만듭니다.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

매개 변수

Name	Description
data_reference_name	str 만들 데이터 참조의 이름입니다. Default value: None
datapath	DataPath [필수] 사용할 데이터 경로입니다. Default value: None
datapath_compute_binding	DataPathComputeBinding [필수] 사용할 데이터 경로 컴퓨팅 바인딩입니다. Default value: None

반환

형식	Description
DataReference	DataReference 개체입니다.

path

지정된 경로를 기반으로 DataReference 인스턴스를 만듭니다.

path(path=None, data_reference_name=None)

매개 변수

Name	Description
path	str 데이터 저장소의 경로입니다. Default value: None
data_reference_name	str 데이터 참조의 이름입니다. Default value: None

반환

형식	Description
DataReference	데이터 참조 개체입니다.

to_config

DataReference 개체를 DataReferenceConfiguration 개체로 변환합니다.

to_config()

반환

형식	Description
DataReferenceConfiguration	새 DataReferenceConfiguration 개체입니다.

피드백

이 페이지가 도움이 되었나요?