DataReference 클래스
데이터 저장소의 데이터에 대한 참조를 나타냅니다.
DataReference는 데이터 저장소의 경로를 나타내며 실행 시 데이터를 사용할 수 있는 방법과 위치를 설명하는 데 사용될 수 있습니다. 더 이상 Azure Machine Learning의 데이터 액세스 및 배달에 권장되는 액세스 방식이 아닙니다. 데이터 집합은 데이터 관리 기능이 추가된 통합 인터페이스를 통해 Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database, Azure Database for PostgreSQL의 데이터 액세스를 지원합니다. 기계 학습 프로젝트에서 데이터를 읽는 데 데이터 집합을 사용하는 것이 좋습니다.
두 가지 일반적인 시나리오에서 Azure ML 데이터 집합을 사용하는 방법에 대한 자세한 내용은 다음 문서를 참조하세요.
- Create and run machine learning pipelines(기계 학습 파이프라인 만들기 및 실행)
- 학습에서 추정 만들기
클래스 DataReference 생성자입니다.
- 상속
-
builtins.objectDataReference
생성자
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
매개 변수
Name | Description |
---|---|
datastore
필수
|
참조할 데이터 저장소입니다. |
data_reference_name
|
데이터 참조의 이름입니다. Default value: None
|
path_on_datastore
|
데이터 참조에 대한 지원 스토리지의 상대 경로입니다. Default value: None
|
mode
|
데이터 참조에 대한 작업입니다. 지원되는 값은 'mount'(기본값) 및 'download'입니다. 스크립트가 입력 데이터에 대한 특정(예: 하드 코딩된) 경로를 예상하는 경우 'download' 모드를 사용합니다.
이 경우 DataReference를 선언할 때 'mount' 모드를 사용하면 탑재된 데이터로 임시 디렉터리가 만들어지고 환경 변수 $AZUREML_DATAREFERENCE_<data_reference_name>이 임시 디렉터리 경로로 설정됩니다. 파이프라인 단계(예: PythonScriptStep)에 대한 인수 목록에 DataReference를 전달하면 런타임 시 참조가 로컬 데이터 경로로 확장됩니다. Default value: mount
|
path_on_compute
|
데이터 참조에 대한 컴퓨팅 대상의 경로입니다. Default value: None
|
overwrite
|
기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: False
|
datastore
필수
|
참조할 데이터 저장소입니다. |
data_reference_name
필수
|
데이터 참조의 이름입니다. |
path_on_datastore
필수
|
데이터 참조에 대한 지원 스토리지의 상대 경로입니다. |
mode
필수
|
데이터 참조에 대한 작업입니다. 지원되는 값 'mount'(기본값) 및 '다운로드'. 스크립트가 입력 데이터에 대한 특정(예: 하드 코딩된) 경로를 예상하는 경우 'download' 모드를 사용합니다.
이 경우 DataReference를 선언할 때 'mount' 모드를 사용하면 탑재된 데이터로 임시 디렉터리가 만들어지고 환경 변수 $AZUREML_DATAREFERENCE_<data_reference_name>이 임시 디렉터리 경로로 설정됩니다. 파이프라인 단계(예: PythonScriptStep)에 대한 인수 목록에 DataReference를 전달하면 런타임 시 참조가 로컬 데이터 경로로 확장됩니다. |
path_on_compute
필수
|
데이터 참조에 대한 컴퓨팅 대상의 경로입니다. |
overwrite
필수
|
기존 데이터를 덮어쓸지 여부를 나타냅니다. |
설명
DataReference는 데이터 위치와 대상 컴퓨팅 바인딩(탑재 또는 업로드)에서 데이터가 사용되는 방식을 모두 정의합니다. 데이터 저장소의 데이터 경로는 루트 /, 데이터 저장소 내의 디렉터리 또는 데이터 저장소의 파일일 수 있습니다.
메서드
as_download |
데이터 참조 작업을 다운로드로 전환합니다. DataReference 다운로드는 Azure Blob 및 Azure 파일 공유만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에서 데이터를 다운로드하려면 Azure Machine Learning Dataset을 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets를 참조하세요. |
as_mount |
탑재할 데이터 참조 작업을 전환합니다. DataReference 탑재는 Azure Blob만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에 데이터를 탑재하려면 Azure Machine Learning Dataset을 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets를 참조하세요. |
as_upload |
업로드할 데이터 참조 작업을 전환합니다. 데이터 업로드를 지원하는 컴퓨팅 및 데이터 저장소에 대한 자세한 내용은 https://aka.ms/datastore-matrix를 참조하세요. |
create |
DataPath 및 DataPathComputeBinding을 사용하여 DataReference를 만듭니다. |
path |
지정된 경로를 기반으로 DataReference 인스턴스를 만듭니다. |
to_config |
DataReference 개체를 DataReferenceConfiguration 개체로 변환합니다. |
as_download
데이터 참조 작업을 다운로드로 전환합니다.
DataReference 다운로드는 Azure Blob 및 Azure 파일 공유만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에서 데이터를 다운로드하려면 Azure Machine Learning Dataset을 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets를 참조하세요.
as_download(path_on_compute=None, overwrite=False)
매개 변수
Name | Description |
---|---|
path_on_compute
|
데이터 참조에 대한 컴퓨팅의 경로입니다. Default value: None
|
overwrite
|
기존 데이터를 덮어쓸지 여부입니다. Default value: False
|
반환
형식 | Description |
---|---|
새 데이터 참조 개체입니다. |
as_mount
탑재할 데이터 참조 작업을 전환합니다.
DataReference 탑재는 Azure Blob만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에 데이터를 탑재하려면 Azure Machine Learning Dataset을 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets를 참조하세요.
as_mount()
반환
형식 | Description |
---|---|
새 데이터 참조 개체입니다. |
as_upload
업로드할 데이터 참조 작업을 전환합니다.
데이터 업로드를 지원하는 컴퓨팅 및 데이터 저장소에 대한 자세한 내용은 https://aka.ms/datastore-matrix를 참조하세요.
as_upload(path_on_compute=None, overwrite=False)
매개 변수
Name | Description |
---|---|
path_on_compute
|
데이터 참조에 대한 컴퓨팅의 경로입니다. Default value: None
|
overwrite
|
기존 데이터를 덮어쓸지 여부입니다. Default value: False
|
반환
형식 | Description |
---|---|
새 데이터 참조 개체입니다. |
create
DataPath 및 DataPathComputeBinding을 사용하여 DataReference를 만듭니다.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
매개 변수
Name | Description |
---|---|
data_reference_name
|
만들 데이터 참조의 이름입니다. Default value: None
|
datapath
|
[필수] 사용할 데이터 경로입니다. Default value: None
|
datapath_compute_binding
|
[필수] 사용할 데이터 경로 컴퓨팅 바인딩입니다. Default value: None
|
반환
형식 | Description |
---|---|
DataReference 개체입니다. |
path
지정된 경로를 기반으로 DataReference 인스턴스를 만듭니다.
path(path=None, data_reference_name=None)
매개 변수
Name | Description |
---|---|
path
|
데이터 저장소의 경로입니다. Default value: None
|
data_reference_name
|
데이터 참조의 이름입니다. Default value: None
|
반환
형식 | Description |
---|---|
데이터 참조 개체입니다. |
to_config
DataReference 개체를 DataReferenceConfiguration 개체로 변환합니다.
to_config()
반환
형식 | Description |
---|---|
새 DataReferenceConfiguration 개체입니다. |