DataReference 클래스
데이터 저장소의 데이터에 대한 참조를 나타냅니다.
DataReference는 데이터 저장소의 경로를 나타내며 실행에서 데이터를 사용할 수 있는 방법과 위치를 설명하는 데 사용할 수 있습니다. 더 이상 Azure Machine Learning에서 데이터 액세스 및 배달에 권장되는 접근 방식이 아닙니다. 데이터 세트 는 데이터 관리 기능이 추가된 통합 인터페이스를 통해 Azure Blob Storage, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database 및 Azure Database for PostgreSQL에서 데이터에 액세스할 수 있도록 지원합니다. 기계 학습 프로젝트에서 데이터를 읽기 위해 데이터 세트를 사용하는 것이 좋습니다.
두 가지 일반적인 시나리오에서 Azure ML 데이터 세트를 사용하는 방법에 대한 자세한 내용은 다음 문서를 참조하세요.
클래스 DataReference 생성자입니다.
생성자
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
매개 변수
| Name | Description |
|---|---|
|
datastore
필수
|
참조할 데이터 저장소입니다. |
|
data_reference_name
|
데이터 참조의 이름입니다. Default value: None
|
|
path_on_datastore
|
데이터 참조에 대한 백업 스토리지의 상대 경로입니다. Default value: None
|
|
mode
|
데이터 참조에 대한 작업입니다. 지원되는 값은 'mount'(기본값) 및 '다운로드'입니다. 스크립트에 입력 데이터에 대한 특정 경로(예: 하드 코딩된)가 예상되는 경우 '다운로드' 모드를 사용합니다.
이 경우 DataReference를 선언할 때 매개 변수가 있는 '탑재' 모드를 사용하면 탑재된 데이터를 사용하여 임시 디렉터리가 만들어지고 환경 변수 $AZUREML_DATAREFERENCE_<data_reference_name> 임시 디렉터리의 경로와 함께 설정됩니다. 파이프라인 단계(예: PythonScriptStep)에 대한 인수 목록에 DataReference를 전달하면 런타임에 참조가 로컬 데이터 경로로 확장됩니다. Default value: mount
|
|
path_on_compute
|
데이터 참조에 대한 컴퓨팅 대상의 경로입니다. Default value: None
|
|
overwrite
|
기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: False
|
|
datastore
필수
|
참조할 데이터 저장소입니다. |
|
data_reference_name
필수
|
데이터 참조의 이름입니다. |
|
path_on_datastore
필수
|
데이터 참조에 대한 백업 스토리지의 상대 경로입니다. |
|
mode
필수
|
데이터 참조에 대한 작업입니다. 지원되는 값 'mount'(기본값) 및 '다운로드'입니다. 스크립트에 입력 데이터에 대한 특정 경로(예: 하드 코딩된)가 예상되는 경우 '다운로드' 모드를 사용합니다.
이 경우 DataReference를 선언할 때 매개 변수가 있는 '탑재' 모드를 사용하면 탑재된 데이터를 사용하여 임시 디렉터리가 만들어지고 환경 변수 $AZUREML_DATAREFERENCE_<data_reference_name> 임시 디렉터리의 경로와 함께 설정됩니다. 파이프라인 단계(예: PythonScriptStep)에 대한 인수 목록에 DataReference를 전달하면 런타임에 참조가 로컬 데이터 경로로 확장됩니다. |
|
path_on_compute
필수
|
데이터 참조에 대한 컴퓨팅 대상의 경로입니다. |
|
overwrite
필수
|
기존 데이터를 덮어쓸지 여부를 나타냅니다. |
설명
DataReference는 데이터 위치와 대상 컴퓨팅 바인딩(탑재 또는 업로드)에서 데이터가 사용되는 방법을 모두 정의합니다. 데이터 저장소의 데이터 경로는 루트 /, 데이터 저장소 내의 디렉터리 또는 데이터 저장소의 파일일 수 있습니다.
메서드
| as_download |
데이터 참조 작업을 전환하여 다운로드합니다. DataReference 다운로드는 Azure Blob 및 Azure 파일 공유만 지원합니다. Azure Blob, Azure File Share, Azure Data Lake Gen1 및 Azure Data Lake Gen2에서 데이터를 다운로드하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요. |
| as_mount |
탑재할 데이터 참조 작업을 전환합니다. DataReference 탑재는 Azure Blob만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에 데이터를 탑재하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요. |
| as_upload |
업로드할 데이터 참조 작업을 전환합니다. 데이터 업로드를 지원하는 컴퓨팅 및 데이터 저장소에 대한 자세한 내용은 다음 https://aka.ms/datastore-matrix을 참조하세요. |
| create |
DataPath 및 DataPathComputeBinding을 사용하여 DataReference를 만듭니다. |
| path |
지정된 경로를 기반으로 DataReference 인스턴스를 만듭니다. |
| to_config |
DataReference 개체를 DataReferenceConfiguration 개체로 변환합니다. |
as_download
데이터 참조 작업을 전환하여 다운로드합니다.
DataReference 다운로드는 Azure Blob 및 Azure 파일 공유만 지원합니다. Azure Blob, Azure File Share, Azure Data Lake Gen1 및 Azure Data Lake Gen2에서 데이터를 다운로드하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요.
as_download(path_on_compute=None, overwrite=False)
매개 변수
| Name | Description |
|---|---|
|
path_on_compute
|
데이터 참조에 대한 컴퓨팅의 경로입니다. Default value: None
|
|
overwrite
|
기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: False
|
반환
| 형식 | Description |
|---|---|
|
새 데이터 참조 개체입니다. |
as_mount
탑재할 데이터 참조 작업을 전환합니다.
DataReference 탑재는 Azure Blob만 지원합니다. Azure Blob, Azure 파일 공유, Azure Data Lake Gen1 및 Azure Data Lake Gen2에 데이터를 탑재하려면 Azure Machine Learning 데이터 세트를 사용하는 것이 좋습니다. 데이터 세트를 만들고 사용하는 방법에 대한 자세한 내용은 다음을 참조 https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets하세요.
as_mount()
반환
| 형식 | Description |
|---|---|
|
새 데이터 참조 개체입니다. |
as_upload
업로드할 데이터 참조 작업을 전환합니다.
데이터 업로드를 지원하는 컴퓨팅 및 데이터 저장소에 대한 자세한 내용은 다음 https://aka.ms/datastore-matrix을 참조하세요.
as_upload(path_on_compute=None, overwrite=False)
매개 변수
| Name | Description |
|---|---|
|
path_on_compute
|
데이터 참조에 대한 컴퓨팅의 경로입니다. Default value: None
|
|
overwrite
|
기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: False
|
반환
| 형식 | Description |
|---|---|
|
새 데이터 참조 개체입니다. |
create
DataPath 및 DataPathComputeBinding을 사용하여 DataReference를 만듭니다.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
매개 변수
| Name | Description |
|---|---|
|
data_reference_name
|
만들 데이터 참조의 이름입니다. Default value: None
|
|
datapath
|
[필수] 사용할 데이터 경로입니다. Default value: None
|
|
datapath_compute_binding
|
[필수] 사용할 데이터 경로 컴퓨팅 바인딩입니다. Default value: None
|
반환
| 형식 | Description |
|---|---|
|
DataReference 개체입니다. |
path
지정된 경로를 기반으로 DataReference 인스턴스를 만듭니다.
path(path=None, data_reference_name=None)
매개 변수
| Name | Description |
|---|---|
|
path
|
데이터 저장소의 경로입니다. Default value: None
|
|
data_reference_name
|
데이터 참조의 이름입니다. Default value: None
|
반환
| 형식 | Description |
|---|---|
|
데이터 참조 개체입니다. |
to_config
DataReference 개체를 DataReferenceConfiguration 개체로 변환합니다.
to_config()
반환
| 형식 | Description |
|---|---|
|
새 DataReferenceConfiguration 개체입니다. |