Estimator 클래스

제공된 프레임워크를 사용하여 데이터를 학습하기 위한 일반 예측 도구를 나타냅니다.

사용되지 않습니다. 자체 정의된 환경 또는 Azure ML 큐레이트 환경에서 ScriptRunConfig 개체를 사용합니다. ScriptRunConfig를 사용한 실험 실행 구성에 대한 소개는 학습 실행 구성 및 제출을 참조하세요.

이 클래스는 Azure Machine Learning이 미리 구성된 예측 도구가 없는 Machine Learning 프레임워크와 함께 사용하도록 설계되었습니다. Chainer, PyTorch, TensorFlowSKLearn에 대해 사전 구성된 예측 도구가 있습니다. 미리 구성되지 않은 예측 도구를 만들려면 예측 도구를 사용하여 Azure Machine Learning으로 모델 학습을 참조하세요.

Estimator 클래스는 스크립트 실행 방법을 지정하는 작업을 단순화하는 데 도움이 되도록 실행 구성 정보를 래핑합니다. 단일 노드 및 다중 노드 실행을 지원합니다. 예측 도구를 실행하면 학습 스크립트에 지정된 출력 디렉터리에 모델이 생성됩니다.

예측 도구를 초기화합니다.

azureml.core.environment._DEFAULT_SHM_SIZE 사용됩니다. 자세한 내용은 Docker run reference(Docker 실행 참고자료)를 참조하세요. :type shm_size: str :p aram resume_from: 실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: 실행에 허용되는 최대 시간입니다. Azure ML은 자동으로 시도합니다.

이 값보다 오래 걸리면 실행을 취소합니다.

상속
azureml.train.estimator._mml_base_estimator.MMLBaseEstimator
Estimator

생성자

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

매개 변수

source_directory
str
필수

학습 작업에 필요한 실험 구성 및 코드 파일이 포함된 로컬 디렉터리입니다.

compute_target
AbstractComputeTarget 또는 str
필수

학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다.

vm_size
str
필수

학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기.

vm_priority
str
필수

학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다.

지원되는 값: ‘dedicated’ 및 ‘lowpriority’.

vm_size 매개 변수가 입력에 지정된 경우에만 적용됩니다.

entry_script
str
필수

학습을 시작하는 데 사용되는 파일의 상대 경로입니다.

script_params
dict
필수

entry_script에 지정된 학습 스크립트에 전달할 명령줄 인수 사전입니다.

node_count
int
필수

학습에 사용되는 컴퓨팅 대상의 노드 수입니다. 1보다 크면 MPI 분산 작업이 실행됩니다.

process_count_per_node
int
필수

각 노드에서 실행할 프로세스(“작업자”)의 수입니다. 1보다 크면 MPI 분산 작업이 실행됩니다. 분산 작업에는 AmlCompute 대상만 지원됩니다.

distributed_backend
str
필수

분산 학습을 위한 통신 백 엔드입니다.

사용되지 않습니다. distributed_training 매개 변수를 사용합니다.

지원되는 값: ‘mpi’. ‘mpi’는 MPI/Horovod를 나타냅니다.

이 매개 변수는 node_count 또는 process_count_per_node> 1일 때 필요합니다.

node_count == 1이고 process_count_per_node == 1이면 백 엔드가 명시적으로 설정되지 않는 한 백 엔드가 사용되지 않습니다. 분산 학습에는 AmlCompute 대상만 지원됩니다.

distributed_training
Mpi
필수

분산 학습 작업을 실행하기 위한 매개 변수입니다.

MPI 백 엔드로 분산 작업을 실행하려면 Mpi 개체를 사용하여 process_count_per_node를 지정합니다.

use_gpu
bool
필수

실험을 실행할 환경이 GPU를 지원해야 하는지 여부를 나타냅니다. true인 경우 환경에서 GPU 기반 기본 Docker 이미지가 사용됩니다. false인 경우 CPU 기반 이미지가 사용됩니다. 기본 Docker 이미지(CPU 또는 GPU)는 custom_docker_image 매개 변수가 설정되지 않은 경우에만 사용됩니다. 이 설정은 Docker 지원 컴퓨팅 대상에서만 사용됩니다.

use_docker
bool
필수

실험을 실행할 환경이 Docker 기반이어야 하는지 여부를 지정합니다.

custom_docker_base_image
str
필수

학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다.

사용되지 않습니다. custom_docker_image 매개 변수를 사용합니다.

설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

custom_docker_image
str
필수

학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. 공용 docker 리포지토리(Docker Hub)에서 사용할 수 있는 이미지만 지정합니다. 프라이빗 Docker 리포지토리의 이미지를 사용하려면 생성자의 environment_definition 매개 변수를 대신 사용합니다.

image_registry_details
ContainerRegistry
필수

Docker 이미지 레지스트리의 세부 정보입니다.

user_managed
bool
필수

Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. false인 경우 conda 종속성 사양을 기반으로 Python 환경이 만들어집니다.

conda_packages
list
필수

실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다.

pip_packages
list
필수

실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다.

conda_dependencies_file_path
str
필수

conda 종속성 yaml 파일의 상대 경로입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.

사용되지 않습니다. conda_dependencies_file 매개 변수를 사용합니다.

conda_dependencies_file_path 또는 conda_dependencies_file를 지정합니다. 둘 다 지정되면 conda_dependencies_file이 사용됩니다.

pip_requirements_file_path
str
필수

pip 요구 사항 텍스트 파일의 상대 경로입니다.

사용되지 않습니다. pip_requirements_file 매개 변수를 사용합니다.

이 매개 변수는 pip_packages 매개 변수와 함께 지정할 수 있습니다. pip_requirements_file_path 또는 pip_requirements_file를 지정합니다. 둘 다 지정되면 pip_requirements_file이 사용됩니다.

conda_dependencies_file
str
필수

conda 종속성 yaml 파일의 상대 경로입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.

pip_requirements_file
str
필수

pip 요구 사항 텍스트 파일의 상대 경로입니다. 이 매개 변수는 pip_packages 매개 변수와 함께 지정할 수 있습니다.

environment_variables
dict
필수

환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다.

environment_definition
Environment
필수

실험에 대한 환경 정의입니다. 여기에는 PythonSection, DockerSection 및 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 이 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 use_gpu, custom_docker_image, conda_packages 또는 pip_packages와 같은 다른 환경 관련 매개 변수보다 우선 적용됩니다. 잘못된 조합에 대한 오류가 보고됩니다.

inputs
list
필수

입력으로 사용할 DataReference 또는 DatasetConsumptionConfig 개체의 목록입니다.

source_directory_data_store
Datastore
필수

프로젝트 공유에 대한 백업 데이터 저장소입니다.

shm_size
str
필수

Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본 azureml.core.environment._DEFAULT_SHM_SIZE가 사용됩니다. 자세한 내용은 Docker 실행 참조를 참조하세요.

resume_from
DataPath
필수

실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다.

max_run_duration_seconds
int
필수

실행에 허용되는 최대 시간입니다. Azure ML은 이 값보다 오래 걸리는 경우 실행을 자동으로 취소하려고 시도합니다.

source_directory
str
필수

학습 작업에 필요한 실험 구성 및 코드 파일이 포함된 로컬 디렉터리입니다.

compute_target
AbstractComputeTarget 또는 str
필수

학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다.

vm_size
str
필수

학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기.

vm_priority
str
필수

학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다.

지원되는 값: ‘dedicated’ 및 ‘lowpriority’.

vm_size 매개 변수가 입력에 지정된 경우에만 적용됩니다.

entry_script
str
필수

학습을 시작하는 데 사용되는 파일의 상대 경로입니다.

script_params
dict
필수

entry_script에 지정된 학습 스크립트에 전달할 명령줄 인수 사전입니다.

node_count
int
필수

학습에 사용되는 컴퓨팅 대상의 노드 수입니다. 1보다 큰 경우 MPI 분산 작업이 실행됩니다. 분산 작업에는 AmlCompute 대상만 지원됩니다.

process_count_per_node
int
필수

노드당 프로세스 수입니다. 1보다 큰 경우 MPI 분산 작업이 실행됩니다. 분산 작업에는 AmlCompute 대상만 지원됩니다.

distributed_backend
str
필수

분산 학습을 위한 통신 백 엔드입니다.

사용되지 않습니다. distributed_training 매개 변수를 사용합니다.

지원되는 값: ‘mpi’. ‘mpi’는 MPI/Horovod를 나타냅니다.

이 매개 변수는 node_count 또는 process_count_per_node> 1일 때 필요합니다.

node_count == 1이고 process_count_per_node == 1이면 백 엔드가 명시적으로 설정되지 않는 한 백 엔드가 사용되지 않습니다. 분산 학습에는 AmlCompute 대상만 지원됩니다.

distributed_training
Mpi
필수

분산 학습 작업을 실행하기 위한 매개 변수입니다.

MPI 백 엔드로 분산 작업을 실행하려면 Mpi 개체를 사용하여 process_count_per_node를 지정합니다.

use_gpu
bool
필수

실험을 실행할 환경에서 GPU를 지원해야 하는지 여부를 지정합니다. true인 경우 환경에서 GPU 기반 기본 Docker 이미지가 사용됩니다. false인 경우 CPU 기반 이미지가 사용됩니다. 기본 Docker 이미지(CPU 또는 GPU)는 custom_docker_image 매개 변수가 설정되지 않은 경우에만 사용됩니다. 이 설정은 Docker 지원 컴퓨팅 대상에서만 사용됩니다.

use_docker
bool
필수

실험을 실행할 환경이 Docker 기반이어야 하는지 여부를 지정합니다.

custom_docker_base_image
str
필수

학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다.

사용되지 않습니다. custom_docker_image 매개 변수를 사용합니다.

설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

custom_docker_image
str
필수

학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. 공용 docker 리포지토리(Docker Hub)에서 사용할 수 있는 이미지만 지정합니다. 프라이빗 Docker 리포지토리의 이미지를 사용하려면 생성자의 environment_definition 매개 변수를 대신 사용합니다.

image_registry_details
ContainerRegistry
필수

Docker 이미지 레지스트리의 세부 정보입니다.

user_managed
bool
필수

Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. false인 경우 conda 종속성 사양을 기반으로 Python 환경이 만들어집니다.

conda_packages
list
필수

실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다.

pip_packages
list
필수

실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다.

conda_dependencies_file_path
필수

conda 종속성 yaml 파일의 상대 경로입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.

사용되지 않습니다. conda_dependencies_file 매개 변수를 사용합니다.

conda_dependencies_file_path 또는 conda_dependencies_file를 지정합니다. 둘 다 지정되면 conda_dependencies_file이 사용됩니다.

pip_requirements_file_path
필수

pip 요구 사항 텍스트 파일의 상대 경로입니다.

사용되지 않습니다. pip_requirements_file 매개 변수를 사용합니다.

이 경로는 pip_packages 매개 변수와 함께 제공될 수 있습니다. pip_requirements_file_path 또는 pip_requirements_file를 지정합니다. 둘 다 지정되면 pip_requirements_file이 사용됩니다.

pip_requirements_file
str
필수

pip 요구 사항 텍스트 파일의 상대 경로입니다. pip_packages 매개 변수와 함께 제공할 수 있습니다.

environment_variables
dict
필수

환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다.

environment_definition
Environment
필수

실험에 대한 환경 정의입니다. 여기에는 PythonSection, DockerSection 및 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 이 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 use_gpu, custom_docker_image, conda_packages 또는 pip_packages와 같은 다른 환경 관련 매개 변수보다 우선 적용됩니다. 잘못된 조합에 대한 오류가 보고됩니다.

inputs
list
필수

입력으로 사용할 DataReference 또는 DatasetConsumptionConfig 개체의 목록입니다.

source_directory_data_store
Datastore
필수

프로젝트 공유에 대한 백업 데이터 저장소입니다.

shm_size
필수

Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본값입니다.

_disable_validation
bool
필수

제출을 실행하기 전에 스크립트 유효성 검사를 사용하지 않도록 설정합니다. 기본값은 true입니다.

_show_lint_warnings
bool
필수

스크립트 린팅 경고를 표시합니다. 기본값은 False입니다.

_show_package_warnings
bool
필수

패키지 유효성 검사 경고를 표시합니다. 기본값은 False입니다.