Dela via


Estimator Klass

Representerar en allmän skattningsfaktor för att träna data med hjälp av ett angivet ramverk.

DEPRECATED. Använd objektet ScriptRunConfig med din egen definierade miljö eller en Azure ML-kurerad miljö. En introduktion till hur du konfigurerar experimentkörningar med ScriptRunConfig finns i Konfigurera och skicka träningskörningar.

Den här klassen är utformad för användning med maskininlärningsramverk som inte redan har en förkonfigurerad beräkning i Azure Machine Learning. Förkonfigurerade skattningar finns för Chainer, PyTorch, TensorFlowoch SKLearn. Information om hur du skapar en beräkning som inte är förkonfigurerad finns i Träna modeller med Azure Machine Learning med hjälp av uppskattning.

Estimator-klassen omsluter kör konfigurationsinformation för att förenkla uppgifterna för att ange hur ett skript ska köras. Den stöder körning med en nod och flera noder. När du kör uppskattningen skapas en modell i utdatakatalogen som anges i träningsskriptet.

Initiera uppskattningen.

azureml.core.environment._DEFAULT_SHM_SIZE används. Mer information finns i Docker-körningsreferens. :type shm_size: str :p aram resume_from: Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: Den högsta tillåtna tiden för körningen. Azure ML försöker automatiskt

avbryt körningen om det tar längre tid än det här värdet.

Arv
azureml.train.estimator._mml_base_estimator.MMLBaseEstimator
Estimator

Konstruktor

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametrar

Name Description
source_directory
Obligatorisk
str

En lokal katalog som innehåller experimentkonfiguration och kodfiler som behövs för ett träningsjobb.

compute_target
Obligatorisk

Beräkningsmålet där träningen ska ske. Detta kan antingen vara ett -objekt eller strängen "lokal".

vm_size
Obligatorisk
str

VM-storleken för beräkningsmålet som ska skapas för träningen. Värden som stöds: Valfri storlek på virtuella Azure-datorer.

vm_priority
Obligatorisk
str

VM-prioriteten för beräkningsmålet som ska skapas för träningen. Om inget anges används "dedikerad".

Värden som stöds: "dedikerad" och "lågprioritet".

Detta gäller endast när parametern vm_size anges i indata.

entry_script
Obligatorisk
str

Den relativa sökvägen till filen som används för att starta träningen.

script_params
Obligatorisk

En ordlista med kommandoradsargument som ska skickas till träningsskriptet som anges i entry_script.

node_count
Obligatorisk
int

Antalet noder i beräkningsmålet som används för träning. Om det är större än 1 körs ett MPI-distribuerat jobb.

process_count_per_node
Obligatorisk
int

Antalet processer (eller "arbetare") som ska köras på varje nod. Om det är större än 1 körs ett MPI-distribuerat jobb. Endast målet AmlCompute stöds för distribuerade jobb.

distributed_backend
Obligatorisk
str

Kommunikationsserverdelen för distribuerad träning.

DEPRECATED. Använd parametern distributed_training .

Värden som stöds: "mpi". "mpi" representerar MPI/Horovod.

Den här parametern krävs när node_count eller process_count_per_node> 1.

När node_count == 1 och process_count_per_node == 1 används ingen serverdel om inte serverdelen uttryckligen anges. AmlCompute Endast målet stöds för distribuerad träning.

distributed_training
Obligatorisk
Mpi

Parametrar för att köra ett distribuerat träningsjobb.

För att köra ett distribuerat jobb med MPI-serverdelen använder du Mpi -objektet för att ange process_count_per_node.

use_gpu
Obligatorisk

Anger om miljön som ska köra experimentet ska ha stöd för GPU:er. Om det är sant används en GPU-baserad Docker-standard avbildning i miljön. Om det är falskt används en CPU-baserad avbildning. Docker-standardbilder (CPU eller GPU) används endast om parametern custom_docker_image inte har angetts. Den här inställningen används endast i Docker-aktiverade beräkningsmål.

use_docker
Obligatorisk

Anger om miljön som ska köra experimentet ska vara Docker-baserad.

custom_docker_base_image
Obligatorisk
str

Namnet på den Docker-avbildning som avbildningen som ska användas för träning kommer att skapas.

DEPRECATED. Använd parametern custom_docker_image .

Om den inte anges används en standard-CPU-baserad avbildning som basavbildning.

custom_docker_image
Obligatorisk
str

Namnet på den Docker-avbildning som avbildningen som ska användas för träning kommer att skapas. Om den inte anges används en standard-CPU-baserad avbildning som basavbildning. Ange endast avbildningar som är tillgängliga i offentliga Docker-lagringsplatser (Docker Hub). Om du vill använda en avbildning från en privat Docker-lagringsplats använder du konstruktorns environment_definition parameter i stället.

image_registry_details
Obligatorisk

Information om Docker-avbildningsregistret.

user_managed
Obligatorisk

Anger om Azure ML återanvänder en befintlig Python-miljö. Om det är falskt skapas en Python-miljö baserat på specifikationen för conda-beroenden.

conda_packages
Obligatorisk

En lista med strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet.

pip_packages
Obligatorisk

En lista med strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet.

conda_dependencies_file_path
Obligatorisk
str

Den relativa sökvägen till yaml-filen conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket.

DEPRECATED. conda_dependencies_file Använd paramentern.

Ange antingen conda_dependencies_file_path eller conda_dependencies_file. Om båda anges conda_dependencies_file används.

pip_requirements_file_path
Obligatorisk
str

Den relativa sökvägen till textfilen pip requirements.

DEPRECATED. Använd parametern pip_requirements_file .

Den här parametern kan anges i kombination med parametern pip_packages . Ange antingen pip_requirements_file_path eller pip_requirements_file. Om båda anges pip_requirements_file används.

conda_dependencies_file
Obligatorisk
str

Den relativa sökvägen till yaml-filen conda-beroenden. Om detta anges installerar Inte Azure ML några ramverksrelaterade paket.

pip_requirements_file
Obligatorisk
str

Den relativa sökvägen till textfilen pip requirements. Den här parametern kan anges i kombination med parametern pip_packages .

environment_variables
Obligatorisk

En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i processen där användarskript körs.

environment_definition
Obligatorisk

Miljödefinitionen för experimentet. Den innehåller PythonSection, DockerSection och miljövariabler. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med den här parametern. Om den här parametern anges har den företräde framför andra miljörelaterade parametrar som use_gpu, custom_docker_image, conda_packageseller pip_packages. Fel rapporteras för ogiltiga kombinationer.

inputs
Obligatorisk

En lista över DataReference eller DatasetConsumptionConfig objekt som ska användas som indata.

source_directory_data_store
Obligatorisk

Det säkerhetskopierade datalagret för projektresursen.

shm_size
Obligatorisk
str

Storleken på Docker-containerns delade minnesblock. Om inte anges används standard azureml.core.environment._DEFAULT_SHM_SIZE. Mer information finns i Docker-körningsreferens.

resume_from
Obligatorisk

Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från.

max_run_duration_seconds
Obligatorisk
int

Den maximala tillåtna tiden för körningen. Azure ML försöker automatiskt avbryta körningen om det tar längre tid än det här värdet.

source_directory
Obligatorisk
str

En lokal katalog som innehåller experimentkonfiguration och kodfiler som behövs för ett träningsjobb.

compute_target
Obligatorisk

Beräkningsmålet där träning ska ske. Detta kan antingen vara ett objekt eller strängen "local".

vm_size
Obligatorisk
str

Storleken på den virtuella datorn för beräkningsmålet som ska skapas för träningen. Värden som stöds: Valfri storlek på virtuella Azure-datorer.

vm_priority
Obligatorisk
str

Vm-prioriteten för det beräkningsmål som ska skapas för träningen. Om det inte anges används "dedikerad".

Värden som stöds: "dedikerad" och "lågprioritet".

Detta gäller endast när parametern vm_size anges i indata.

entry_script
Obligatorisk
str

Den relativa sökvägen till filen som används för att starta träningen.

script_params
Obligatorisk

En ordlista med kommandoradsargument som ska skickas till träningsskriptet som anges i entry_script.

node_count
Obligatorisk
int

Antalet noder i beräkningsmålet som används för träning. Om det är större än 1 körs ett MPI-distribuerat jobb. AmlCompute Endast målet stöds för distribuerade jobb.

process_count_per_node
Obligatorisk
int

Antalet processer per nod. Om det är större än 1 körs ett MPI-distribuerat jobb. AmlCompute Endast målet stöds för distribuerade jobb.

distributed_backend
Obligatorisk
str

Kommunikationsserverdelen för distribuerad träning.

DEPRECATED. Använd parametern distributed_training .

Värden som stöds: "mpi". "mpi" representerar MPI/Horovod.

Den här parametern krävs när node_count eller process_count_per_node> 1.

När node_count == 1 och process_count_per_node == 1 används ingen serverdel om inte serverdelen uttryckligen anges. AmlCompute Endast målet stöds för distribuerad träning.

distributed_training
Obligatorisk
Mpi

Parametrar för att köra ett distribuerat träningsjobb.

För att köra ett distribuerat jobb med MPI-serverdelen använder du Mpi objektet för att ange process_count_per_node.

use_gpu
Obligatorisk

Anger om miljön som ska köra experimentet ska ha stöd för GPU:er. Om det är sant används en GPU-baserad Standard Docker-avbildning i miljön. Om det är falskt används en CPU-baserad avbildning. Docker-standardbilder (CPU eller GPU) används endast om parametern custom_docker_image inte har angetts. Den här inställningen används endast i Docker-aktiverade beräkningsmål.

use_docker
Obligatorisk

Anger om miljön som ska köra experimentet ska vara Docker-baserad.

custom_docker_base_image
Obligatorisk
str

Namnet på den Docker-avbildning som avbildningen ska använda för träning kommer att skapas.

DEPRECATED. Använd parametern custom_docker_image .

Om den inte har angetts används en cpu-baserad standardavbildning som basavbildning.

custom_docker_image
Obligatorisk
str

Namnet på den Docker-avbildning som avbildningen ska använda för träning kommer att skapas. Om den inte har angetts används en cpu-baserad standardavbildning som basavbildning. Ange endast avbildningar som är tillgängliga i offentliga docker-lagringsplatser (Docker Hub). Om du vill använda en avbildning från en privat docker-lagringsplats använder du konstruktorns environment_definition parameter i stället.

image_registry_details
Obligatorisk

Information om Docker-avbildningsregistret.

user_managed
Obligatorisk

Anger om Azure ML återanvänder en befintlig Python-miljö. Om det är falskt skapas en Python-miljö baserat på conda-beroendespecifikationen.

conda_packages
Obligatorisk

En lista över strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet.

pip_packages
Obligatorisk

En lista över strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet.

conda_dependencies_file_path
Obligatorisk

Den relativa sökvägen till yaml-filen conda-beroenden. Om det anges kommer Azure ML inte att installera några ramverksrelaterade paket.

DEPRECATED. conda_dependencies_file Använd paramentern.

Ange antingen conda_dependencies_file_path eller conda_dependencies_file. Om båda anges conda_dependencies_file används.

pip_requirements_file_path
Obligatorisk

Den relativa sökvägen till pip-kravtextfilen.

DEPRECATED. Använd parametern pip_requirements_file .

Detta kan anges i kombination med parametern pip_packages . Ange antingen pip_requirements_file_path eller pip_requirements_file. Om båda anges pip_requirements_file används.

pip_requirements_file
Obligatorisk
str

Den relativa sökvägen till pip-kravtextfilen. Detta kan anges i kombination med parametern pip_packages .

environment_variables
Obligatorisk

En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i den process där användarskript körs.

environment_definition
Obligatorisk

Miljödefinitionen för experimentet. Den innehåller variablerna PythonSection, DockerSection och miljö. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med den här parametern. Om den här parametern anges har den företräde framför andra miljörelaterade parametrar som use_gpu, custom_docker_image, conda_packageseller pip_packages. Fel rapporteras för ogiltiga kombinationer.

inputs
Obligatorisk

En lista över DataReference eller DatasetConsumptionConfig objekt som ska användas som indata.

source_directory_data_store
Obligatorisk

Det säkerhetskopierade datalagret för projektresursen.

shm_size
Obligatorisk

Storleken på Docker-containerns delade minnesblock. Om den inte har angetts är standardinställningen

_disable_validation
Obligatorisk

Inaktivera skriptvalidering innan du kör sändningen. Standardvärdet är Sant.

_show_lint_warnings
Obligatorisk

Visa varningar om skriptlindning. Standardvärdet är Falskt.

_show_package_warnings
Obligatorisk

Visa paketverifieringsvarningar. Standardvärdet är Falskt.