SKLearn Classe
Cria um avaliador para treinamento em experimentos de Scikit-learn.
PRETERIDO. Use o objeto ScriptRunConfig com seu próprio ambiente definido ou o ambiente com curadoria do AzureML-Tutorial. Para obter uma introdução à configuração de execuções de experimentos SKLearn com ScriptRunConfig, consulte Treinar modelos do scikit-learn em escala com o Azure Machine Learning.
Esse avaliador dá suporte apenas a treinamento de CPU de nó único.
Versões com suporte: 0.20.3
Inicialize um avaliador do Scikit-learn.
- Herança
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Construtor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parâmetros
- source_directory
- str
Um diretório local que contém os arquivos de configuração do experimento.
- compute_target
- AbstractComputeTarget ou str
O destino de computação onde o treinamento ocorrerá. Pode ser um objeto ou a cadeia de caracteres "local".
- vm_size
- str
O tamanho da VM do destino de computação que será criado para o treinamento.
Valores com suporte: qualquer tamanho de VM do Azure.
- vm_priority
- str
A prioridade da VM do destino de computação que será criada para o treinamento. Se não for especificada, será usada a 'dedicada'.
Valores com suporte: 'dedicada' e 'de baixa prioridade'.
Isso somente terá efeito quando o vm_size param
for especificado na entrada.
- entry_script
- str
Uma cadeia de caracteres que representa o caminho relativo ao arquivo usado para iniciar o treinamento.
- script_params
- dict
Um dicionário de argumentos de linha de comando para passar para o seu script de treinamento especificado em entry_script
.
- custom_docker_image
- str
O nome da imagem do Docker a partir da qual a imagem a ser usada para treinamento será criada. Se não é definido, uma imagem padrão baseada em CPU é usada como imagem base.
- user_managed
- bool
Especifica se o Azure ML reutiliza um ambiente do Python existente. Se é falso, o Azure ML cria um ambiente do Python com base na especificação de dependências do Conda.
- conda_packages
- list
Uma lista de cadeia de caracteres que representa os pacotes Conda a serem adicionados ao ambiente do Python de experimento.
- pip_packages
- list
Uma lista de cadeia de caracteres representando pacotes de pip a serem adicionados ao ambiente do Python para o experimento.
- conda_dependencies_file_path
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo YAML de dependências Conda.
Se especificado, o Azure ML não instalará pacotes relacionados à estrutura.
Isso pode ser fornecido em combinação com o parâmetro conda_packages
.
PRETERIDO. Use o parâmetro conda_dependencies_file
.
- pip_requirements_file_path
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos de pip.
Isso pode ser fornecido em combinação com o parâmetro pip_packages
.
PRETERIDO. Use o parâmetro pip_requirements_file
.
- conda_dependencies_file
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo YAML de dependências Conda.
Se especificado, o Azure ML não instalará pacotes relacionados à estrutura.
Isso pode ser fornecido em combinação com o parâmetro conda_packages
.
- pip_requirements_file
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos de pip.
Isso pode ser fornecido em combinação com o parâmetro pip_packages
.
- environment_variables
- dict
Um dicionário de valores e nomes de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo em que o script do usuário está sendo executado.
- environment_definition
- Environment
A definição de ambiente de experimento inclui PythonSection, DockerSection e variáveis de ambiente. É possível usar o parâmetro environment_definition
para definir as opções de ambiente não expostas diretamente por meio de outros parâmetros à construção do Avaliador. Quando esse parâmetro é especificado, ele tem precedência sobre outros parâmetros relacionados ao ambiente como use_gpu
, custom_docker_image
, conda_packages
ou pip_packages
.
Os erros são relatados como combinações inválidas.
- inputs
- list
Uma lista de objetos DataReference ou DatasetConsumptionConfig para usar como entrada.
- shm_size
- str
O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não for definido, será usado o padrão azureml.core.environment._DEFAULT_SHM_SIZE.
- resume_from
- DataPath
O caminho de dados que contém o ponto de verificação ou os arquivos de modelo dos quais retomar o experimento.
- max_run_duration_seconds
- int
O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se demorar mais do que esse valor.
- framework_version
- str
A versão do Scikit-learn a ser usada para executar o código de treinamento.
SKLearn.get_supported_versions()
retorna uma lista das versões com suporte do SDK atual.
- source_directory
- str
Um diretório local que contém os arquivos de configuração do experimento.
- compute_target
- AbstractComputeTarget ou str
O destino de computação onde o treinamento ocorrerá. Pode ser um objeto ou a cadeia de caracteres "local".
- vm_size
- str
O tamanho da VM do destino de computação que será criado para o treinamento. Valores com suporte: qualquer tamanho de VM do Azure.
- vm_priority
- str
A prioridade da VM do destino de computação que será criada para o treinamento. Se não for especificada, será usada a 'dedicada'.
Valores com suporte: 'dedicada' e 'de baixa prioridade'.
Isso somente terá efeito quando o vm_size param
for especificado na entrada.
- entry_script
- str
Uma cadeia de caracteres que representa o caminho relativo ao arquivo usado para iniciar o treinamento.
- script_params
- dict
Um dicionário de argumentos de linha de comando para passar para o seu script de treinamento especificado em entry_script
.
- use_docker
- bool
Um valor bool que indica se o ambiente para executar o experimento deve ser baseado no Docker.
- custom_docker_image
- str
O nome da imagem do Docker a partir da qual a imagem a ser usada para treinamento será criada. Se não for definido, uma imagem padrão baseada em CPU será usada como imagem base.
- user_managed
- bool
Especifica se o Azure ML reutiliza um ambiente do Python existente. Se é falso, o Azure ML cria um ambiente do Python com base na especificação de dependências do Conda.
- conda_packages
- list
Uma lista de cadeia de caracteres que representa os pacotes Conda a serem adicionados ao ambiente do Python de experimento.
- pip_packages
- list
Uma lista de cadeia de caracteres representando pacotes de pip a serem adicionados ao ambiente do Python para o experimento.
- conda_dependencies_file_path
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo YAML de dependências Conda. Se especificado, o Azure ML não instalará pacotes relacionados à estrutura.
Isso pode ser fornecido em combinação com o parâmetro conda_packages
.
PRETERIDO. Use o parâmetro conda_dependencies_file
.
- pip_requirements_file_path
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos de pip.
Isso pode ser fornecido em combinação com o parâmetro pip_packages
.
PRETERIDO. Use o parâmetro pip_requirements_file
.
- conda_dependencies_file
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo YAML de dependências Conda. Se especificado, o Azure ML não instalará pacotes relacionados à estrutura.
Isso pode ser fornecido em combinação com o parâmetro conda_packages
.
- pip_requirements_file
- str
Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos de pip.
Isso pode ser fornecido em combinação com o parâmetro pip_packages
.
- environment_variables
- dict
Um dicionário de valores e nomes de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo em que o script do usuário está sendo executado.
- environment_definition
- Environment
A definição de ambiente de experimento inclui PythonSection, DockerSection e variáveis de ambiente. É possível usar o parâmetro environment_definition
para definir as opções de ambiente não expostas diretamente por meio de outros parâmetros à construção do Avaliador. Quando esse parâmetro é especificado, ele tem precedência sobre outros parâmetros relacionados ao ambiente como use_gpu
, custom_docker_image
, conda_packages
ou pip_packages
.
Os erros são relatados como combinações inválidas.
- inputs
- list
Uma lista de azureml.data.data_reference. Objetos DataReference a serem usados como entrada.
- shm_size
- str
O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não for definido, será usado o padrão azureml.core.environment._DEFAULT_SHM_SIZE.
- resume_from
- DataPath
O caminho de dados que contém o ponto de verificação ou os arquivos de modelo dos quais retomar o experimento.
- max_run_duration_seconds
- int
O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se demorar mais do que esse valor.
- framework_version
- str
A versão do Scikit-learn a ser usada para executar o código de treinamento.
SKLearn.get_supported_versions()
retorna uma lista das versões com suporte do SDK atual.
- _enable_optimized_mode
- bool
Habilite a compilação de ambiente incremental com imagens de estrutura predefinidas para uma preparação de ambiente mais rápida. Uma imagem de estrutura predefinida é criada com base em imagens base de CPU/GPU padrão do Azure ML com dependências de estrutura pré-instaladas.
- _disable_validation
- bool
Desabilite a validação de script antes de executar o envio. O padrão é True.
Comentários
Ao enviar um trabalho de treinamento, o Azure ML executa o script em um ambiente de conda em um contêiner do Docker. As seguintes dependências estão instaladas nos contêineres do SKLearn.
Dependências | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Mais recente | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
As imagens do Docker estendem o Ubuntu 16.04.
Se você precisar instalar outras dependências, use os parâmetros pip_packages
ou conda_packages
. Ou forneça o arquivo pip_requirements_file
ou conda_dependencies_file
. Você também pode criar sua própria imagem e transmitir o parâmetro custom_docker_image
para o construtor avaliador.
Atributos
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de