Compartilhar via


SKLearn Classe

Cria um avaliador para treinamento em experimentos scikit-learn.

DEPRECADO. Use o ScriptRunConfig objeto com seu próprio ambiente definido ou o ambiente AzureML-Tutorial coletado. Para obter uma introdução à configuração de execuções de experimento sklearn com ScriptRunConfig, consulte Treinar modelos scikit-learn em escala com o Azure Machine Learning.

Esse avaliador dá suporte apenas ao treinamento de CPU de nó único.

Versões com suporte: 0.20.3

Inicializar um avaliador do Scikit-learn.

Construtor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parâmetros

Nome Description
source_directory
Obrigatório
str

Um diretório local que contém arquivos de configuração de experimento.

compute_target
Obrigatório

O destino de computação em que o treinamento ocorrerá. Isso pode ser um objeto ou a cadeia de caracteres "local".

vm_size
Obrigatório
str

O tamanho da VM do destino de computação que será criado para o treinamento.

Valores com suporte: qualquer tamanho de VM do Azure.

vm_priority
Obrigatório
str

A prioridade da VM do destino de computação que será criado para o treinamento. Se não for especificado, 'dedicado' será usado.

Valores com suporte: 'dedicado' e 'lowpriority'.

Isso só entra em vigor quando o vm_size param valor é especificado na entrada.

entry_script
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo usado para iniciar o treinamento.

script_params
Obrigatório

Um dicionário de argumentos de linha de comando a serem passados para o script de treinamento especificado em entry_script.

custom_docker_image
Obrigatório
str

O nome da imagem do Docker da qual a imagem a ser usada para treinamento será criada. Se não estiver definida, uma imagem baseada em CPU padrão será usada como a imagem base.

image_registry_details
Obrigatório

Os detalhes do registro de imagem do Docker.

user_managed
Obrigatório

Especifica se o Azure ML reutiliza um ambiente python existente. False significa que o AzureML criará um ambiente python com base na especificação de dependências do Conda.

conda_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes conda a serem adicionados ao ambiente Python para o experimento.

pip_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes pip a serem adicionados ao ambiente Python para o experimento.

conda_dependencies_file_path
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isso pode ser fornecido em combinação com o conda_packages parâmetro. DEPRECADO. Use o parâmetro conda_dependencies_file.

pip_requirements_file_path
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isso pode ser fornecido em combinação com o pip_packages parâmetro. DEPRECADO. Use o parâmetro pip_requirements_file.

conda_dependencies_file
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isso pode ser fornecido em combinação com o conda_packages parâmetro.

pip_requirements_file
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isso pode ser fornecido em combinação com o pip_packages parâmetro.

environment_variables
Obrigatório

Um dicionário de valores e nomes de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo em que o script do usuário está sendo executado.

environment_definition
Obrigatório

A definição de ambiente para um experimento inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente por meio de outros parâmetros para a construção do Avaliador pode ser definida usando environment_definition o parâmetro. Se esse parâmetro for especificado, ele terá precedência sobre outros parâmetros relacionados ao ambiente, comouse_gpu, , custom_docker_imageconda_packagesou pip_packages. Erros serão relatados combinações inválidas.

inputs
Obrigatório

Uma lista de DataReference objetos ou DatasetConsumptionConfig objetos a serem usados como entrada.

shm_size
Obrigatório
str

O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não for definido, o azureml.core.environment._DEFAULT_SHM_SIZE padrão será usado.

resume_from
Obrigatório

O caminho de dados que contém o ponto de verificação ou os arquivos de modelo dos quais retomar o experimento.

max_run_duration_seconds
Obrigatório
int

O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se levar mais tempo do que esse valor.

framework_version
Obrigatório
str

A versão do Scikit-learn a ser usada para executar o código de treinamento. SKLearn.get_supported_versions() retorna uma lista das versões compatíveis com o SDK atual.

source_directory
Obrigatório
str

Um diretório local que contém arquivos de configuração de experimento.

compute_target
Obrigatório

O destino de computação em que o treinamento ocorrerá. Isso pode ser um objeto ou a cadeia de caracteres "local".

vm_size
Obrigatório
str

O tamanho da VM do destino de computação que será criado para o treinamento. Valores com suporte: qualquer tamanho de VM do Azure.

vm_priority
Obrigatório
str

A prioridade da VM do destino de computação que será criado para o treinamento. Se não for especificado, 'dedicado' será usado.

Valores com suporte: 'dedicado' e 'lowpriority'.

Isso só entra em vigor quando o vm_size param valor é especificado na entrada.

entry_script
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo usado para iniciar o treinamento.

script_params
Obrigatório

Um dicionário de argumentos de linha de comando a serem passados para o script de treinamento especificado em entry_script.

use_docker
Obrigatório

Um valor bool que indica se o ambiente para executar o experimento deve ser baseado no Docker.

custom_docker_image
Obrigatório
str

O nome da imagem do Docker da qual a imagem a ser usada para treinamento será criada. Se não for definido, uma imagem baseada em CPU padrão será usada como a imagem base.

image_registry_details
Obrigatório

Os detalhes do registro de imagem do Docker.

user_managed
Obrigatório

Especifica se o Azure ML reutiliza um ambiente python existente. False significa que o AzureML criará um ambiente python com base na especificação de dependências do Conda.

conda_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes conda a serem adicionados ao ambiente Python para o experimento.

pip_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes pip a serem adicionados ao ambiente Python para o experimento.

conda_dependencies_file_path
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isso pode ser fornecido em combinação com o conda_packages parâmetro. DEPRECADO. Use o parâmetro conda_dependencies_file.

pip_requirements_file_path
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isso pode ser fornecido em combinação com o pip_packages parâmetro. DEPRECADO. Use o parâmetro pip_requirements_file.

conda_dependencies_file
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isso pode ser fornecido em combinação com o conda_packages parâmetro.

pip_requirements_file
Obrigatório
str

Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isso pode ser fornecido em combinação com o pip_packages parâmetro.

environment_variables
Obrigatório

Um dicionário de valores e nomes de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo em que o script do usuário está sendo executado.

environment_definition
Obrigatório

A definição de ambiente para um experimento inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente por meio de outros parâmetros para a construção do Avaliador pode ser definida usando environment_definition o parâmetro. Se esse parâmetro for especificado, ele terá precedência sobre outros parâmetros relacionados ao ambiente, comouse_gpu, , custom_docker_imageconda_packagesou pip_packages. Erros serão relatados combinações inválidas.

inputs
Obrigatório

Uma lista de azureml.data.data_reference. Objetos DataReference a serem usados como entrada.

shm_size
Obrigatório
str

O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não for definido, o azureml.core.environment._DEFAULT_SHM_SIZE padrão será usado.

resume_from
Obrigatório

O caminho de dados que contém o ponto de verificação ou os arquivos de modelo dos quais retomar o experimento.

max_run_duration_seconds
Obrigatório
int

O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se levar mais tempo do que esse valor.

framework_version
Obrigatório
str

A versão do Scikit-learn a ser usada para executar o código de treinamento. SKLearn.get_supported_versions() retorna uma lista das versões compatíveis com o SDK atual.

_enable_optimized_mode
Obrigatório

Habilite o build de ambiente incremental com imagens de estrutura pré-criadas para uma preparação mais rápida do ambiente. Uma imagem de estrutura predefinida é criada com base em imagens base padrão de CPU/GPU do Azure ML com dependências de estrutura pré-instaladas.

_disable_validation
Obrigatório

Desabilite a validação de script antes de executar o envio. O padrão é True.

_show_lint_warnings
Obrigatório

Mostrar avisos de linting de script. O padrão é False.

_show_package_warnings
Obrigatório

Mostrar avisos de validação de pacote. O padrão é False.

Comentários

Ao enviar um trabalho de treinamento, o Azure ML executa seu script em um ambiente conda em um contêiner do Docker. Os contêineres do SKLearn têm as dependências a seguir instaladas.

Dependências | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Mais recente | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

As imagens do Docker estendem o Ubuntu 16.04.

Se você precisar instalar dependências adicionais, poderá usar os pip_packages parâmetros ou conda_packages os parâmetros ou fornecer o arquivo pip_requirements_file ou conda_dependencies_file o arquivo. Como alternativa, você pode criar sua própria imagem e passar o custom_docker_image parâmetro para o construtor do avaliador.

Atributos

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'