SKLearn Classe

Cria um estimador para treinamento em experimentos Scikit-learn.

PRETERIDO. Use o ScriptRunConfig objeto com seu próprio ambiente definido ou o ambiente AzureML-Tutorial com curadoria. Para obter uma introdução à configuração de execuções experimentais SKLearn com ScriptRunConfig, consulte Treinar modelos de aprendizagem scikit em escala com o Azure Machine Learning.

Este estimador suporta apenas o treinamento de CPU de nó único.

Versões suportadas: 0.20.3

Inicialize um estimador Scikit-learn.

Construtor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parâmetros

Name	Description
source_directory Necessário	str Um diretório local contendo arquivos de configuração de experimento.
compute_target Necessário	AbstractComputeTarget ou str O alvo de computação onde o treinamento acontecerá. Isso pode ser um objeto ou a cadeia de caracteres "local".
vm_size Necessário	str O tamanho da VM do destino de computação que será criado para o treinamento. Valores suportados: qualquer tamanho de VM do Azure.
vm_priority Necessário	str A prioridade VM do destino de computação que será criado para o treinamento. Se não for especificado, utiliza-se «dedicado». Valores suportados: 'dedicado' e 'baixa prioridade'. Isso entra em vigor somente quando o `vm_size param` é especificado na entrada.
entry_script Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo usado para iniciar o treinamento.
script_params Necessário	dict Um dicionário de argumentos de linha de comando para passar para o script de treinamento especificado em `entry_script`.
custom_docker_image Necessário	str O nome da imagem do Docker a partir da qual a imagem a ser usada para treinamento será construída. Se não estiver definida, uma imagem padrão baseada em CPU será usada como imagem base.
image_registry_details Necessário	ContainerRegistry Os detalhes do registro de imagem do Docker.
user_managed Necessário	bool Especifica se o Azure ML reutiliza um ambiente Python existente. False significa que o AzureML criará um ambiente Python com base na especificação de dependências conda.
conda_packages Necessário	list Uma lista de strings que representam pacotes conda a serem adicionados ao ambiente Python para o experimento.
pip_packages Necessário	list Uma lista de strings que representam pacotes pip a serem adicionados ao ambiente Python para o experimento.
conda_dependencies_file_path Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isto pode ser fornecido em combinação com o `conda_packages` parâmetro. PRETERIDO. Use o `conda_dependencies_file` parâmetro.
pip_requirements_file_path Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isto pode ser fornecido em combinação com o `pip_packages` parâmetro. PRETERIDO. Use o `pip_requirements_file` parâmetro.
conda_dependencies_file Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isto pode ser fornecido em combinação com o `conda_packages` parâmetro.
pip_requirements_file Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isto pode ser fornecido em combinação com o `pip_packages` parâmetro.
environment_variables Necessário	dict Um dicionário de nomes e valores de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo onde o script do usuário está sendo executado.
environment_definition Necessário	Environment A definição de ambiente para um experimento inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros à construção do Estimador pode ser definida usando `environment_definition` o parâmetro. Se esse parâmetro for especificado, ele terá precedência sobre outros parâmetros relacionados ao ambiente, como `use_gpu`, `custom_docker_image`, `conda_packages`, ou `pip_packages`. Erros serão relatados combinações inválidas.
inputs Necessário	list Uma lista de DataReference ou DatasetConsumptionConfig objetos para usar como entrada.
shm_size Necessário	str O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não estiver definido, o azureml.core.environment._DEFAULT_SHM_SIZE padrão será usado.
resume_from Necessário	DataPath O caminho de dados que contém o ponto de verificação ou os arquivos de modelo a partir dos quais retomar o experimento.
max_run_duration_seconds Necessário	int O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se demorar mais do que esse valor.
framework_version Necessário	str A versão Scikit-learn para ser usada para executar código de treinamento. `SKLearn.get_supported_versions()` retorna uma lista das versões suportadas pelo SDK atual.
source_directory Necessário	str Um diretório local contendo arquivos de configuração de experimento.
compute_target Necessário	AbstractComputeTarget ou str O alvo de computação onde o treinamento acontecerá. Isso pode ser um objeto ou a cadeia de caracteres "local".
vm_size Necessário	str O tamanho da VM do destino de computação que será criado para o treinamento. Valores suportados: qualquer tamanho de VM do Azure.
vm_priority Necessário	str A prioridade VM do destino de computação que será criado para o treinamento. Se não for especificado, utiliza-se «dedicado». Valores suportados: 'dedicado' e 'baixa prioridade'. Isso entra em vigor somente quando o `vm_size param` é especificado na entrada.
entry_script Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo usado para iniciar o treinamento.
script_params Necessário	dict Um dicionário de argumentos de linha de comando para passar para o script de treinamento especificado em `entry_script`.
use_docker Necessário	bool Um valor bool que indica se o ambiente para executar o experimento deve ser baseado no Docker.
custom_docker_image Necessário	str O nome da imagem do Docker a partir da qual a imagem a ser usada para treinamento será construída. Se não estiver definida, uma imagem padrão baseada em CPU será usada como imagem base.
image_registry_details Necessário	ContainerRegistry Os detalhes do registro de imagem do Docker.
user_managed Necessário	bool Especifica se o Azure ML reutiliza um ambiente Python existente. False significa que o AzureML criará um ambiente Python com base na especificação de dependências conda.
conda_packages Necessário	list Uma lista de strings que representam pacotes conda a serem adicionados ao ambiente Python para o experimento.
pip_packages Necessário	list Uma lista de strings que representam pacotes pip a serem adicionados ao ambiente Python para o experimento.
conda_dependencies_file_path Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isto pode ser fornecido em combinação com o `conda_packages` parâmetro. PRETERIDO. Use o `conda_dependencies_file` parâmetro.
pip_requirements_file_path Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isto pode ser fornecido em combinação com o `pip_packages` parâmetro. PRETERIDO. Use o `pip_requirements_file` parâmetro.
conda_dependencies_file Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura. Isto pode ser fornecido em combinação com o `conda_packages` parâmetro.
pip_requirements_file Necessário	str Uma cadeia de caracteres que representa o caminho relativo para o arquivo de texto de requisitos pip. Isto pode ser fornecido em combinação com o `pip_packages` parâmetro.
environment_variables Necessário	dict Um dicionário de nomes e valores de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo onde o script do usuário está sendo executado.
environment_definition Necessário	Environment A definição de ambiente para um experimento inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros à construção do Estimador pode ser definida usando `environment_definition` o parâmetro. Se esse parâmetro for especificado, ele terá precedência sobre outros parâmetros relacionados ao ambiente, como `use_gpu`, `custom_docker_image`, `conda_packages`, ou `pip_packages`. Erros serão relatados combinações inválidas.
inputs Necessário	list Uma lista de azureml.data.data_reference. DataReference objetos para usar como entrada.
shm_size Necessário	str O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não estiver definido, o azureml.core.environment._DEFAULT_SHM_SIZE padrão será usado.
resume_from Necessário	DataPath O caminho de dados que contém o ponto de verificação ou os arquivos de modelo a partir dos quais retomar o experimento.
max_run_duration_seconds Necessário	int O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se demorar mais do que esse valor.
framework_version Necessário	str A versão Scikit-learn para ser usada para executar código de treinamento. `SKLearn.get_supported_versions()` retorna uma lista das versões suportadas pelo SDK atual.
_enable_optimized_mode Necessário	bool Habilite a criação incremental de ambientes com imagens de estrutura pré-criadas para uma preparação mais rápida do ambiente. Uma imagem de estrutura pré-criada é criada sobre as imagens base de CPU/GPU padrão do Azure ML com dependências de estrutura pré-instaladas.
_disable_validation Necessário	bool Desative a validação de script antes de executar o envio. O padrão é True.
_show_lint_warnings Necessário	bool Mostrar avisos de revestimento de script. O padrão é False.
_show_package_warnings Necessário	bool Mostrar avisos de validação de pacote. O padrão é False.

Observações

Ao enviar um trabalho de treinamento, o Azure ML executa seu script em um ambiente conda dentro de um contêiner do Docker. Os contêineres SKLearn têm as seguintes dependências instaladas.

Dependências | Scikit-aprender 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Últimas notícias | IntelMpi | 2018.3.222 | scikit-aprender | 0.20.3 | numpy | 1.16.2 | Miniconda | 4.5.11 | Scipy | 1.2.1 | Joblib - Brasil | 0.13.2 | Git | 2.7.4 |

As imagens do Docker estendem o Ubuntu 16.04.

Se você precisar instalar dependências adicionais, você pode usar os parâmetros ou pip_packages ou pode fornecer o conda_packages arquivo pip_requirements_file ouconda_dependencies_file. Como alternativa, você pode criar sua própria imagem e passar o custom_docker_image parâmetro para o construtor do estimador.

Atributos

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'

Feedback

Esta página foi útil?