SKLearn Classe
Cria um avaliador para formação em experimentações scikit-learn.
PRETERIDO. Utilize o objeto com o ScriptRunConfig seu próprio ambiente definido ou o AzureML-Tutorial ambiente organizado. Para obter uma introdução à configuração de execuções de experimentação SKLearn com ScriptRunConfig, veja Preparar modelos scikit-learn em escala com o Azure Machine Learning.
Este avaliador só suporta a preparação da CPU de nó único.
Versões suportadas: 0.20.3
Inicialize um avaliador scikit-learn.
- Herança
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Construtor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parâmetros
- source_directory
- str
Um diretório local que contém ficheiros de configuração de experimentação.
- compute_target
- AbstractComputeTarget ou str
O destino de computação onde a preparação vai acontecer. Pode ser um objeto ou a cadeia "local".
- vm_size
- str
O tamanho da VM do destino de computação que será criado para a preparação.
Valores suportados: qualquer tamanho de VM do Azure.
- vm_priority
- str
A prioridade da VM do destino de computação que será criado para a preparação. Se não for especificado, é utilizado "dedicado".
Valores suportados: "dedicado" e "lowpriority".
Isto só entra em vigor quando o vm_size param
é especificado na entrada.
- entry_script
- str
Uma cadeia que representa o caminho relativo para o ficheiro utilizado para iniciar a preparação.
- script_params
- dict
Um dicionário de argumentos da linha de comandos para passar para o script de preparação especificado em entry_script
.
- custom_docker_image
- str
Será criado o nome da imagem do Docker a partir da qual será criada a imagem a utilizar para preparação. Se não estiver definida, será utilizada uma imagem baseada na CPU predefinida como imagem base.
- user_managed
- bool
Especifica se o Azure ML reutiliza um ambiente Python existente. Falso significa que o AzureML irá criar um ambiente Python com base na especificação de dependências de conda.
- conda_packages
- list
Uma lista de cadeias que representam pacotes conda a serem adicionados ao ambiente python para a experimentação.
- pip_packages
- list
Uma lista de cadeias que representam pacotes pip a serem adicionados ao ambiente python para a experimentação.
- conda_dependencies_file_path
- str
Uma cadeia que representa o caminho relativo para o ficheiro yaml de dependências de conda.
Se especificado, o Azure ML não instalará pacotes relacionados com a arquitetura.
Isto pode ser fornecido em combinação com o conda_packages
parâmetro.
PRETERIDO. Utilize o conda_dependencies_file
parâmetro .
- pip_requirements_file_path
- str
Uma cadeia que representa o caminho relativo para o ficheiro de texto dos requisitos pip.
Isto pode ser fornecido em combinação com o pip_packages
parâmetro.
PRETERIDO. Utilize o pip_requirements_file
parâmetro .
- conda_dependencies_file
- str
Uma cadeia que representa o caminho relativo para o ficheiro yaml de dependências de conda.
Se especificado, o Azure ML não instalará pacotes relacionados com a arquitetura.
Isto pode ser fornecido em combinação com o conda_packages
parâmetro.
- pip_requirements_file
- str
Uma cadeia que representa o caminho relativo para o ficheiro de texto dos requisitos pip.
Isto pode ser fornecido em combinação com o pip_packages
parâmetro.
- environment_variables
- dict
Um dicionário de nomes e valores de variáveis de ambiente. Estas variáveis de ambiente são definidas no processo em que o script de utilizador está a ser executado.
- environment_definition
- Environment
A definição de ambiente para uma experimentação inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros para a construção do Avaliador pode ser definida com o environment_definition
parâmetro . Se este parâmetro for especificado, terá precedência sobre outros parâmetros relacionados com o ambiente, como use_gpu
, custom_docker_image
, conda_packages
ou pip_packages
.
Os erros serão comunicados combinações inválidas.
- inputs
- list
Uma lista de DataReference objetos ou DatasetConsumptionConfig para utilizar como entrada.
- shm_size
- str
O tamanho do bloco de memória partilhado do contentor do Docker. Se não estiver definido, é utilizada a azureml.core.environment._DEFAULT_SHM_SIZE predefinida.
- resume_from
- DataPath
O caminho de dados que contém o ponto de verificação ou os ficheiros de modelo a partir dos quais pretende retomar a experimentação.
- max_run_duration_seconds
- int
O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se demorar mais tempo do que este valor.
- framework_version
- str
A versão scikit-learn a ser utilizada para executar o código de preparação.
SKLearn.get_supported_versions()
devolve uma lista das versões suportadas pelo SDK atual.
- source_directory
- str
Um diretório local que contém ficheiros de configuração de experimentação.
- compute_target
- AbstractComputeTarget ou str
O destino de computação onde a preparação vai acontecer. Pode ser um objeto ou a cadeia "local".
- vm_size
- str
O tamanho da VM do destino de computação que será criado para a preparação. Valores suportados: qualquer tamanho de VM do Azure.
- vm_priority
- str
A prioridade da VM do destino de computação que será criado para a preparação. Se não for especificado, é utilizado "dedicado".
Valores suportados: "dedicado" e "lowpriority".
Isto só entra em vigor quando o vm_size param
é especificado na entrada.
- entry_script
- str
Uma cadeia que representa o caminho relativo para o ficheiro utilizado para iniciar a preparação.
- script_params
- dict
Um dicionário de argumentos da linha de comandos para passar para o script de preparação especificado em entry_script
.
- use_docker
- bool
Um valor bool que indica se o ambiente para executar a experimentação deve ser baseado no Docker.
- custom_docker_image
- str
Será criado o nome da imagem do Docker a partir da qual será criada a imagem a utilizar para preparação. Se não estiver definida, será utilizada uma imagem baseada na CPU predefinida como imagem base.
- user_managed
- bool
Especifica se o Azure ML reutiliza um ambiente Python existente. Falso significa que o AzureML irá criar um ambiente Python com base na especificação de dependências de conda.
- conda_packages
- list
Uma lista de cadeias que representam pacotes conda a serem adicionados ao ambiente python para a experimentação.
- pip_packages
- list
Uma lista de cadeias que representam pacotes pip a serem adicionados ao ambiente python para a experimentação.
- conda_dependencies_file_path
- str
Uma cadeia que representa o caminho relativo para o ficheiro yaml de dependências de conda. Se especificado, o Azure ML não instalará pacotes relacionados com a arquitetura.
Isto pode ser fornecido em combinação com o conda_packages
parâmetro.
PRETERIDO. Utilize o conda_dependencies_file
parâmetro .
- pip_requirements_file_path
- str
Uma cadeia que representa o caminho relativo para o ficheiro de texto dos requisitos pip.
Isto pode ser fornecido em combinação com o pip_packages
parâmetro.
PRETERIDO. Utilize o pip_requirements_file
parâmetro .
- conda_dependencies_file
- str
Uma cadeia que representa o caminho relativo para o ficheiro yaml de dependências de conda. Se especificado, o Azure ML não instalará pacotes relacionados com a arquitetura.
Isto pode ser fornecido em combinação com o conda_packages
parâmetro.
- pip_requirements_file
- str
Uma cadeia que representa o caminho relativo para o ficheiro de texto dos requisitos pip.
Isto pode ser fornecido em combinação com o pip_packages
parâmetro.
- environment_variables
- dict
Um dicionário de nomes e valores de variáveis de ambiente. Estas variáveis de ambiente são definidas no processo em que o script de utilizador está a ser executado.
- environment_definition
- Environment
A definição de ambiente para uma experimentação inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente através de outros parâmetros para a construção do Avaliador pode ser definida com o environment_definition
parâmetro . Se este parâmetro for especificado, terá precedência sobre outros parâmetros relacionados com o ambiente, como use_gpu
, custom_docker_image
, conda_packages
ou pip_packages
.
Os erros serão comunicados combinações inválidas.
- inputs
- list
Uma lista de azureml.data.data_reference. Objetos DataReference a utilizar como entrada.
- shm_size
- str
O tamanho do bloco de memória partilhado do contentor do Docker. Se não estiver definido, é utilizada a azureml.core.environment._DEFAULT_SHM_SIZE predefinida.
- resume_from
- DataPath
O caminho de dados que contém o ponto de verificação ou os ficheiros de modelo a partir dos quais pretende retomar a experimentação.
- max_run_duration_seconds
- int
O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se demorar mais tempo do que este valor.
- framework_version
- str
A versão scikit-learn a ser utilizada para executar o código de preparação.
SKLearn.get_supported_versions()
devolve uma lista das versões suportadas pelo SDK atual.
- _enable_optimized_mode
- bool
Ative a compilação de ambiente incremental com imagens de arquitetura pré-criadas para uma preparação mais rápida do ambiente. Uma imagem de arquitetura pré-criada baseia-se nas imagens base predefinidas da CPU/GPU do Azure ML com dependências de arquitetura pré-instaladas.
- _disable_validation
- bool
Desative a validação do script antes de executar a submissão. A predefinição é Verdadeiro.
- _show_package_warnings
- bool
Mostrar avisos de validação de pacotes. A predefinição é Falso.
Observações
Ao submeter uma tarefa de preparação, o Azure ML executa o script num ambiente conda num contentor do Docker. Os contentores SKLearn têm as seguintes dependências instaladas.
Dependências | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Mais recente | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
As imagens do Docker expandem o Ubuntu 16.04.
Se precisar de instalar dependências adicionais, pode utilizar os parâmetros ou conda_packages
ou fornecer o pip_packages
seu pip_requirements_file
ficheiro ouconda_dependencies_file
. Em alternativa, pode criar a sua própria imagem e transmitir o custom_docker_image
parâmetro ao construtor do avaliador.
Atributos
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários