SKLearn Clase
Crea un estimador para el entrenamiento en experimentos de Scikit-learn.
EN DESUSO. Use el objeto ScriptRunConfig con su propio entorno definido o el entorno seleccionado de AzureML-Tutorial. Para obtener una introducción a la configuración de ejecuciones de experimentos de SKLearn con ScriptRunConfig, consulte Entrenamiento de modelos de Scikit-learn a gran escala con Azure Machine Learning.
Este estimador solo admite el entrenamiento de CPU de nodo único.
Versiones admitidas: 0.20.3.
Inicialice un estimador de Scikit-learn.
- Herencia
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Constructor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parámetros
- source_directory
- str
Directorio local que contiene los archivos de configuración del experimento.
- compute_target
- AbstractComputeTarget o str
Destino de proceso en el que se realizará el entrenamiento. Puede ser un objeto o la cadena "local".
- vm_size
- str
Tamaño de máquina virtual del destino de proceso que se creará para el entrenamiento.
Valores admitidos: cualquier tamaño de máquina virtual de Azure.
- vm_priority
- str
Prioridad de la máquina virtual del destino de proceso que se creará para el entrenamiento. Si no se especifica, se usa "dedicated" (dedicada).
Valores admitidos: "dedicated" (dedicada) y "lowpriority" (prioridad baja).
Esto solo tiene efecto cuando se especifica vm_size param
en la entrada.
- entry_script
- str
Cadena que representa la ruta de acceso relativa al archivo utilizado para iniciar el entrenamiento.
- script_params
- dict
Diccionario de argumentos de la línea de comandos que se pasan al script de entrenamiento especificado en entry_script
.
- custom_docker_image
- str
El nombre de la imagen de Docker a partir de la que se va a crear la imagen que se va a usar para el entrenamiento. Si no se establece, se usará una imagen predeterminada basada en CPU como imagen base.
- user_managed
- bool
Especifica si Azure ML reutiliza un entorno de Python existente. Si es False, Azure ML creará un entorno de Python basado en la especificación de dependencias de Conda.
- conda_packages
- list
Lista de cadenas que representan los paquetes de Conda que se van a agregar al entorno de Python para el experimento.
- pip_packages
- list
Lista de cadenas que representan los paquetes de pip que se van a agregar al entorno de Python para el experimento.
- conda_dependencies_file_path
- str
Cadena que representa la ruta de acceso relativa al archivo YAML de dependencias de Conda.
Si se especifica, Azure ML no instalará ningún paquete relacionado con el marco.
Se puede proporcionar en combinación con el parámetro conda_packages
.
EN DESUSO. Utilice el parámetro conda_dependencies_file
.
- pip_requirements_file_path
- str
Cadena que representa la ruta de acceso relativa al archivo de texto de requisitos de pip.
Se puede proporcionar en combinación con el parámetro pip_packages
.
EN DESUSO. Utilice el parámetro pip_requirements_file
.
- conda_dependencies_file
- str
Cadena que representa la ruta de acceso relativa al archivo YAML de dependencias de Conda.
Si se especifica, Azure ML no instalará ningún paquete relacionado con el marco.
Se puede proporcionar en combinación con el parámetro conda_packages
.
- pip_requirements_file
- str
Cadena que representa la ruta de acceso relativa al archivo de texto de requisitos de pip.
Se puede proporcionar en combinación con el parámetro pip_packages
.
- environment_variables
- dict
Diccionario de nombres y valores de variables de entorno. Estas variables de entorno se establecen en el proceso donde se ejecuta el script de usuario.
- environment_definition
- Environment
La definición de entorno de un experimento incluye PythonSection, DockerSection y variables de entorno. Cualquier opción del entorno que no se exponga directamente mediante otros parámetros a la construcción del estimador se puede establecer mediante el parámetro environment_definition
. Si se especifica este parámetro, tendrá prioridad sobre otros parámetros relacionados con el entorno, como use_gpu
, custom_docker_image
, conda_packages
o pip_packages
.
Se notificarán los errores sobre estas combinaciones no válidas.
- inputs
- list
Lista de objetos DataReference o DatasetConsumptionConfig que se van a usar como entrada.
- shm_size
- str
Tamaño del bloque de memoria compartida del contenedor Docker. Si no se establece, se usa el valor de azureml.core.environment._DEFAULT_SHM_SIZE predeterminado.
- resume_from
- DataPath
Ruta de acceso de datos que contiene el punto de control o los archivos del modelo desde los que se va a reanudar el experimento.
- max_run_duration_seconds
- int
Tiempo máximo permitido para la ejecución. Azure ML intentará cancelar automáticamente la ejecución si tarda más que este valor.
- framework_version
- str
Versión de Scikit-learn que se va a usar para ejecutar el código de entrenamiento.
SKLearn.get_supported_versions()
devuelve una lista de las versiones admitidas por el SDK actual.
- source_directory
- str
Directorio local que contiene los archivos de configuración del experimento.
- compute_target
- AbstractComputeTarget o str
Destino de proceso en el que se realizará el entrenamiento. Puede ser un objeto o la cadena "local".
- vm_size
- str
Tamaño de máquina virtual del destino de proceso que se creará para el entrenamiento. Valores admitidos: cualquier tamaño de máquina virtual de Azure.
- vm_priority
- str
Prioridad de la máquina virtual del destino de proceso que se creará para el entrenamiento. Si no se especifica, se usa "dedicated" (dedicada).
Valores admitidos: "dedicated" (dedicada) y "lowpriority" (prioridad baja).
Esto solo tiene efecto cuando se especifica vm_size param
en la entrada.
- entry_script
- str
Cadena que representa la ruta de acceso relativa al archivo utilizado para iniciar el entrenamiento.
- script_params
- dict
Diccionario de argumentos de la línea de comandos que se pasan al script de entrenamiento especificado en entry_script
.
- use_docker
- bool
Valor bool que indica si el entorno para ejecutar el experimento debe estar basado en Docker.
- custom_docker_image
- str
El nombre de la imagen de Docker a partir de la que se va a crear la imagen que se va a usar para el entrenamiento. Si no se establece, se usará una imagen predeterminada basada en CPU como imagen base.
- user_managed
- bool
Especifica si Azure ML reutiliza un entorno de Python existente. Si es False, Azure ML creará un entorno de Python basado en la especificación de dependencias de Conda.
- conda_packages
- list
Lista de cadenas que representan los paquetes de Conda que se van a agregar al entorno de Python para el experimento.
- pip_packages
- list
Lista de cadenas que representan los paquetes de pip que se van a agregar al entorno de Python para el experimento.
- conda_dependencies_file_path
- str
Cadena que representa la ruta de acceso relativa al archivo YAML de dependencias de Conda. Si se especifica, Azure ML no instalará ningún paquete relacionado con el marco.
Se puede proporcionar en combinación con el parámetro conda_packages
.
EN DESUSO. Utilice el parámetro conda_dependencies_file
.
- pip_requirements_file_path
- str
Cadena que representa la ruta de acceso relativa al archivo de texto de requisitos de pip.
Se puede proporcionar en combinación con el parámetro pip_packages
.
EN DESUSO. Utilice el parámetro pip_requirements_file
.
- conda_dependencies_file
- str
Cadena que representa la ruta de acceso relativa al archivo YAML de dependencias de Conda. Si se especifica, Azure ML no instalará ningún paquete relacionado con el marco.
Se puede proporcionar en combinación con el parámetro conda_packages
.
- pip_requirements_file
- str
Cadena que representa la ruta de acceso relativa al archivo de texto de requisitos de pip.
Se puede proporcionar en combinación con el parámetro pip_packages
.
- environment_variables
- dict
Diccionario de nombres y valores de variables de entorno. Estas variables de entorno se establecen en el proceso donde se ejecuta el script de usuario.
- environment_definition
- Environment
La definición de entorno de un experimento incluye PythonSection, DockerSection y variables de entorno. Cualquier opción del entorno que no se exponga directamente mediante otros parámetros a la construcción del estimador se puede establecer mediante el parámetro environment_definition
. Si se especifica este parámetro, tendrá prioridad sobre otros parámetros relacionados con el entorno, como use_gpu
, custom_docker_image
, conda_packages
o pip_packages
.
Se notificarán los errores sobre estas combinaciones no válidas.
- inputs
- list
Lista de azureml.data.data_reference. Objetos DataReference que se van a usar como entrada.
- shm_size
- str
Tamaño del bloque de memoria compartida del contenedor Docker. Si no se establece, se usa el valor de azureml.core.environment._DEFAULT_SHM_SIZE predeterminado.
- resume_from
- DataPath
Ruta de acceso de datos que contiene el punto de control o los archivos del modelo desde los que se va a reanudar el experimento.
- max_run_duration_seconds
- int
Tiempo máximo permitido para la ejecución. Azure ML intentará cancelar automáticamente la ejecución si tarda más que este valor.
- framework_version
- str
Versión de Scikit-learn que se va a usar para ejecutar el código de entrenamiento.
SKLearn.get_supported_versions()
devuelve una lista de las versiones admitidas por el SDK actual.
- _enable_optimized_mode
- bool
Habilite la compilación incremental del entorno con imágenes de marco pregeneradas para una preparación más rápida del entorno. Una imagen de marco pregenerada se basa en imágenes base predeterminadas de CPU y GPU de Azure ML con dependencias de marco preinstaladas.
- _disable_validation
- bool
Deshabilite la validación del script antes de ejecutar el envío. El valor predeterminado es True.
- _show_lint_warnings
- bool
Mostrar advertencias de linting de script. El valor predeterminado es False.
- _show_package_warnings
- bool
Mostrar advertencias de validación de paquetes. El valor predeterminado es False.
Comentarios
Al enviar un trabajo de entrenamiento, Azure ML ejecuta el script en un entorno de Conda dentro de un contenedor Docker. Los contenedores de SKLearn tienen instaladas las siguientes dependencias.
Dependencias | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Más reciente | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | Git | 2.7.4 |
Las imágenes de Docker amplían Ubuntu 16.04.
Si necesita instalar dependencias adicionales, puede usar los parámetros pip_packages
o conda_packages
, o bien puede proporcionar el archivo pip_requirements_file
o conda_dependencies_file
. Como alternativa, puede crear su propia imagen y pasar el parámetro custom_docker_image
al constructor del estimador.
Atributos
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de