SKLearn 类
创建一个估算器,用于在 Scikit-learn 试验中进行训练。
已弃用。 将 ScriptRunConfig 对象与定义的环境或 AzureML-Tutorial 特选环境配合使用。 有关使用 ScriptRunConfig 运行配置 SKLearn 试验的简介,请参阅使用 Azure 机器学习大规模训练 scikit-learn 模型。
此估算器仅支持单节点 CPU 训练。
支持的版本:0.20.3
初始化 Scikit-learn 估算器。
- 继承
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
构造函数
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
参数
- vm_priority
- str
将为训练创建的计算目标的 VM 优先级。 如果未指定,则使用“dedicated”。
支持的值:“dedicated”和“lowpriority”。
这仅在输入中指定了 vm_size param
时才会生效。
- user_managed
- bool
指定 Azure ML 是否重复使用现有的 Python 环境。 如果为 false,表示 Azure ML 将基于 conda 依赖关系规范创建 Python 环境。
- conda_dependencies_file_path
- str
表示 conda 依赖关系 yaml 文件的相对路径的字符串。
如果已指定,Azure ML 将不安装任何框架相关的包。
这可以与 conda_packages
参数一起提供。
已弃用。 使用 conda_dependencies_file
参数。
- pip_requirements_file_path
- str
表示 pip 需求文本文件的相对路径的字符串。
这可以与 pip_packages
参数一起提供。
已弃用。 使用 pip_requirements_file
参数。
- conda_dependencies_file
- str
表示 conda 依赖关系 yaml 文件的相对路径的字符串。
如果已指定,Azure ML 将不安装任何框架相关的包。
这可以与 conda_packages
参数一起提供。
- environment_definition
- Environment
试验的环境定义包括 PythonSection、DockerSection 和环境变量。 可以使用 environment_definition
参数来设置不通过其他参数直接公开到估算器构造的任何环境选项。 如果指定了此参数,它将优先于其他与环境相关的参数,如 use_gpu
、custom_docker_image
、conda_packages
或 pip_packages
。
对于无效组合,将报告错误。
- framework_version
- str
要用于执行训练代码的 Scikit-learn 版本。
SKLearn.get_supported_versions()
将返回当前 SDK 支持的版本列表。
- vm_priority
- str
将为训练创建的计算目标的 VM 优先级。 如果未指定,则使用“dedicated”。
支持的值:“dedicated”和“lowpriority”。
这仅在输入中指定了 vm_size param
时才会生效。
- user_managed
- bool
指定 Azure ML 是否重复使用现有的 Python 环境。 如果为 false,表示 Azure ML 将基于 conda 依赖关系规范创建 Python 环境。
- conda_dependencies_file_path
- str
表示 conda 依赖关系 yaml 文件的相对路径的字符串。 如果已指定,Azure ML 将不安装任何框架相关的包。
这可以与 conda_packages
参数一起提供。
已弃用。 使用 conda_dependencies_file
参数。
- pip_requirements_file_path
- str
表示 pip 需求文本文件的相对路径的字符串。
这可以与 pip_packages
参数一起提供。
已弃用。 使用 pip_requirements_file
参数。
- conda_dependencies_file
- str
表示 conda 依赖关系 yaml 文件的相对路径的字符串。 如果已指定,Azure ML 将不安装任何框架相关的包。
这可以与 conda_packages
参数一起提供。
- environment_definition
- Environment
试验的环境定义包括 PythonSection、DockerSection 和环境变量。 可以使用 environment_definition
参数来设置不通过其他参数直接公开到估算器构造的任何环境选项。 如果指定了此参数,它将优先于其他与环境相关的参数,如 use_gpu
、custom_docker_image
、conda_packages
或 pip_packages
。
对于无效组合,将报告错误。
- framework_version
- str
要用于执行训练代码的 Scikit-learn 版本。
SKLearn.get_supported_versions()
将返回当前 SDK 支持的版本列表。
- _enable_optimized_mode
- bool
使用预生成的框架映像启用增量环境生成,以便更快地准备环境。 预构建的框架映像基于预安装了框架依赖项的 Azure ML 默认 CPU/GPU 基础映像。
注解
提交训练作业时,Azure ML 会在 Docker 容器内的 conda 环境中运行脚本。 SKLearn 容器安装了以下依赖项。
依赖项 | Scikit-learn 0.20.3 |———————- |—————– |Python |3.6.2 |azureml-defaults |最新|IntelMpi |2018.3.222 |scikit-learn |0.20.3 |numpy |1.16.2 |miniconda |4.5.11 |scipy |1.2.1 |joblib |0.13.2 |git |2.7.4 |
Docker 映像可扩展 Ubuntu 16.04。
如果需要安装其他依赖项,可以使用 pip_packages
或 conda_packages
参数,也可以提供 pip_requirements_file
或 conda_dependencies_file
文件。 或者,可以生成自己的映像,并将 custom_docker_image
参数传递给估算器构造函数。
属性
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈