介绍

已完成

在机器学习中,算法用于根据训练数据中找到的已知标签与特征之间的关联来训练预测新数据的未知标签的模型。 根据所使用的算法,可能需要指定 超参数 来配置模型训练方式。 例如,逻辑回归算法使用 正则化 率超参数来抵消过度拟合;深度学习神经网络模型使用超参数(如 学习速率 )来控制训练期间权重的调整方式。

注释

机器学习是一个具有自身特定术语的学术领域。 数据科学家将训练特征确定的值称为 参数,因此,用于配置训练行为但不是从训练数据派生的值需要不同的术语,因此术语 超参数

为给定算法选择的超参数值可能会对它训练的模型产生重大影响;因此,选择正确的超参数值可以在与新数据一起使用时预测良好的模型和不预测的模型之间产生差异。

在 Azure Databricks 中,可以使用 Hyperopt 库自动执行超参数优化;使用超参数的不同组合重复训练和评估模型的过程,直到找到最适合数据的值。