介绍

已完成

训练模型的方式绝不是一个完全自动化的过程。 如果训练对数据盲目依赖,会导致它最终学习的内容没有任何帮助,或者无法有效地学习实际有用的内容。 下面的学习材料逐步介绍了发生拟合不足和过度拟合的一些简单原因,以及可以执行的相应操作。

场景:训练雪崩救援犬

在整个模块中,我们将使用以下示例场景来解释拟合不足和过度拟合。 该场景旨在通过示例说明你在自行编程时会如何接触到这些概念。 请注意,这些原则通常适用于几乎所有类型的模型,而不只是我们在这里使用的模型。

是时候让你的慈善机构训练新一代救援犬了,让它们可以搜寻被雪崩卷走的徒步旅行者。 办公室里有关于哪种救援犬最好的争论:大型犬会不会比小型犬更合适? 犬只应在年幼时还是成年后接受训练? 值得庆幸的是,你拥有过去数年中执行的救援统计信息可供参考。 不过,训练救援犬的成本很高,你需要确保挑选救援犬的条件是合理的。

先决条件

  • 熟悉机器学习模型

学习目标

本模块介绍了以下内容:

  • 定义特征规范化。
  • 创建并处理测试数据集。
  • 阐明测试模型如何既能改善训练,又能损害训练。