练习 - 训练深度神经网络

已完成

到目前为止,在此模块中,你已经了解了有关使用神经网络进行深入学习的理论和原则。 了解如何应用此理论的最佳方式是实际构建深度学习模型,而这就是你要在本练习中完成的目标。

有很多可用于训练深度神经网络的框架,在此练习中,你可以选择探索 Python 最受欢迎的两个深度学习框架中的其中之一(或两者):PyTorch 和 TensorFlow。

开始之前

为了完成本练习,你将需要:

  • 一个 Microsoft Azure 订阅。 如果你还没有,可在 https://azure.microsoft.com/free 注册免费试用版。
  • 一个有计算机实例和克隆的 ml-basics 存储库的 Azure 机器学习工作区。

注意

本模块使用 Azure 机器学习工作区。 如果你完成此模块是为 Azure 数据科学家认证做准备,那么请考虑创建一次工作区,然后再在其他模块中重复使用。 完成本练习后,请务必按照“清理”说明来停止计算资源,如果计划重用,则保留该工作区。

创建 Azure 机器学习工作区

如果你的 Azure 订阅中还没有 Azure 机器学习工作区,请按照以下步骤进行创建:

  1. 使用与你的 Azure 订阅关联的 Microsoft 帐户登录到 Azure 门户

  2. 在 Azure 主页的“Azure 服务”下,选择“创建资源”。 此时会显示“创建资源”窗格。

  3. 在“搜索服务和市场”搜索框中,搜索并选择“机器学习”。 此时将显示“Azure 机器学习”窗格。

  4. 选择创建。 此时将显示“Azure 机器学习”窗格。

  5. 在“基本信息”选项卡上,为每个设置输入以下值。

    设置
    项目详细信息
    订阅 选择要用于此练习的 Azure 订阅。
    资源组 选择“新建”链接,并使用唯一名称命名新资源组,然后选择“确定”。
    工作区详细信息
    工作区名称 输入应用的独一无二的名称。 例如,可以使用 <yourname>-machinelearn
    区域 从下拉列表中,选择任意可用位置。
  6. 接受其余默认值,然后选择“查看 + 创建”。

  7. 通过验证后,选择“创建”。

    等待工作区资源创建完成(可能需要几分钟时间)。

  8. 部署完成后,选择“转到资源”。 此时将显示“机器学习”窗格。

  9. 选择“启动工作室”,或转到 https://ml.azure.com,然后使用你的 Microsoft 帐户登录。 此时将显示“Microsoft Azure 机器学习工作室”页。

  10. 在“Azure 机器学习工作室”中,切换左上角的“☰”图标可展开/折叠其菜单窗格。 可以使用这些选项来管理工作区中的资源。

创建计算实例

若要运行本练习中使用的笔记本,需要在 Azure 机器学习工作区中使用计算实例。

  1. 在左侧菜单窗格的“管理”下,选择“计算”。 此时将显示“计算”窗格。

  2. 在“计算实例”选项卡上,如果你已有计算实例,请启动它;否则,请选择“新建”创建新的计算实例。 此时会显示“创建计算实例”窗格。

  3. 为每个设置输入以下值:

    • 计算名称:输入唯一名称
    • 虚拟机类型:CPU
    • 虚拟机大小:从推荐选项中选择:Standard_DS11_v2
  4. 选择“创建” 。 此时将再次显示“计算”窗格,其中列出了“计算实例”。

  5. 等待计算实例启动(可能需要几分钟的时间)。 在“状态”列下,计算实例将更改为“正在运行”。

克隆 ml-basics 存储库

此模块(和其他相关模块)中使用的文件发布在 MicrosoftDocs/ml-basics GitHub 存储库中。 如果尚未克隆,请按照以下步骤将存储库克隆到 Azure 机器学习工作区:

  1. 选择 Azure 机器学习工作室左侧菜单中的“工作区”,然后选择在列表中创建的工作区。

  2. 在左侧的“创建者”标题下,选择“笔记本”链接以打开 Jupyter Notebook。 此时会显示“笔记本”窗格。

  3. 选择右侧的“终端”按钮。 此时将显示一个终端 shell。

  4. 运行以下命令,将当前目录更改为“Users”目录,并克隆 ml-basics 存储库(其中包含将在本练习中使用的笔记本和文件)。

    cd Users
    git clone https://github.com/microsoftdocs/ml-basics
    
  5. 命令完成并且文件的签出完成后,关闭“终端”选项卡并在 Jupyter 笔记本文件资源管理器中查看主页。

  6. 打开“Users”文件夹 - 它应包含一个 ml-basics 文件夹,其中包含将在此模块中使用的文件。

注意

在本练习中,我们强烈建议在 Azure 机器学习工作区中使用 Jupyter。 此设置可确保安装正确版本的 Python 和所需的各种包;创建一次工作区后,就可在其他模块中重复使用它。 如果希望在自己计算机上的 Python 环境中完成练习,则可以这样做。 若要详细了解如何配置使用 Visual Studio Code 的本地开发环境,可查看在自己的计算机上运行实验室。 请注意,如果选择这样做,则本练习中的说明可能与笔记本用户界面不匹配。

训练深度神经网络模型

创建 Jupyter 环境并克隆 ml-basics 存储库之后,便可以开始探索深度学习。

  1. 在 Jupyter 的“ml-basics”文件夹中,打开“深度神经网络(PyTorch).ipynb”或“深度神经网络(Tensorflow).ipynb”笔记本(具体取决于你的框架首选项),并按照其中包含的说明进行操作。

  2. 完成后,关闭并停止所有笔记本。

完成笔记本的工作后,请返回本模块,并转到下一个单元学习更多内容。