将客户端连接到 Azure Managed Lustre 文件系统

已完成

本单元介绍如何从客户端计算机准备客户端并装载 Azure Managed Lustre 文件系统。

客户端要求

运行 Linux 的客户端计算机可以访问 Azure Managed Lustre。 基本客户端要求如下:

  • Lustre 客户端软件:客户端必须安装相应的 Lustre 客户端包。 预生成的客户端包通过 Azure Managed Lustre 进行测试。 有关说明和客户端包下载选项,请参阅安装或升级 Lustre 客户端软件。 客户端包适用于多个常用的 Linux OS 分发版。
  • 网络访问:客户端计算机需要与托管 Azure Managed Lustre 文件系统的子网建立网络连接。 如果客户端位于其他虚拟网络中,则可能需要使用虚拟网络对等互连。
  • 装载命令 - 客户端必须使用 POSIX mount 命令连接到文件系统。
  • 性能:若要实现最佳性能,客户端应满足以下要求:
  • 安全类型:选择 VM 的安全类型时,请选择标准安全类型。 选择“受信任启动”或“机密”将阻止在客户端上正确安装 Lustre 模块。

以下步骤介绍了将客户端连接到 Azure Managed Lustre 文件系统的基本工作流:

  1. 在每个客户端上安装或升级 Lustre 客户端软件
  2. 使用 mount 命令使 Azure Managed Lustre 文件系统在客户端上可用。
  3. 不再需要客户端时,请在关闭之前使用 umount 命令彻底卸载客户端,无需使用 -f(强制)或 -l(延迟)选项。 在重新启动或取消预配之前,未能正确卸载客户端可能会导致其他客户端出现性能问题。

安装或升级 Lustre 客户端软件

连接到 Lustre 文件系统的每个客户端都必须具有与文件系统的 Lustre 版本(当前为 2.15)兼容的 Lustre 客户端包。

可以从适用于 Microsoft 产品的 Linux 软件存储库下载 Azure Managed Lustre 的预生成和测试客户端包。

以下 Linux 操作系统提供软件包和内核模块:

如果需要在 Linux 系统上升级旧版 Lustre 客户端,请参阅将 Lustre 客户端升级到当前版本。 在升级过程中,必须删除旧版内核模块和软件包。

注意

Microsoft 将在新内核可用的一个工作日内发布新包。 如果遇到任何问题,请提交支持工单。

使用装载命令启动 Lustre 客户端

注意

运行 mount 命令之前,请确保客户端主机可以看到 Azure Managed Lustre 文件系统的虚拟网络。 为此,可以对文件系统的服务器 IP 地址进行 ping 操作。 如果 ping 命令未成功,请将文件系统网络设置为与计算资源网络对等互连。

将所有客户端装载到文件系统的 MGS IP 地址。 Azure 门户中的“客户端连接”页显示 IP 地址,并提供一个示例 mount 命令,可复制并用于装载客户端。

门户中“客户端连接”页的屏幕截图。

mount 命令包括三个组件:

  • 客户端路径:应装载 Azure Managed Lustre 文件系统的客户端计算机上的路径。 默认值为文件系统名称,但可以更改它。 在使用 mount 命令之前,请确保客户端计算机上存在此目录路径。
  • MGS IP 地址:Azure Managed Lustre 文件系统 Lustre 管理服务 (MGS) 的 IP 地址。
  • 装载命令选项:示例 mount 命令中包含其他建议的选项。

这些组件以以下形式组合成 mount 命令:

sudo mount -t lustre -o noatime,flock <MGS_IP>@tcp:/lustrefs /<client_path>

MSG IP 术语中的 lustrefs 值是系统分配的内部名称,与 Azure 托管系统中的 Lustre 群集相关联。 创建自己的 mount 命令时,请不要更改此文本值。

将客户端路径设置为客户端上存在的任何便捷的装载路径。 它不需要是 Azure Managed Lustre 文件系统名称(这是默认值)。

示例 mount 命令:

sudo mount -t lustre -o noatime,flock 10.0.0.4@tcp:/lustrefs /azure-lustre-mount

客户端已连接到文件系统,现在可以像使用任何装载的文件系统一样使用 Azure Managed Lustre 文件系统。 例如,可以启动计算作业来处理从 blob 容器导入的数据。

重要

不再需要客户端时,必须在关闭之前彻底卸载客户端,无需使用 -f(强制)或 -l(延迟)选项。 在重新启动或取消预配之前,未能正确卸载客户端可能会导致其他客户端出现性能问题。