定义重复数据删除的用例和互操作性

已完成

重复数据删除的节省量取决于数据类型、数据混合、卷大小以及这些卷包含的文件。 你可以在启用删除重复之前选择根据卷对节省量进行评估。

重复数据删除用例

下表提供了典型的删除重复场景及其各自的卷的空间节省量:

用例 内容 空间节省量
用户文档 组内容发布或共享、用户主文件夹和访问脱机文件的配置文件重定向 30% 到 50%
软件部署共享 软件二进制文件、cab 文件、符号文件、图像和更新 70% 到80%
虚拟化库 预配到虚拟机监控程序的虚拟硬盘文件(如 .vhd 和 .vhdx 文件) 80% 到95%
通用文件共享 以前识别的所有数据类型的组合 50% 到 60%

A volume hosting optimized data with 80% savings.

根据潜在节省量和 Windows Server 中典型的资源使用状况,重复数据删除的部署候选项的级别被设置为理想的,但应该是已评估或非理想的候选项。

  • 重复数据删除的理想候选项:
    • 文件夹重定向服务器。
    • 虚拟化 depot 或设置库。
    • 软件部署共享。
    • Microsoft SQL Server 和 Microsoft Exchange Server 备份卷。
    • 横向扩展文件服务器 (SOFS) 群集共享卷 (Csv) 上的文件。
    • 虚拟化备份 VHD(如 Microsoft System Center Data Protection Manager)。
    • 虚拟桌面基础结构 VDI VHD(仅个人 VDI)。

重要

在大多数 VDI 部署中,考虑使用启动 Storm 时需要特殊规划。 此术语是指许多用户(通常是在工作日开始时)尝试同时登录其 VDI 的情况。 启动 Storm 会对 VDI 存储系统强加大量负载,并在 VDI 用户首次登录过程中对其造成长时间的延迟。 你可以通过启用删除重复,将启动 Storm 的影响降到最低。 这样就可以在 VM 启动过程中将从磁盘上的删除重复存储读取的区块缓存在内存中。 因此后续读取无需频繁访问磁盘上的区块,因为它们在缓存中可用。

  • 应基于以下内容进行评估:

    • 业务线 (LOB) 服务器。
    • 静态内容提供程序。
    • Web 服务器。
    • 高性能计算 (HPC)。
  • 重复数据删除的非理想候选项:

    • Microsoft Hyper-V 主机。
    • Windows Server Update Services (WSUS)。
    • SQL Server 和 Exchange Server 数据库卷。

使用重复数据删除评估工具评估节省

可以使用重复数据删除评估工具 DDPEval.exe 确定特定卷上的删除重复的预期节省量。 DDPEval.exe 支持评估本地驱动器和已映射或未映射的远程共享。

提示

安装删除重复功能时,DDPEval.exe 会自动安装到目录 \Windows\System32\ 中。

重复数据删除互操作性

在 Windows Server 中部署重复数据删除时,应考虑以下相关技术和潜在问题:

Windows BranchCache

通过在 Windows Server 和 Windows 客户端操作系统上启用 BranchCache,优化跨广域网 (WAN) 的数据访问。 将这两种技术结合使用时,所有已删除重复数据的文件都已建立索引并进行了哈希处理,从而加速处理来自分支机构的数据请求。 这类似于预索引或预哈希处理已启用 BranchCache 的服务器。

注意

BranchCache 是一项功能,可以在用户从分支机构访问总部的内容时降低 WAN 利用率并增强网络应用程序的响应能力。 启用 BranchCache 之后,会在分支机构内缓存从 Web 服务器或文件服务器检索到的内容的副本。 如果分支机构的另一个客户端请求相同的内容,那么该客户端可以直接从分支机构的本地网络下载该内容,而无需再次使用 WAN检索总部的内容。

故障转移群集

故障转移群集完全支持重复数据删除,这意味着已删除重复数据的卷可以在群集中的节点之间正常进行故障转移。 但这需要在参与故障转移的群集中的每个节点上安装重复数据删除功能。

FSRM 配额

尽管不应在为删除重复启用的卷根文件夹上创建硬配额,但在这种情况下可以使用文件服务器资源管理器 (FSRM) 创建软配额。 FSRM 遇到已删除重复数据的文件时,将识别配额计算的文件逻辑大小。 所以在删除重复处理文件时,配额使用情况(包括所有配额阈值)不会更改。 使用删除重复时,所有其他的 FSRM 配额功能(包括卷根目录的软配额和子文件夹配额)都将正常工作。

注意

FSRM 是一套工具,帮助识别、控制和管理存储在服务器上的数据类型和数量。 通过 FSRM,可以在文件夹和卷上配置硬配额或软配额。 硬配额可在达到配额限制后阻止用户保存文件,而软配额不强制实施配额限制,它在卷上的数据达到阈值时生成通知。

DFS 复制

重复数据删除与分布式文件系统 (DFS) 复制兼容。 优化或取消优化文件都不会触发复制,因为文件不会更改。 为节省在线传输时间,DFS 复制使用远程差分压缩 (RDC),而不是区块存储中的区块。