你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Data Box 限制

部署和操作 Microsoft Azure Data Box 时请考虑这些限制。 下表介绍了 Data Box 的这些限制。

Data Box 服务限制

  • 如果通过 Data Box 服务使用多个存储帐户,则所有存储帐户应属于同一 Azure 区域。
  • 我们建议使用不超过三个存储帐户。 使用更多存储帐户可能影响性能。

Data Box 限制

  • Data Box 最多可存储导入和导出的 5 亿个文件。
  • Data Box 在云中最多支持 512 个容器或共享。 用户共享中的顶层目录将成为云中的容器或 Azure 文件共享。
  • 由于 ReFS 元数据空间消耗,Data Box 用量容量可能小于 80 TiB。
  • Data Box 在网络文件系统 (NFS) 共享上一次最多支持 10 个客户端连接。

Azure 存储限制

本部分介绍了应用于 Data Box 服务的 Azure 存储服务限制,以及 Azure 文件、Azure 块 blob 和 Azure 页 blob 的必需命名约定。 请仔细查看存储限制并遵循所有建议。

有关 Azure 存储服务限制的最新信息以及对共享、容器和文件进行命名的最佳做法,请转到:

重要

如果有任何文件或目录超出了 Azure 存储服务限制,或者不符合 Azure 文件/Blob 命名约定,则这些文件或目录不会通过 Data Box 服务引入到 Azure 存储中。

数据复制和上传注意事项

导入命令

Data Box 导入命令的注意事项包括:

  • 容器、共享和文件夹:
    • 不要直接将文件复制到任何预创建的共享。 需要在共享下创建文件夹,然后将文件复制到该文件夹。
    • StorageAccount_BlockBlob 和 StorageAccount_PageBlob 下的文件夹为容器。 例如,容器创建为 StorageAccount_BlockBlob/container 和 StorageAccount_PageBlob/container
    • 直接在 StorageAccount_AzFile 下创建的每个文件夹都将转换为 Azure 文件共享。
    • Azure Blob 存储不支持目录。 如果在 StorageAccount_BlockBlob 文件夹下创建文件夹,将以 blob 的名义创建虚拟文件夹。 对于 Azure 文件,将维护实际的目录结构。
  • 合并文件夹内容:
    • 写入到 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 共享中的每个文件将分别上传为块 blob 和页 blob
    • 如果文件夹与现有容器同名,则文件夹的内容将与容器的内容合并。 云中尚未有的文件或 Blob 将添加到容器中。 如果某个文件或 Blob 与容器中已有的文件或 Blob 同名,则会覆盖现有文件或 Blob。
    • 如果容器具有同名的现有存档 blob,上传到存档层中的 blob 将失败。 当 blob 位于存档层时,无法对其进行读取或修改。 如果需要覆盖 blob,请确保 blob 未设置为存档。 有关详细信息,请参阅存档访问层
    • 在 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 文件夹下创建的任何空目录层次结构(没有任何文件)都不会上传
  • Azure Data Box 不支持将数据导入 NFS Azure 文件共享。 如果将数据从 Data Box 复制到现有的 NFS Azure 文件共享中,名称与源文件夹相同,会产生冲突。 为了解决此冲突,Data Box 会将源共享重命名为 databox-<GUID>,并将其作为 SMB Azure 文件共享上传到目标存储帐户。
  • 如果将 SMB 和 NFS 协议用于数据副本,建议:
    • 对 SMB 和 NFS 使用不同的存储帐户。
    • 不要使用 SMB 和 NFS 将相同的数据复制到 Azure 中的同一端目标。 在这些情况下,最终的结果不可确定。
    • 尽管可以同时通过 SMB 和 NFS 进行复制,但我们不建议这样做,因为这很容易出现人为错误。 等待 SMB 数据复制完成,然后启动 NFS 数据复制。
  • 上传管理:
    • 如果将数据上传到 Azure 时发生任何错误,则会在目标存储帐户中创建一个错误日志。 当上传完成时,可以找到此错误日志的路径,并且可以查看此日志来采取纠正措施。 在验证上传的数据之前,不要删除源中的数据。
    • 根据保留 Azure Data Box 的文件 ACL、属性和时间戳中的指南将数据上传到 Azure 文件存储时,可以保留文件元数据和 NTFS 权限。
    • 在将 Blob 和 Azure 文件存储上传到云时,将保留文件的层次结构。 例如,你在以下路径复制了一个文件:<container folder>\A\B\C.txt。 此文件将上传到云中的相同路径。
    • 如果文件的“CreateTime”或“LastWriteTime”字段在上传期间超出允许的大小,则 Azure 文件属性中的原始日期替换为“9999 年 12 月 31 日,周五,23:59:59”。 文件上传成功,未引发任何错误。

导出命令

Data Box 导出命令的注意事项包括:

  • Data Box 是一种基于 Windows 的设备,不支持区分大小写的文件名。 例如,Azure 中可能有两个不同的文件,其名称只是大小写不同。 请勿使用 Data Box 来导出这些文件,因为文件将在设备上被覆盖。
  • 如果输入文件或标记中存在引用相同数据的重复标记,则 Data Box 导出可能会跳过或覆盖文件。 Azure 门户显示的文件数和数据大小可能不同于设备上数据的实际大小。
  • Data Box 通过服务器消息块 (SMB) 协议将数据导出到基于 Windows 的系统,并受文件和文件夹的 SMB 限制的约束。 名称不受支持的文件和文件夹不会导出。
  • 从前缀到容器的映射为 1:1。
  • 文件名的大小最大为 1024 个字符。 超过此长度的文件名不会被导出。
  • (在命令创建过程中上传的)Xml文件中的重复前缀会导出 。 不会省略重复的前缀。
  • 页 blob 和容器名称区分大小写。 如果大小写不匹配,就无法找到 blob 和/或容器。

Azure 存储帐户大小限制

下面是对复制到存储帐户的数据的大小限制。 请确保上传的数据符合这些限制。 有关这些限制的最新信息,请参阅 Blob 存储的可伸缩性和性能目标Azure 文件存储的可伸缩性和性能目标

复制到 Azure 存储帐户的数据的大小 默认限制
块 Blob 和页 blob 最大限制与为 Azure 订阅规定的存储限制相同,并且包含来自所有源(包括 Data Box)的数据。
Azure 文件 Data Box 支持 Azure 高级文件共享,允许存储帐户中的所有共享总共有 100 TiB。 由于复制日志和审核日志占用了一定的空间,因此最大可用容量略低。 为复制日志和审核日志至少各保留 100 GiB。 有关详细信息,请参阅 Azure Data Box 的审核日志 Azure Data Box Heavy。 “StorageAccount_AzFile”下的所有文件夹都须遵循此限制。 有关详细信息,请参阅创建 Azure 文件共享

Azure 对象大小限制

下面是可以写入的 Azure 对象的大小。 请确保上传的所有文件都符合这些限制。

Azure 对象类型 默认限制
块 blob 14 TiB
页 blob 4 TiB
以页 Blob 格式上传的文件都必须是 512 字节对齐(整数倍),否则上传失败。
VHD 和 VHDX 为 512 字节对齐。
Azure 文件 4 TiB
托管磁盘 4 TiB
有关大小和限制的详细信息,请参阅:
  • 标准 SSD 的可伸缩性目标
  • 高级 SSD 的可伸缩性目标
  • 标准 HDD 的可伸缩性目标
  • 托管磁盘的定价和计费
  • Azure 块 blob、页 blob 和文件命名约定

    实体 约定
    块 Blob 和页 Blob 的容器名称 必须是有效的 DNS 名称,长度为 3 到 63 个字符。
    必须以字母或数字开头。
    只能包含小写字母、数字和连字符 (-)。
    每个连字符 (-) 字符的前后必须紧接字母或数字。
    名称中不允许连续的连字符。
    Azure 文件的共享名 同上
    Azure 文件的目录和文件名
  • 保留大小写,不区分大小写,并且长度不能超过 255 个字符。
  • 不能以正斜杠 (/) 结尾。
  • 如有,则将自动删除。
  • 不允许使用以下字符:" \ / : | < > * ?
  • 必须正确地对保留的 URL 字符进行转义。
  • 不允许使用非法的 URL 路径字符。 \uE000 之类的码位是无效的 Unicode 字符。 也不允许使用某些 ASCII 或 Unicode 字符,如控制字符(0x00 到 0x1F、\u0081 等等)。 有关适用于 HTTP/1.1 中字符串的规则,请参阅第 2.2 节 RFC 2616:基本规则和 RFC 3987。
  • 不允许使用以下文件名:LPT1、LPT2、LPT3、LPT4、LPT5、LPT6、LPT7、LPT8、LPT9、COM1、COM2、COM3、COM4、COM5、COM6、COM7、COM8、COM9、PRN、AUX、NUL、CON、CLOCK$、圆点字符 (.) 和两个圆点字符 (..)。
  • 块 Blob 和页 Blob 的 Blob 名称
  • Blob 名称区分大小写,只能包含字符的任意组合。
  • Blob 名称的长度必须为 1 到 1,024 个字符。
  • 必须正确地对保留的 URL 字符进行转义。
  • 构成 Blob 名称的路径段数目不能超过 254 个。 路径段是指对应于虚拟目录名称的相邻分隔符(例如,正斜杠“/”)之间的字符串。