Azure 數據箱限制

當您部署及操作 Microsoft Azure 資料箱時,請考慮這些限制。 下表描述數據箱的這些限制。

數據箱服務限制

  • 如果您使用多個記憶體帳戶搭配數據箱服務,則所有記憶體帳戶都應該屬於相同的 Azure 區域。
  • 我們建議您使用不超過三個記憶體帳戶。 使用更多記憶體帳戶可能會影響效能。

數據箱限制

  • 數據箱最多可儲存 5 億個檔案以進行匯入和匯出。
  • 數據箱最多支援512個容器或雲端中的共用。 用戶共用內的最上層目錄會變成雲端中的容器或 Azure 檔案共用。
  • 數據箱使用量容量可能小於 80 TiB,因為 ReFS 元數據空間耗用量。
  • 數據箱在 NFS 共用上一次最多支援 10 個用戶端連線。

Azure 儲存體限制

本節說明 Azure 儲存體 服務的限制,以及適用於數據箱服務之 Azure 檔案儲存體、Azure 區塊 Blob 和 Azure 分頁 Blob 的必要命名慣例。 請仔細檢閱儲存體限制,並遵循所有的建議。

如需與 Azure 儲存體服務限制以及命名共用、容器和檔案的最佳作法有關的最新資訊,請移至:

重要

如果有任何檔案或目錄超過 Azure 儲存體 服務限制,或不符合 Azure 檔案儲存體/Blob 命名慣例,則這些檔案或目錄不會透過數據箱服務擷取到 Azure 儲存體。

數據複製和上傳注意事項

針對匯入訂單

匯入訂單的資料箱注意事項包括:

  • 容器、共用和資料夾:
    • 請勿將檔案直接複製到任何預先建立的共用。 您必須在共用下建立資料夾,然後將檔案複製到該資料夾。
    • 儲存體 Account_BlockBlob 和 儲存體 Account_PageBlob的資料夾是容器。 例如,容器會建立為 儲存體 Account_BlockBlob/container儲存體 Account_PageBlob/container
    • 直接在 儲存體 Account_AzFile建立的每個資料夾都會轉譯成 Azure 檔案共用。
    • Azure Blob 儲存體 不支援目錄。 如果您在 儲存體 Account_BlockBlob資料夾下建立資料夾,則會在 Blob 名稱中建立虛擬資料夾。 針對 Azure 檔案儲存體,會維護實際的目錄結構。
  • 合併資料夾內容:
    • 每個寫入 儲存體 Account_BlockBlob儲存體 Account_PageBlob 共用的檔案都會分別上傳為區塊 Blob 和分頁 Blob。
    • 如果資料夾的名稱與現有的容器相同,資料夾的內容會與容器的內容合併。 尚未在雲端中的檔案或 Blob 會新增至容器。 如果檔案或 Blob 的名稱與容器中的檔案或 Blob 相同,則會覆寫現有的檔案或 Blob。
    • 如果容器有具有相同名稱的現有封存 Blob,則上傳至封存層中的 Blob 將會失敗。 當 blob 位於封存層時,無法讀取或修改。 如果您需要覆寫 Blob,請確定 Blob 未設定為封存。 如需詳細資訊,請參閱封存存取層
    • 不會上傳在 儲存體 Account_BlockBlob儲存體 Account_PageBlob 資料夾下建立的任何空白目錄階層(不含任何檔案)。
  • Azure 資料箱不支援將數據匯入 NFS Azure 檔案共用。 將數據從數據箱複製到與源資料夾相同的名稱的現有NFS Azure 檔案共用中,會產生衝突。 為了解決衝突,數據箱會將來源共用重新命名為 , databox-<GUID> 並將它上傳至目標記憶體帳戶作為SMB Azure檔案共用。
  • 如果您使用 SMB 和 NFS 通訊協定進行資料複製,建議您:
    • 針對SMB和NFS使用不同的記憶體帳戶。
    • 請勿使用 SMB 和 NFS,將相同的數據複製到 Azure 中的相同端目的地。 在這些情況下,無法判斷最終結果。
    • 雖然透過SMB和NFS平行複製可以運作,但我們不建議這麼做,因為它容易發生人為錯誤。 等到SMB資料複製完成,再開始NFS資料複製。
  • 上傳管理:
    • 若要改善數據上傳期間的效能,建議您 在記憶體帳戶上啟用大型檔案共用,並將共用容量增加到 100 TiB
    • 如果在將數據上傳至 Azure 時發生任何錯誤,則會在目標記憶體帳戶中建立錯誤記錄檔。 上傳完成時可以使用此錯誤記錄檔的路徑,而且您可以檢閱記錄檔以採取更正動作。 請勿在驗證上傳的數據的情況下,從來源刪除數據。
    • 當數據上傳至 Azure 檔案儲存體 時,可以使用使用 Azure 數據箱保留檔案 ACL、屬性和時間戳中的指引,保留檔案元數據和 NTFS 許可權。
    • 上傳至雲端的 Blob 和 Azure 檔案儲存體 時,會維護檔案的階層。 例如,您已在此路徑複製檔案: <container folder>\A\B\C.txt。 此檔案會上傳至雲端中的相同路徑。
    • 如果檔案的 CreateTimeLastWriteTime 字段在上傳期間超過允許的大小,“Fri, 31 Dec 9999 23:59:59” 會取代 Azure 檔案屬性中的原始日期。 檔案上傳成功,而且不會引發錯誤。

針對匯出訂單

匯出訂單的資料箱注意事項包括:

  • 數據箱是 Windows 型裝置,不支援區分大小寫的檔名。 例如,您在 Azure 中可能有兩個不同的檔案,其名稱與大小寫不同。 請勿使用數據箱匯出這類檔案,因為裝置上將會覆寫檔案。
  • 如果您在輸入檔案或參考相同數據的標記中有重複標記,數據箱匯出可能會略過或覆寫檔案。 Azure 入口網站 顯示的檔案數目和數據大小可能與裝置上的實際數據大小不同。
  • 數據箱會透過SMB將數據匯出至 Windows 型系統,並受限於檔案和資料夾的SMB限制。 不會匯出具有不支援名稱的檔案和資料夾。
  • 從前置詞到容器有 1:1 的對應。
  • 檔名大小上限為 1024 個字元。 不會匯出超過此長度的檔名。
  • XML 檔案中的重複前置詞會匯出(在建立訂單期間上傳)。 不會忽略重複的前置詞。
  • 分頁 Blob 和容器名稱會區分大小寫。 如果大小寫不符,則找不到 Blob 和/或容器。

Azure 記憶體帳戶大小限制

以下是複製到記憶體帳戶的數據大小限制。 請確定您上傳的數據符合這些限制。 如需這些限制的最新資訊,請參閱 Blob 儲存體的可擴縮性和效能目標,以及 Azure 檔案儲存體可擴縮性和效能目標

複製到 Azure 儲存體帳戶中的資料大小 預設限制
區塊 Blob 和分頁 Blob 最大限制與針對 Azure 訂用帳戶定義的 儲存體 限制相同,其中包含來自所有來源的數據,包括數據箱。
Azure 檔案
  • 如果數據箱在建立數據箱訂單之前啟用,數據箱支援大型檔案共用 (100 TiB)。
  • 數據箱支援 Azure 進階版 檔案共享,允許記憶體帳戶中所有共用總共 100 TiB。
    • 由於複製記錄和稽核記錄所使用的空間,可用容量上限稍微少一些。 複製記錄和稽核記錄至少保留 100 GiB。 如需詳細資訊,請參閱 稽核 Azure 數據箱、Azure Data Box Heavy 的記錄。
    • 儲存體 Account_AzFile 下的所有資料夾都必須遵循此限制。 如需詳細資訊,請參閱建立 Azure 檔案共用

Azure 物件大小限制

以下是可寫入的 Azure 物件大小。 請確定所有上傳的檔案均符合這些限制。

Azure 物件類型 預設限制
區塊 Blob 14 TiB
分頁 Blob 4 TiB
以分頁 Blob 格式上傳的每個檔案都必須對齊 512 個字節(整數倍數),否則上傳會失敗。
VHD 和 VHDX 會對齊 512 個字節。
Azure 檔案 4 TiB
受控磁碟 4 TiB
如需大小和限制的詳細資訊,請參閱:
  • 標準 SSD 的延展性目標
  • 進階版 SSD 的延展性目標
  • 標準 HDD 的延展性目標
  • 受控磁碟的定價和計費
  • Azure 區塊 Blob、分頁 Blob 和檔案命名慣例

    實體 慣例
    區塊 Blob 和分頁 Blob 的容器名稱 必須是長度為 3 到 63 個字元的有效 DNS 名稱。
    必須以字母或數字開頭。
    只能包含小寫字母、數位和連字元 (-)。
    每個連字元 (-) 必須緊接在前面,後面接著字母或數位。
    名稱中不允許連續連字元。
    Azure 檔案的共享名稱 同上
    Azure 檔案的目錄和檔名
  • 不區分大小寫,長度不得超過 255 個字元。
  • 不能以正斜線 (/) 結尾。
  • 如果提供,系統會自動移除。
  • 不允許下列字元: " \ / : | < > * ?
  • 保留的 URL 字元必須正確逸出。
  • 不允許非法 URL 路徑字元。 \uE000 之類的代碼點不是有效的 Unicode 字元。 也不允許某些 ASCII 或 Unicode 字元,例如控制字元(0x00至 0x1F、\u0081 等等)。 如需管理 HTTP/1.1 中 Unicode 字串的規則,請參閱 RFC 2616 第 2.2 節:基本規則和 RFC 3987。
  • 不允許下列檔名:LPT1、LPT2、LPT3、LPT4、LPT5、LPT6、LPT7、LPT8、LPT9、COM1、COM2、COM3、COM4、COM5、COM6、COM7、COM8、COM9、PRN、AUX、NUL、CON、CLOCK$、dot character (..) 和兩個點字元 (..)。
  • 區塊 Blob 和分頁 Blob 的 Blob 名稱
  • Blob 名稱會區分大小寫,而且可以包含任何字元組合。
  • Blob 名稱長度必須介於 1 到 1,024 個字元之間。
  • 保留的 URL 字元必須正確逸出。
  • 組成 Blob 名稱的路徑區段數目不能超過 254。 路徑區段是連續分隔符之間的字串,例如,對應至虛擬目錄名稱的正斜線 『/』。