Azure 記憶體 Blob 清查是管理及追蹤儲存在 Azure Blob 記憶體帳戶中的物件的重要工具。 其提供記憶體資源的完整概觀,可讓您做出有關數據管理和成本優化的明智決策。
啟用 Blob 清查報告之後,記憶體帳戶中的物件會使用清查原則中定義的規則定期掃描。 產生清查報告所需的時間取決於數個因素。 這些因素包括物件數目、目錄結構、透過規則子類型套用的篩選條件、記憶體帳戶上的客戶工作負載、記憶體資源的可用性等等。 在某些情況下,視這些因素而定,可能需要數天的時間才能完成記憶體帳戶中的所有物件處理。 清查的效能也會在掃描期間和掃描期間有時有所不同。
影響 Blob 清查效能的因素
使用 Blob 清查來產生清查報告時,有幾個主要因素可能會影響其效能。 了解這些因素可協助您優化清查程式,並啟用有效率的數據管理。
在已啟用階層命名空間的帳戶中散發物件
啟用階層命名空間的帳戶內物件的分佈可能會大幅影響清查效能。 Blob 清查會一次掃描一個目錄,並在移至下一個目錄之前完成該掃描。 因此,大量目錄,特別是使用疏鬆物件散發和深層巢狀,可以增加產生清查報告所需的時間。
針對清查規則處理的物件數目
根據清查規則掃描的物件總數是處理效能的關鍵因素。 以大量物件為目標的規則需要更多時間和資源來產生清查報表。 如果您的清查規則包含版本、快照集和虛刪除的物件,要處理的物件數目會增加。 當這些子類型存在於大量時,可以進一步延長產生清查報表所需的處理時間。
清查報表的導出格式
庫存報表 (CSV 或 Apache Parquet) 選擇的匯出格式可能會影響效能。 雖然 Parquet 已針對快速數據處理進行優化,但相較於 CSV,可能會降低產生報表的額外負荷。
大量虛刪除的物件
虛刪除的物件雖然未永久移除,但仍包含在清查掃描中。 大量這些物件可以新增至處理時間並降低效能。 藉由考慮這些因素,您可以增強清查執行的效能,並擁有更有效率的數據管理體驗。
改善 Blob 清查效能的最佳做法
有效率地管理您的 Azure Blob 記憶體對於維護最佳效能和成本效益至關重要。 以下是增強 Azure 記憶體 Blob 清查效能的一些最佳做法:
避免在已啟用階層命名空間的帳戶中疏鬆帳戶
疏鬆帳戶是包含大量物件分散到許多目錄的帳戶。 這些目錄可能或可能不會包含深層巢狀結構。 疏鬆帳戶會產生非常低的檔案與目錄比率,這可能會導致庫存報告產生效率低,甚至導致失敗。 若要降低這些效率低下,請確定您已啟用階層命名空間的記憶體帳戶已妥善組織,並避免有疏鬆的物件分佈。
使用 CSV 進行匯出格式
產生清查報告時,如果您的使用案例不需要快速數據處理,請選擇 csv 格式。 Parquet 是針對效能優化的單欄式記憶體檔格式,也是為了數據處理而讀取的最快格式之一。 不過,parquet 格式可能會增加產生報表所需的時間,因為其額外負荷會比以 csv 格式產生報表的速度慢。 如果您需要 parquet 格式以後續處理報表,則可以利用可用的開放原始碼工具,將 CSV 轉換為 parquet 格式。
使用前置詞界定清查規則的範圍
使用前置詞比對篩選來產生特定數據子集的清查報告,而不是在整個記憶體帳戶上執行清查。
包含前置詞:此篩選會以容器內的一組容器或路徑為目標。 這種方法有助於縮小清查報表的範圍,讓程式更快速且更有效率。
排除前置詞:使用此篩選從中排除某些特定子集。 這種方法也有助於縮小清查報表的範圍。 若要深入瞭解,請參閱 規則篩選
選取相關的欄位
只選取您需要的相關欄位,以自訂您的清查報表。 這樣做可減少處理和導出的數據量,進而產生更快速的報表,並更容易進行分析。 若要深入瞭解清查架構欄位,請參閱 Blob 清查支援的自訂架構欄位
子類型包含:已刪除的物件、快照集和版本
雖然包含這些子類型可以提供更完整的記憶體帳戶檢視,但請務必評估它們是否對您的稽核和管理需求至關重要。 如果它們不重要,則排除它們有助於改善報表產生程式的效能和效率。 若要識別在最近清查執行中刪除的物件,請比較目前執行的 Blob 名稱與先前執行中的物件。 差異可以提供最近刪除的物件清單。
訂閱 Blob 清查事件
訂閱 Blob 清查事件,隨時瞭解用戶引發的錯誤。 此主動式方法可協助您快速解決問題。 若要深入瞭解如何訂閱清查事件,請參閱 訂閱 Blob 清查原則已完成事件。
監視非預期的容量增加
請注意記憶體帳戶容量中的非預期尖峰,因為它們可能會發出 Blob 版本、快照集或虛刪除對象的累積信號。 監視這些變更可協助您偵測並解決潛在問題,再影響效能。 此外,管理這些物件的生命週期可以防止不必要的建置並改善 Blob 清查效能。 若要深入瞭解 Blob 生命週期管理,請參閱 Azure Blob 記憶體生命週期管理概觀
遵循這些最佳做法,您可以增強 Blob 清查的效能,確保 Azure Blob 記憶體的有效管理。