了解快取使用量模型
快取使用量模型可讓您自訂 Azure HPC Cache 儲存檔案的方式,進而加速工作流程。
基本檔案快取概念
檔案快取是 Azure HPC Cache 加快用戶端要求的方式。 其中會使用下列基本做法:
讀取快取 - Azure HPC Cache 會保留用戶端自儲存系統要求的檔案複本。 下次用戶端要求相同檔案時,HPC Cache 可提供其快取鐘的版本,而無須再次從後端儲存系統擷取檔案。 寫入要求會傳遞至後端儲存系統。
寫入快取 - Azure HPC Cache 也可儲存自用戶端電腦傳送的任何已變更檔案複本。 如果多個用戶端在短時間內對相同檔案進行變更,快取可收集快取中的所有變更,而無須個別將每個變更寫入後端儲存系統。 在指定時間內皆未變更之後,快取會將檔案移至長期儲存系統。
驗證計時器:驗證計時器設定會決定快取比較其本機檔案複本與後端儲存系統上遠端版本的頻率。 如果後端複本比快取複本還新,則快取會擷取遠端複本並儲存以供未來要求使用。
驗證計時器會顯示快取自動比較其檔案與遠端儲存體中來源檔案的時間。 然而,您可透過執行包含 readdirplus 要求的目錄作業,強制 Azure HPC Cache 比較檔案。 Readdirplus 是標準 NFS API (也稱為擴充讀取),會傳回目錄中繼資料,這會導致快取比較和更新檔案。
回寫計時器:對於具有讀寫快取的快取,回寫計時器是快取將變更檔案複製到後端儲存系統之前等待的時間上限 (以秒為單位)。
Azure HPC Cache 內建的使用量模型有這些設定不同的值,以便可針對解決方法選擇最佳的組合。
為工作流程選擇正確的使用量模型
您必須為每個所使用的 NFS 通訊協定儲存目標選擇使用量模型。 Azure Blob 儲存目標有內建使用量模型,但無法自訂。
HPC Cache 使用量模型可讓您選擇如何平衡快速回應與取得過時資料的風險。 如果您想要最佳化讀取檔案的速度,您可能不會在意是否針對後端檔案,檢查快取中的檔案。 另一方面,如果您想確保遠端儲存體中的檔案一律為最新狀態,請選擇模型並將驗證計時器設為較小數字,以便經常執行檢查。
以下是使用量模型選項:
唯讀快取:如果您想要加快檔案讀取存取速度,請使用此選項。 當工作流程涉及最低的寫入作業時 (例如 0% 到 5%),請選擇此選項。
此選項會快取用戶端讀取,但不會快取寫入。 寫入會傳遞至後端儲存體。
儲存在快取中的檔案不會自動與 NFS 儲存體磁碟區上的檔案比較。 (閱讀上述驗證計時器的說明,了解如何手動進行比較。)
選擇 [唯讀快取] 選項時,您可以變更驗證計時器。 預設值為 30 秒。 此值必須是介於 1 到 31536000 秒(1 年) (含此二數) 之間的整數 (無小數點)。
讀寫快取:此選項會同時快取讀取和寫入作業。 使用此選項時,大部分用戶端預期會透過 Azure HPC Cache 存取檔案,而不是直接掛接後端儲存體。 若尚未複製到後端,則將近期變更快取檔案。
在此使用量模型中,根據預設,快取中的檔案僅會每隔八小時檢查一次後端儲存體上的檔案。 檔案的快取版本會採用較新的版本。 根據預設,快取中修改的檔案會在進行快取一小時之後,寫入後端儲存系統。
選擇 [讀寫快取] 選項時,您可以同時變更驗證計時器和回寫計時器。 驗證計時器的預設值為 28,800 秒 (8 小時)。 此值必須是介於 1 到 31536000 (含此二數) 之間的整數 (無小數點)。 回寫計時器的預設值為 3600 秒 (1 小時)。 此值必須是介於 1 到 31536000 秒(1 年) (含此二數) 之間的整數 (無小數點)。
下表會摘要說明使用量模型的差異:
使用量模型 | 快取模式 | 驗證計時器 | 回寫計時器 |
---|---|---|---|
唯讀快取 | 參閱 | 30 秒 | 無 |
讀寫快取 | 讀取/寫入 | 8 小時 | 1 小時 |
警告
變更使用量模型會導致服務中斷。 在使用量模型轉換期間,HPC Cache 用戶端不會收到回應。 如需變更使用量模型,建議您在排程維護期間執行變更,避免造成用戶端中斷。
如果有關於 Azure HPC Cache 工作流程最佳使用量模型的相關問題,請與您的 Azure 代表聯絡並開啟支援要求以取得協助。
提示
公用程式可用來將特定個別檔案回寫至儲存目標,而無須寫入整個快取內容。 深入瞭解自訂 Azure HPC Cache 中檔案回寫的 flush_file.py 指令碼。
下一步
- 新增儲存目標至您的 Azure HPC Cache