Azure Cosmos DB Python SDK 的效能秘訣

文章
08/15/2024

適用於：NoSQL

重要

本文中的效能秘訣僅適用於 Azure Cosmos DB Python SDK。如需詳細資訊，請參閱 Azure Cosmos DB Python SDK 自述檔、套件（PyPI）、套件（Conda）和疑難解答指南。

Azure Cosmos DB 是一個既快速又彈性的分散式資料庫，可在獲得延遲與輸送量保證的情況下順暢地調整。使用 Azure Cosmos DB 時，您不須進行主要的架構變更，或是撰寫複雜的程式碼來調整您的資料庫。相應增加和減少就像進行單一 API 呼叫或 SDK 方法呼叫一樣簡單。不過，因為 Azure Cosmos DB 是透過網路呼叫來存取，因此您可以進行客戶端優化，以在使用 Azure Cosmos DB Python SDK 時達到尖峰效能。

因此，如果您是問：「如何改善資料庫效能？」，請考慮下列選項：

網路

為了效能在相同 Azure 區域中共置用戶端

可能的話，請將任何呼叫 Azure Cosmos DB 的應用程式放在與 Azure Cosmos DB 資料庫相同的區域中。以約略的比較來說，在相同區域內對 Azure Cosmos DB 進行的呼叫會在 1-2 毫秒內完成，但美國西岸和美國東岸之間的延遲則會 >50 毫秒。視要求所採用的路由而定，各項要求從用戶端傳遞至 Azure 資料中心界限時的這類延遲可能有所不同。確保呼叫端應用程式與佈建的 Azure Cosmos DB 端點位於相同的 Azure 區域中，將可能達到最低的延遲。如需可用區域的清單，請參閱 Azure 區域。

Azure Cosmos DB 連線原則的圖例。

與多重區域 Azure Cosmos DB 帳戶互動的應用程式必須設定慣用位置，以確保要求會進入共置區域。

啟用加速網路以降低延遲和 CPU 抖動

建議您依照指示，在 Windows (按一下以取得指示) 或 Linux (按一下以取得指示) Azure VM 中啟用加速網路，以求達到最大效能 (降低延遲和 CPU 抖動)。

如果沒有加速網路，在 Azure VM 和其他 Azure 資源之間傳輸的 IO，可能反而會透過位於 VM 和其網路卡之間的主機和虛擬交換器來路由傳送。將主機和虛擬交換器內嵌在資料路徑中，不僅會增加通道的延遲和抖動，還會佔用 VM 的 CPU 週期。使用加速網路時，VM 會直接使用不含中繼的 NIC；由主機和虛擬交換器處理的任何網路原則詳細資料，都會在 NIC 的硬體中加以處理；完全略過主機和虛擬交換器。一般來說可以預期降低延遲並提高輸送量，而且啟用加速網路時，延遲情形會更為一致，CPU 使用率也會降低。

限制：VM OS 必須支援加速網路，而且只有在 VM 停止並解除配置時，才能啟用加速網路。無法使用 Azure Resource Manager 部署 VM。 App Service 未啟用加速網路。

如需詳細資訊，請參閱 Windows 和 Linux 指示。

SDK 使用方式

安裝最新的 SDK

Azure Cosmos DB SDK 會持續改善以提供最佳效能。請參閱 Azure Cosmos DB SDK 版本資訊，以判斷最新的 SDK 並檢閱改善。

在應用程式的存留期內使用單一 Azure Cosmos DB 用戶端

每個 Azure Cosmos DB 用戶端執行個體都是安全執行緒，並且會有效率地執行連線管理和位址快取處理。若要讓 Azure Cosmos DB 用戶端有效率的連線管理和更好的效能，建議在應用程式的存留期內使用 Azure Cosmos DB 用戶端的單一實例。

調整逾時和重試組態

您可以根據應用程式需求自定義逾時設定和重試原則。請參閱逾時和重試組態檔，以取得可自定義的組態完整清單。

使用應用程式所需的最低一致性層級

當您建立 CosmosClient 時，如果在用戶端建立中未指定帳戶層級一致性，則會使用帳戶層級一致性。如需一致性層級的詳細資訊，請參閱一致性層級檔。

擴增用戶端工作負載

如果您是以高輸送量層級進行測試，用戶端應用程式可能會成為瓶頸，因為電腦對 CPU 或網路的使用率將達到上限。如果到了這一刻，您可以將用戶端應用程式向外延展至多部伺服器，以繼續將 Azure Cosmos DB 帳戶再往前推進一步。

根據理想的經驗法則，建議不要超過任何指定伺服器上 >50% 的 CPU 使用率，以保持低延遲。

OS 開啟檔案資源限制

某些 Linux 系統 (例如 Red Hat) 有開啟檔案數目的上限，因此有連線總數的上限。執行下列命令來檢視目前的限制：

ulimit -a

開啟檔案 (nofile) 的數目必須夠大，才能有足夠空間供您設定的連線集區大小和 OS 的其他開啟檔案使用。您可以進行修改，以允許較大的連線集區大小。

開啟 limits.conf 檔案：

vim /etc/security/limits.conf

新增/修改下列幾行：

* - nofile 100000

查詢作業

如需查詢作業，請參閱查詢的效能秘訣。

編製索引原則

將未使用的路徑排除於索引編製外以加快寫入速度

Azure Cosmos DB 的索引編製原則可讓您利用檢索路徑 (setIncludedPaths 和 setExcludedPaths)，指定要在索引編製中包含或排除的文件路徑。在事先知道查詢模式的案例中，使用檢索路徑可改善寫入效能並降低索引儲存空間，因為檢索成本與檢索的唯一路徑數目直接相互關聯。例如，下列程式碼示範如何使用 "*" 萬用字元，將文件的整個區段 (亦稱為樹狀子目錄) 從索引編製作業中併入和排除。

container_id = "excluded_path_container"
indexing_policy = {
        "includedPaths" : [ {'path' : "/*"} ],
        "excludedPaths" : [ {'path' : "/non_indexed_content/*"} ]
        }
db.create_container(
    id=container_id,
    indexing_policy=indexing_policy,
    partition_key=PartitionKey(path="/pk"))

如需詳細資訊，請參閱 Azure Cosmos DB 索引編製原則。

輸送量

測量和調整較低的要求單位/秒使用量

Azure Cosmos DB 提供許多的資料庫作業，包括使用 UDF、預存程序和觸發程序進行關聯式和階層式查詢，而這些作業全都是對資料庫集合內的文件來進行。與上述各項作業相關聯的成本，會因為完成作業所需的 CPU、IO 和記憶體而不同。您不需要考慮和管理硬體資源，您可以將要求單位 (RU) 想成是執行各種資料庫作業以及服務應用程式要求時所需的資源數量。

輸送量是根據為每個容器所設定的要求單位數量來佈建。要求單位消耗量是以每秒的速率來計算。如果應用程式的速率超過為其容器佈建的要求單位速率，便會受到限制，直到該速率降到容器的佈建層級以下。如果您的應用程式需要較高的輸送量，您可以藉由佈建其他的要求單位來增加輸送量。

查詢的複雜性會影響針對作業所耗用的要求單位數量。述詞數目、述詞性質、UDF 數目，以及來源資料集的大小，全都會影響查詢作業的成本。

若要測量任何作業 (建立、更新或刪除) 的額外負荷，請檢查 x-ms-request-charge 標頭，來測量這些作業所耗用的要求單位數量。

document_definition = {
    'id': 'document',
    'key': 'value',
    'pk': 'pk'
}
document = container.create_item(
    body=document_definition,
)
print("Request charge is : ", container.client_connection.last_response_headers['x-ms-request-charge'])

在此標頭中傳回的要求費用是佈建輸送量的一小部分。例如，如果您佈建了 2000 RU/秒，且前述查詢傳回 1000 份 1 KB 文件，則作業成本會是 1000。因此在一秒內，伺服器在對後續要求進行速率限制前，只會接受兩個這類要求。如需詳細資訊，請參閱要求單位和要求單位計算機。

處理速率限制/要求速率太大

當用戶端嘗試超過帳戶保留的輸送量時，伺服器的效能不會降低，而且不會使用超過保留層級的輸送量容量。伺服器將預先使用 RequestRateTooLarge (HTTP 狀態碼 429) 來結束要求，並傳回 x-ms-retry-after-ms 標頭，以指出使用者重試要求之前必須等候的時間量 (毫秒)。

HTTP Status 429,
Status Line: RequestRateTooLarge
x-ms-retry-after-ms :100

SDK 全都隱含地攔截這個回應，採用伺服器指定的 retry-after 標頭，並重試此要求。除非有多個用戶端同時存取您的帳戶，否則下次重試將會成功。

如果您有一個以上的客戶端累計運作一致高於要求速率，用戶端目前在內部設定為9的預設重試計數可能不足;在此情況下，用戶端會將 狀態代碼為 429 的 CosmosHttpResponseError 擲回給應用程式。將組態傳遞 retry_total 至用戶端，即可變更預設重試計數。根據預設，如果要求繼續運作高於要求速率， 則狀態代碼為 429 的 CosmosHttpResponseError 會在累積等候時間 30 秒之後傳回。即使目前的重試計數小於最大重試計數 (預設值 9 或使用者定義的值)，也會發生這種情況。

雖然自動重試行為有助於改善大部分應用程式的恢復功能和可用性，但是在進行效能基準測試時可能會有所歧異 (尤其是在測量延遲時)。如果實驗達到伺服器節流並導致用戶端 SDK 以無訊息模式重試，則用戶端觀察到的延遲將會突然增加。若要避免效能實驗期間的延遲尖峰，測量每個作業所傳回的費用，並確保要求是以低於保留要求速率的方式運作。如需詳細資訊，請參閱要求單位。

輸送量較高之少量文件的設計

指定之作業的要求費用 (要求處理成本) 與文件大小直接相互關聯。大型文件的作業成本高於小型文件的作業成本。在理想情況下，架構應用程式和工作流程時，請讓項目大小約為 1KB 或類似的順序或大小。對於注重延遲的應用程式，請避免大型項目，因為好幾 MB 的文件會造成應用程式變慢。

下一步

若要深入了解如何針對規模和高效能設計您的應用程式，請參閱 Azure Cosmos DB 的資料分割與調整規模。

正在嘗試為遷移至 Azure Cosmos DB 進行容量規劃嗎？您可以使用現有資料庫叢集的相關資訊進行容量規劃。

如果您知道現有資料庫叢集中的虛擬核心和伺服器數目，請參閱使用虛擬核心或 vCPU 來估計要求單位
如果您知道目前資料庫工作負載的一般要求率，請參閱使用 Azure Cosmos DB 容量規劃工具來估計要求單位

分享方式：

Azure Cosmos DB Python SDK 的效能秘訣

網路

SDK 使用方式

查詢作業

編製索引原則

輸送量

下一步

意見反映

更多資源