Azure Cosmos DB Async Java SDK v2 的效能提示

適用於: ✅ NoSQL

這很重要

這不是 Azure Cosmos DB 最新的 Java SDK。你應該先升級專案到 Azure Cosmos DB Java SDK v4 ，然後閱讀 Azure Cosmos DB Java SDK v4 效能提示指南。請依照 Migrate to Azure Cosmos DB Java SDK v4 指南和 Reactor 與 RxJava 指南中的指示升級。

本文的效能提示僅針對 Azure Cosmos DB Async Java SDK v2。更多資訊請參閱 Azure Cosmos DB Async Java SDK v2 發布說明、 Maven 倉庫及 Azure Cosmos DB Async Java SDK v2 故障排除指南。

這很重要

2024 年 8 月 31 日，Azure Cosmos DB Async Java SDK v2.x 將正式退休;SDK 及所有使用 SDK 的應用程式 都將持續運作;Azure Cosmos DB 將停止為此 SDK 提供進一步的維護與支援。我們建議依照上述指示移轉至 Azure Cosmos DB Java SDK v4。

Azure Cosmos DB 是一個既快速又彈性的分散式資料庫，可在獲得延遲與輸送量保證的情況下順暢地調整。使用 Azure Cosmos DB 時，您不須進行主要的架構變更，或是撰寫複雜的程式碼來調整您的資料庫。擴展和縮減就像進行單一 API 呼叫或 SDK 方法呼叫那麼簡單。不過，由於 Azure Cosmos DB 是透過網路呼叫存取，使用 Azure Cosmos DB Async Java SDK v2 時，客戶端可以做一些優化來達到最高效能。

因此，如果您是問：「如何改善資料庫效能？」，請考慮下列選項：

網路

連線模式：使用直接模式

客戶端如何連接 Azure Cosmos DB，對效能有重要影響，尤其是在用戶端延遲方面。 ConnectionMode 是用於設定用戶端 ConnectionPolicy 的關鍵設定。對於 Azure Cosmos DB Async Java SDK v2，可用的兩種 ConnectionMode 如下：
- 閘道器（預設）
- 直接
閘道模式在所有 SDK 平台上都支援，且預設為設定選項。如果你的應用程式在企業網路中運行，且有嚴格防火牆限制，閘道模式是最佳選擇，因為它使用標準 HTTPS 埠和單一端點。然而，其效能取捨在於，閘道模式在每次讀取或寫入 Azure Cosmos DB 資料時，都會多出一次網路躍點。因此，直接模式因網路跳數較少而提供較佳的效能。

ConnectionMode 會在建構 DocumentClient 實例時以 ConnectionPolicy 參數設定。

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）

    public ConnectionPolicy getConnectionPolicy() {
        ConnectionPolicy policy = new ConnectionPolicy();
        policy.setConnectionMode(ConnectionMode.Direct);
        policy.setMaxPoolSize(1000);
        return policy;
    }

    ConnectionPolicy connectionPolicy = new ConnectionPolicy();
    DocumentClient client = new DocumentClient(HOST, MASTER_KEY, connectionPolicy, null);

為了效能在相同 Azure 區域中共置用戶端

可能的話，請將任何呼叫 Azure Cosmos DB 的應用程式放在與 Azure Cosmos DB 資料庫相同的區域中。以約略的比較來說，在相同區域內對 Azure Cosmos DB 進行的呼叫會在 1-2 毫秒內完成，但美國西岸和美國東岸之間的延遲則會 >50 毫秒。要求的延遲可能會有所不同，這取決於每次要求從用戶端傳送到 Azure 資料中心邊界時所採用的路由。確保呼叫端應用程式與佈建的 Azure Cosmos DB 端點位於相同的 Azure 區域中，將可能達到最低的延遲。如需可用區域的清單，請參閱 Azure 區域。

SDK 使用

安裝最新的 SDK

Azure Cosmos DB SDK 會持續改善以提供最佳效能。請參閱 Azure Cosmos DB 非同步 Java SDK v2 版本說明頁面，了解最新的 SDK 並檢視改進內容。
在應用程式存留期內使用單一 Azure Cosmos DB 用戶端

每個 AsyncDocumentClient 實例皆為執行緒安全，並執行高效的連線管理與位址快取。為了讓 AsyncDocumentClient 能更有效率地管理連線並提升效能，建議在應用程式的整個生命週期內，每個 AppDomain 使用單一 AsyncDocumentClient 實例。

調校連線策略

預設情況下，Azure Cosmos DB 直接模式的請求是透過 TCP 進行，當使用 Azure Cosmos DB Async Java SDK v2 時。 SDK 內部採用特殊的 Direct 模式架構，動態管理網路資源並獲得最佳效能。

在 Azure Cosmos DB Async Java SDK v2 中，直接模式是提升大多數工作負載資料庫效能的最佳選擇。

直接模式概述

直接模式架構的示意圖

直接模式下採用的用戶端架構，使網路利用率可預測，並能多工存取 Azure Cosmos DB 副本。上方的圖示展示了 Direct 模式如何將客戶端請求路由到 Azure Cosmos DB 後端的副本。直接模式架構在客戶端每個資料庫副本上最多分配 10 個通道。通道是一種 TCP 連線，前有一個請求緩衝區，該緩衝區深度為 30 個請求。屬於副本的通道會根據副本的 服務端點根據需要動態分配。當使用者以直接模式發出請求時， TransportClient 會根據分割鍵將請求路由至適當的服務端點。 請求佇列會將請求緩衝在服務端點之前。

ConnectionPolicy 直接模式的設定選項

第一步，請使用以下建議的設定。如果你在這個特定主題上遇到問題，請聯絡 Azure Cosmos 資料庫團隊。

如果你使用 Azure Cosmos DB 作為參考資料庫（也就是說，資料庫用於許多點讀取操作，少數寫入操作），將 idleEndpointTimeout 設為 0（即不逾時）可能是可以接受的。

組態選項	預設
緩衝頁面大小	8192
連線超時時間	「PT1M」
idleChannelTimeout	「PT0S」
idleEndpointTimeout	「PT1M10S」
最大緩衝容量	8388608
maxChannelsPerEndpoint	10
每通道最大請求數	30
receiveHangDetectionTime	「PT1M5S」
requestExpiryInterval	「PT5S」
requestTimeout	「PT1M」
requestTimerResolution	「PT0.5S」
sendHangDetectionTime	「PT10S」
shutdownTimeout	「PT15S」

直行模式的程式設計技巧

參考 Azure Cosmos DB 非同步 Java SDK v2 故障排除文章，作為解決 SDK 問題的基準。

使用直接模式時，有一些重要的程式設計技巧：
- 在應用程式中使用多執行緒以促進高效的 TCP 資料傳輸 ——在提出請求後，應用程式應該訂閱接收另一執行緒的資料。若未這麼做，將會導致非預期的「半雙工」作業，後續要求會被封鎖並等待前一個要求的回應。
- 在專用執行緒上執行計算密集型工作負載 ——出於與前述建議類似的原因，像是複雜資料處理這類操作最好放在獨立執行緒中。若請求從其他資料儲存庫拉取資料（例如執行緒同時使用 Azure Cosmos DB 與 Spark 資料儲存庫）可能會增加延遲，建議再產生一個執行緒等待該資料庫回應。
  - Azure Cosmos DB Async Java SDK v2 中的底層網路 IO 由 Netty 管理。請參考這些避免阻塞 Netty IO 執行緒的程式碼模式的建議。
- 資料建模 - Azure Cosmos 資料庫 SLA 假設文件大小小於 1 KB。優化資料模型與程式設計以偏好較小的文件大小，通常能降低延遲。如果你需要儲存和檢索超過 1 KB 的文件，建議做法是將文件連結到 Azure Blob Storage 的資料。
調整分割集合的並行查詢

Azure Cosmos DB Async Java SDK v2 支援平行查詢，讓你能平行查詢分割後的集合。欲了解更多資訊，請參閱與 SDK 相關的程式碼範例。平行查詢的設計目的是相較於序列查詢，提升查詢延遲與吞吐量。
- 調整 setMaxDegreeOfParallelism：
  
  平行查詢的運作方式是同時查詢多個分區。然而，來自單一分割集合的資料會依查詢順序序列擷取。因此，請使用 setMaxDegreeOfParallelism 來設定在其他系統條件皆相同的情況下，最有機會達成最佳查詢效能的分割區數量。如果你不知道分割的數量，可以使用 setMaxDegreeOfParallelism 設定一個較高的數值，系統會選擇最小值（分割數量、使用者輸入）作為最大平行度數。
  
  請務必注意，只有在資料相對於查詢均勻分散於所有分割區時，平行查詢才能發揮最佳效益。如果分割後的集合被分割成查詢回傳的所有或大部分資料集中在幾個分割區（最壞情況下只有一個分割區），那麼查詢的效能將會被這些分割區限制。
- 調整 MaxBufferedItemCount 設定：
  
  平行查詢的設計目的是在用戶端處理目前批次的結果時預先擷取結果。預先擷取有助於改善查詢的整體延遲。 setMaxBufferedItemCount 限制預先取得的結果數量。將 setMaxBufferedItemCount 設定為預期回傳結果數（或更高數字），使查詢能從預取中獲得最大效益。
  
  預取的運作方式與 MaxDegreeOfParallelism 無關，且所有分割區的資料皆有一個緩衝區。
在 getRetryAfterInMilliseconds 間隔實作退避

在效能測試期間，您應提高負載，直到有少量要求遭到節流。若被限速，客戶端應用程式應在伺服器指定的重試間隔內退後。遵循退避可確保在重試之間等待的時間最短。
擴增用戶端工作負載

如果您在高輸送量層級 (>50,000 RU/s) 進行測試，用戶端應用程式可能會因為 CPU 或網路使用率達到上限而成為瓶頸。如果到了這一刻，您可以將用戶端應用程式向外延展至多部伺服器，以繼續將 Azure Cosmos DB 帳戶再往前推進一步。
使用基於名稱的位址

請使用以名稱為基礎的定址方式，其連結格式為 dbs/MyDatabaseId/colls/MyCollectionId/docs/MyDocumentId，而非 dbs/<database_rid>/colls/<collection_rid>/docs/<document_rid>，以避免擷取所有用來建構連結之資源的 ResourceId。此外，當這些資源重新建立時 (即使名稱相同)，快取它們也未必有幫助。
調整查詢/閱讀訂閱的頁面大小以提升效能

當使用讀取導向功能（例如 readDocuments）進行大量讀取文件，或發出 SQL 查詢時，若結果集過大，結果會以分段方式回傳。預設情況下，結果會以 100 個項目或 1 MB 為單位回傳，以先達到的限制為準。

為了減少取得所有適用結果所需的網路往返次數，你可以使用 x-ms-max-item-count 請求標頭將頁面大小增加到最多 1000。當你只需要顯示少數結果，例如使用者介面或應用程式 API 每次只回傳 10 個結果時，你也可以將頁面大小縮小到 10，以降低讀取和查詢所消耗的吞吐量。

你也可以使用 setMaxItemCount 方法設定頁面大小。
使用適當排程器 (避免竊取事件迴圈 IO Netty 執行緒)

Azure Cosmos DB Async Java SDK v2 使用 netty 來進行非阻塞 IO。 SDK 會使用固定數目的 IO netty 事件迴圈執行緒 (和您電腦所擁有的 CPU 核心數一樣多) 來執行 IO 作業。 API 所傳回的 Observable 會在其中一個共用的 IO 事件迴圈 Netty 執行緒上發出結果。因此，請切勿封鎖共用的 IO 事件迴圈 netty 執行緒。在 IO 事件迴圈 netty 執行緒上執行 CPU 密集型工作或阻塞操作可能導致死結或大幅降低 SDK 吞吐量。

例如，以下程式碼執行 CPU 密集型運算，處理事件迴圈 IO netty 執行緒：

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）
```
  Observable<ResourceResponse<Document>> createDocObs = asyncDocumentClient.createDocument(
    collectionLink, document, null, true);

  createDocObs.subscribe(
    resourceResponse -> {
      //this is executed on eventloop IO netty thread.
      //the eventloop thread is shared and is meant to return back quickly.
      //
      // DON'T do this on eventloop IO netty thread.
      veryCpuIntensiveWork();
    });
```
結果收到後，如果你想對結果做 CPU 密集型運算，應該避免在事件迴圈 IO netty 執行緒上這麼做。您可以改為提供自己的 Scheduler，讓工作在您自訂的執行緒上執行。

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）
```
  import rx.schedulers;

  Observable<ResourceResponse<Document>> createDocObs = asyncDocumentClient.createDocument(
    collectionLink, document, null, true);

  createDocObs.subscribeOn(Schedulers.computation())
  subscribe(
    resourceResponse -> {
      // this is executed on threads provided by Scheduler.computation()
      // Schedulers.computation() should be used only when:
      //   1. The work is cpu intensive 
      //   2. You are not doing blocking IO, thread sleep, etc. in this thread against other resources.
      veryCpuIntensiveWork();
    });
```
根據你的工作類型，你應該使用現有的 RxJava 排程器來處理你的工作。請閱讀這裡 Schedulers。

欲了解更多資訊，請參閱 Azure Cosmos DB Async Java SDK v2 的 GitHub 頁面。
停用 netty 的記錄

Netty 程式庫的記錄非常冗長，必須將其關閉 (僅在組態中抑制登入可能不足)，以避免額外的 CPU 成本。如果您不是在偵錯模式中，請停用 netty 全部的記錄。所以如果你使用 log4j 來減少由 org.apache.log4j.Category.callAppenders() 與 netty 交互所產生的額外 CPU 成本，請在你的程式碼庫中加入以下行：
```
org.apache.log4j.Logger.getLogger("io.netty").setLevel(org.apache.log4j.Level.OFF);
```
OS 開啟檔案資源限制

某些 Linux 系統 (例如 Red Hat) 有開啟檔案數目的上限，因此有連線總數的上限。執行下列命令來檢視目前的限制：
```
ulimit -a
```
開啟的檔案數 (nofile) 需要足夠大，才能容納您所設定的連線集區大小與作業系統的其他開啟檔案。您可以進行修改，以允許較大的連線集區大小。

開啟 limits.conf 檔案：
```
vim /etc/security/limits.conf
```
新增/修改下列幾行：
```
* - nofile 100000
```

索引政策

將未使用的路徑排除於索引編製外以加快寫入速度

Azure Cosmos DB 的編製索引原則可讓您使用編製索引路徑 (setIncludedPaths 和 setExcludedPaths)，指定要在編製索引中包含或排除的文件路徑。在事先知道查詢模式的案例中，使用檢索路徑可改善寫入效能並降低索引儲存空間，因為檢索成本與檢索的唯一路徑數目直接相互關聯。例如，下列程式碼示範如何使用 "*" 萬用字元，將文件的整個區段 (也稱為子樹) 排除於編製索引之外。

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）
```
Index numberIndex = Index.Range(DataType.Number);
numberIndex.set("precision", -1);
indexes.add(numberIndex);
includedPath.setIndexes(indexes);
includedPaths.add(includedPath);
indexingPolicy.setIncludedPaths(includedPaths);
collectionDefinition.setIndexingPolicy(indexingPolicy);
```
如需詳細資訊，請參閱 Azure Cosmos DB 索引編製原則。

Throughput

衡量和調整以降低請求單位每秒的使用量

Azure Cosmos DB 提供許多的資料庫作業，包括使用 UDF、預存程序和觸發程序進行關聯式和階層式查詢，而這些作業全都是對資料庫集合內的文件來進行。與上述各項作業相關聯的成本，會因為完成作業所需的 CPU、IO 和記憶體而不同。您不需要考慮和管理硬體資源，您可以將要求單位 (RU) 想成是執行各種資料庫作業以及服務應用程式要求時所需的資源數量。

輸送量是根據為每個容器所設定的要求單位數量來佈建。要求單位消耗量是以每秒的速率來計算。如果應用程式的速率超過為其容器佈建的要求單位速率，便會受到限制，直到該速率降到容器的佈建層級以下。如果您的應用程式需要較高的輸送量，您可以藉由佈建其他的要求單位來增加輸送量。

查詢的複雜度會影響操作所耗用的請求單位數量。述詞數目、述詞性質、UDF 數目，以及來源資料集的大小，全都會影響查詢作業的成本。

若要測量任何作業 (建立、更新或刪除) 的額外負荷，請檢查 x-ms-request-charge 標頭，來測量這些作業所耗用的要求單位數量。您也可以查看 ResourceResponse<T> 或 FeedResponse<T> 中的對等 RequestCharge 屬性。

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）
```
ResourceResponse<Document> response = asyncClient.createDocument(collectionLink, documentDefinition, null,
                                                 false).toBlocking.single();
response.getRequestCharge();
```
在此標頭中傳回的要求費用是佈建輸送量的一小部分。例如，若配置了 2000 RU/s，且前一查詢回傳 1,000 份 1 KB 文件，則操作成本為 1000。因此在一秒內，伺服器在對後續要求進行速率限制前，只會接受兩個這類要求。如需詳細資訊，請參閱要求單位和要求單位計算機。
處理速率限制/要求速率太大

當用戶端嘗試超過帳戶保留的輸送量時，伺服器的效能不會降低，而且不會使用超過保留層級的輸送量容量。伺服器將預先使用 RequestRateTooLarge (HTTP 狀態碼 429) 來結束要求，並傳回 x-ms-retry-after-ms 標頭，以指出使用者重試要求之前必須等候的時間量 (毫秒)。
```
HTTP Status 429,
Status Line: RequestRateTooLarge
x-ms-retry-after-ms :100
```
SDK 全都隱含地攔截這個回應，採用伺服器指定的 retry-after 標頭，並重試此要求。除非有多個用戶端同時存取您的帳戶，否則下次重試將會成功。

如果你有多個用戶端累積運作穩定高於請求速率，用戶端內部預設的重試次數為 9 可能不足;此時，用戶端會拋出狀態碼為 429 的 DocumentClientException 給應用程式。預設的重試次數可以透過 ConnectionPolicy 實例上的 setRetryOptions 來更改。預設情況下，若請求持續超過請求速率，則在累積等待 30 秒後，狀態碼為 429 的 DocumentClientException 會被回傳。即使目前的重試計數小於最大重試計數 (預設值 9 或使用者定義的值)，也會發生這種情況。

雖然自動重試行為有助於改善大部分應用程式的恢復功能和可用性，但是在進行效能基準測試時可能會有所歧異 (尤其是在測量延遲時)。如果實驗達到伺服器節流並導致用戶端 SDK 以無訊息模式重試，則用戶端觀察到的延遲將會突然增加。若要避免效能實驗期間的延遲尖峰，測量每個作業所傳回的費用，並確保要求是以低於保留要求速率的方式運作。如需詳細資訊，請參閱要求單位。
輸送量較高之少量文件的設計

指定之作業的要求費用 (要求處理成本) 與文件大小直接相互關聯。大型文件的作業成本高於小型文件的作業成本。

後續步驟

若要深入了解如何針對規模和高效能設計您的應用程式，請參閱 Azure Cosmos DB 的資料分割與調整規模。

意見反應

此頁面對您有幫助嗎？

Last updated on 2025-12-29

共用方式為

Azure Cosmos DB Async Java SDK v2 的效能提示

網路

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）

SDK 使用

索引政策

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）

Throughput

Async Java SDK V2 （Maven com.microsoft.azure：：azure-cosmosdb）

後續步驟

意見反應

其他資源