Azure Cosmos DB for NoSQL Java v4 SDK 要求タイムアウト例外の診断とトラブルシューティング

適用対象: ✅ NoSQL

HTTP 408 エラーは、タイムアウト制限に達する前にソフトウェア開発キット (SDK) が要求を完了できなかった場合に発生します。

トラブルシューティングの手順

要求タイムアウト例外の既知の原因と解決方法を次に示します。

エンドツーエンドのタイムアウトポリシー

ここでは、すべてのプリエンプティブソリューションが実装されている場合でも、408 のネットワークタイムアウトエラーが発生するシナリオがあります。末尾の待機時間を短縮し、これらのシナリオでの可用性を向上させる一般的なベストプラクティスは、エンドツーエンドのタイムアウトポリシーを実装することです。末尾の待機時間は、障害が速くなることで短縮され、タイムアウト後に再試行を停止することで要求ユニットとクライアント側のコンピューティングコストが削減されます。タイムアウト期間は、 CosmosItemRequestOptionsに設定できます。その後、オプションは、Azure Cosmos DB for NoSQL に送信されるすべての要求に渡すことができます。

CosmosEndToEndOperationLatencyPolicyConfig endToEndOperationLatencyPolicyConfig = new CosmosEndToEndOperationLatencyPolicyConfigBuilder(Duration.ofSeconds(1)).build();

CosmosItemRequestOptions options = new CosmosItemRequestOptions();
options.setCosmosEndToEndOperationLatencyPolicyConfig(endToEndOperationLatencyPolicyConfig);

container.readItem("id", new PartitionKey("pk"), options, TestObject.class);

既存の問題

要求が長時間停止したり、タイムアウトが頻繁に発生したりする場合は、Java v4 SDK を最新バージョンにアップグレードしてください。注: バージョン 4.18.0 以降を使用することを強くお勧めします。詳細については、 Java v4 SDK のリリースノートを参照してください。

高い CPU 使用率

高い CPU 使用率は最も一般的なケースです。最適な待機時間を実現するには、CPU 使用率は 40% ほどである必要があります。 CPU 使用率の (平均ではなく) 最大値を監視するには、間隔として 10 秒を使用します。 CPU スパイクは、1 つのクエリに対して複数の接続を実行する可能性があるクロスパーティションクエリでは、より一般的です。

ソリューション

SDK を使用するクライアントアプリケーションをスケールアップまたはスケールアウトする必要があります。

接続の調整

接続の調整は、ホストコンピューターの接続制限または Azure ソースネットワークアドレス変換 (SNAT) ポートの枯渇が原因で発生する可能性があります。

ホストコンピューターの接続制限

Red Hat などの一部の Linux システムでは、開いているファイルの合計数に上限があります。 Linux のソケットはファイルとして実装されるため、この数によって接続の合計数も制限されます。次のコマンドを実行します。

ulimit -a

ソリューション

nofileとして識別される最大許容オープンファイルの数は、少なくとも 10,000 以上である必要があります。詳細については、Azure Cosmos DB for NoSQL Java SDK v4 のパフォーマンスに関するヒントを参照してください。

ソケットまたはポートの可用性が低下している可能性がある

ソリューションが Azure で実行されている場合、Java SDK を使用するクライアントが Azure SNAT ポート不足に達する可能性があります。

解決策 1

Azure VM で実行している場合は、SNAT ポートの枯渇に関するガイドを参照してください。

解決策 2

Azure App Service で実行している場合は、接続エラーのトラブルシューティングのガイドに従って、App Service の診断を利用してください。

解決策 3

Azure Functions で実行している場合は、必要なすべてのサービス (Azure Cosmos DB for NoSQL を含む) に対して、シングルトンクライアントまたは静的クライアントを管理するという Azure Functions の推奨事項に従っていることを確認します。関数アプリのホスティングの種類とサイズに基づくサービスの制限を確認します。

解決策 4

HTTP プロキシを使用する場合は、SDK GatewayConnectionConfig で構成されている接続の数をサポートできることを確認します。できない場合、接続の問題が発生します。

複数のクライアントインスタンスの作成

複数のクライアントインスタンスを作成すると、接続の競合とタイムアウトの問題を招くおそれがあります。

解決策 1

パフォーマンスのヒントに従い、アプリケーション全体で 1 つの CosmosClient インスタンスを使用します。

解決策 2

シングルトン CosmosClient をアプリケーションで使用できない場合は、CosmosClient のこの API connectionSharingAcrossClientsEnabled(true) を使用して、複数の Azure Cosmos DB for NoSQL クライアント間で接続共有を使用することをお勧めします。クライアントの複数のインスタンスが複数のアカウントと対話している場合、この設定を有効にすると 、ダイレクト モードでの接続の共有が可能になります。このモードは、Azure Cosmos DB for NoSQL クライアントのインスタンス間で接続共有が可能な場合にのみ有効になります。この共有オプションを設定する場合、最初にインスタンス化されたクライアントの接続構成 (ソケットタイムアウト構成、アイドルタイムアウト構成など) が、他のすべてのクライアントインスタンスに使用されることに注意してください。

ホットパーティションキー

Azure Cosmos DB for NoSQL は、プロビジョニングされたスループット全体を物理パーティション間で均等に分散します。ホットパーティションが存在すると、ある物理パーティション上の 1 つ以上の論理パーティションキーによってその物理パーティションのすべての要求ユニット/秒 (RU/秒) が消費されます。同時に、他の物理パーティション上の RU/秒は未使用のままになります。症状として、使用された RU/s の合計がデータベースまたはコンテナでプロビジョニングされた全体の RU/s よりも少なくなっていますが、ホットな論理パーティションキーに対する要求でスロットリング (429 エラー) が依然として発生します。正規化された RU 消費量メトリックを使用して、ワークロードでホットパーティションが発生しているかどうかを確認します。

ソリューション

要求のボリュームと記憶域を均等に分散する適切なパーティションキーを選択します。パーティションキーの変更方法を参照してください。

同時実行の程度が高い

アプリケーションで高レベルの同時実行が行われています。これにより、チャネル上で競合が発生する可能性があります。

ソリューション

SDK を使用するクライアントアプリケーションをスケールアップまたはスケールアウトする必要があります。

大量の要求または応答

要求数や応答数が増大すると、同時実行の程度が比較的低い場合でも、チャネル上でヘッドオブラインブロッキングが発生し、競合が悪化する可能性があります。

ソリューション

SDK を使用するクライアントアプリケーションをスケールアップまたはスケールアウトする必要があります。

エラー率が Azure Cosmos DB for NoSQL のサービスレベルアグリーメント (SLA) の範囲内にある

アプリケーションでは、一時的なエラーの処理と必要に応じた再試行を実行できる必要があります。パスの作成時にサービスによって項目が作成されたか否かを知ることはできないため、408 例外は再試行されません。作成のために同じ項目を再度送信すると、競合例外が発生します。ユーザーアプリケーションのビジネスロジックに、競合を処理するためのカスタムロジックが含まれている場合があります。これにより、既存の項目のあいまいさが解消されたり、作成の再試行と競合したりすることがあります。

エラー率が Azure Cosmos DB for NoSQL の SLA に違反している

Azure サポートにお問い合わせください。

Azure Cosmos DB for NoSQL Java v4 SDK を使用する場合の問題を診断してトラブルシューティングします。
Java v4 のパフォーマンスガイドラインについて説明します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-27

Azure Cosmos DB for NoSQL Java v4 SDK 要求タイムアウト例外の診断とトラブルシューティング

トラブルシューティングの手順

エンドツーエンドのタイムアウトポリシー

既存の問題

高い CPU 使用率

ソリューション

接続の調整

ホスト コンピューターの接続制限

ソリューション

ソケットまたはポートの可用性が低下している可能性がある

解決策 1

解決策 2

解決策 3

解決策 4

複数のクライアント インスタンスの作成

解決策 1

解決策 2

ホット パーティション キー

ソリューション

同時実行の程度が高い

ソリューション

大量の要求または応答

ソリューション

エラー率が Azure Cosmos DB for NoSQL のサービス レベル アグリーメント (SLA) の範囲内にある

エラー率が Azure Cosmos DB for NoSQL の SLA に違反している

関連するコンテンツ

フィードバック

その他のリソース

ホストコンピューターの接続制限

複数のクライアントインスタンスの作成

ホットパーティションキー

エラー率が Azure Cosmos DB for NoSQL のサービスレベルアグリーメント (SLA) の範囲内にある