Советы по производительности для пакета SDK java для синхронизации Azure Cosmos DB версии 2

Применяется к: ✅ NoSQL

Это важно

Это не последняя версия пакета SDK для Java для Azure Cosmos DB! Вы должны обновить проект до пакета SDK Java для Azure Cosmos DB версии 4 , а затем ознакомиться с руководством по производительности пакета SDK java для Azure Cosmos DB версии 4. Следуйте инструкциям, приведенным в руководстве по миграции на Azure Cosmos DB Java SDK v4 и в руководстве по Reactor vs RxJava, для обновления.

Эти советы по производительности предназначены только для пакета SDK для Java для синхронизации Azure Cosmos DB версии 2. Дополнительные сведения см. в репозитории Maven .

Это важно

29 февраля 2024 г. пакет SDK для Java для синхронизации Azure Cosmos DB версии 2.x будет прекращен; пакет SDK и все приложения, использующие пакет SDK, будут продолжать функционировать; Azure Cosmos DB просто перестанет предоставлять дальнейшее обслуживание и поддержку этого пакета SDK. Для перехода на Azure Cosmos DB с пакетом SDK для Java версии 4 рекомендуется следовать инструкциям, приведенным выше.

Azure Cosmos DB — быстрая и гибкая распределенная база данных, которая легко масштабируется с гарантированной задержкой и пропускной способностью. Для масштабирования базы данных с помощью Azure Cosmos DB не нужно вносить в архитектуру существенные изменения или писать сложный код. Для увеличения или уменьшения масштаба достаточно выполнить один вызов API. Дополнительные сведения см. в статье о подготовке пропускной способности контейнера или подготовке пропускной способности базы данных. Тем не менее, так как доступ к Azure Cosmos DB осуществляется через сетевые вызовы, существуют клиентские оптимизации, которые можно сделать для достижения максимальной производительности при использовании пакета SDK Java для синхронизации Azure Cosmos DB версии 2.

Поэтому, если вы хотите повысить производительность базы данных, рассмотрите следующие варианты:

Нетворкинг

Режим подключения: использование DirectHttps

Как клиент подключается к Azure Cosmos DB, имеет важные последствия для производительности, особенно с точки зрения наблюдаемой задержки на стороне клиента. Существует один ключевой параметр конфигурации, доступный для настройки параметра конфигурации клиента ConnectionPolicy — ConnectionMode. Доступны два режима ConnectionModes:
1. Шлюз (по умолчанию)
2. DirectHttps
  
  Режим шлюза поддерживается на всех платформах SDK и настроен по умолчанию. Если приложение работает в корпоративной сети с строгими ограничениями брандмауэра, шлюз лучше всего подходит, так как он использует стандартный порт HTTPS и одну конечную точку. Однако компромисс производительности заключается в том, что режим шлюза включает дополнительный сетевой прыжк каждый раз, когда данные считываются или записываются в Azure Cosmos DB. Из-за этого режим DirectHttps обеспечивает лучшую производительность из-за меньшего количества сетевых прыжков.
  
  Пакет SDK Java для синхронизации Azure Cosmos DB версии 2 использует HTTPS в качестве транспортного протокола. HTTPS использует TLS для начальной проверки подлинности и шифрования трафика. При использовании пакета SDK Java для синхронизации Azure Cosmos DB версии 2 необходимо открыть только порт HTTPS 443.
  
  ConnectionMode настраивается при создании экземпляра DocumentClient с параметром ConnectionPolicy.
Синхронизация пакета SDK Java версии 2 (Maven com.microsoft.azure::azure-documentdb)
```
public ConnectionPolicy getConnectionPolicy() {
  ConnectionPolicy policy = new ConnectionPolicy();
  policy.setConnectionMode(ConnectionMode.DirectHttps);
  policy.setMaxPoolSize(1000);
  return policy;
}

ConnectionPolicy connectionPolicy = new ConnectionPolicy();
DocumentClient client = new DocumentClient(HOST, MASTER_KEY, connectionPolicy, null);
```
Повышение производительности за счет размещения клиентов в одном регионе Azure

Если это возможно, размещайте приложения, выполняющие вызовы к Azure Cosmos DB, в том же регионе, в котором находится база данных Azure Cosmos DB. Для приблизительного сравнения: вызовы к Azure Cosmos DB в пределах региона выполняются в течение 1–2 мс, но задержка между Восточным и Западным побережьем США превышает 50 мс. Значение задержки может отличаться в зависимости от выбранного маршрута при передаче запроса от клиента к границе центра обработки данных Azure. Минимальная возможная задержка достигается при размещении клиентского приложения в том же регионе Azure, в котором предоставляется конечная точка Azure Cosmos DB. Список доступных регионов см. на странице Регионы Azure.

Использование пакета SDK

Установка последней версии пакета SDK

Пакеты SDK для Azure Cosmos DB постоянно улучшаются, чтобы обеспечивать самую высокую производительность. Чтобы узнать о последних улучшениях пакета SDK, посетите Azure Cosmos DB SDK.
Использование одного и того же клиента Azure Cosmos DB в течение всего жизненного цикла приложения

Каждый экземпляр DocumentClient является потокобезопасным и выполняет эффективное управление подключениями и кэширование адресов при работе в режиме direct. Чтобы обеспечить эффективное управление подключениями и повысить производительность DocumentClient, рекомендуется использовать один экземпляр DocumentClient для каждого приложения в течение всего времени существования приложения.
Увеличьте MaxPoolSize для каждого хоста при использовании режима шлюза

Запросы Azure Cosmos DB выполняются по протоколу HTTPS/REST при использовании режима шлюза и подвергаются ограничению подключения по умолчанию на имя узла или IP-адрес. Возможно, потребуется задать значение MaxPoolSize (200–1000), чтобы клиентская библиотека может использовать несколько одновременных подключений к Azure Cosmos DB. В пакете SDK Java для синхронизации Azure Cosmos DB версии 2 значение по умолчанию для ConnectionPolicy.getMaxPoolSize равно 100. Чтобы изменить значение, используйте setMaxPoolSize .
Настройка параллельных запросов для секционированных коллекций

Пакет Java SDK для Azure Cosmos DB версии 1.9.0 и выше поддерживает параллельные запросы, которые позволяют выполнять запросы к секционированной коллекции параллельно. Дополнительные сведения см. в примерах кода , связанных с работой с пакетами SDK. Параллельные запросы предназначены для повышения задержки запросов и пропускной способности по сравнению с их последовательным аналогом.

(a) Настройка setMaxDegreeOfParallelism: параллельные запросы работают путем параллельного запроса нескольких секций. Однако данные из коллекции с разделением извлекаются последовательно по отношению к запросу. Таким образом, используйте setMaxDegreeOfParallelism , чтобы задать количество секций с максимальной вероятностью достижения наиболее эффективного запроса, если все остальные системные условия остаются неизменными. Если вы не знаете количество секций, можно использовать setMaxDegreeOfParallelism для задания большого числа, а система выбирает минимальное (число секций, предоставленных пользователем входных данных) в качестве максимальной степени параллелизма.

Важно отметить, что параллельные запросы обеспечивают наилучшие преимущества, если данные равномерно распределяются по всем секциям в отношении запроса. Если разделенная коллекция разделена таким образом, что все или большинство данных, возвращаемых запросом, сосредоточены в нескольких разделах (в худшем случае в одном разделе), то производительность запроса будет ограничена этими разделами.

(b) Настройка setMaxBufferedItemCount: параллельный запрос предназначен для предварительного получения результатов, пока текущий пакет результатов обрабатывается клиентом. Предварительная выборка помогает уменьшить общую задержку запроса. setMaxBufferedItemCount ограничивает количество предварительно подготовленных результатов. Задав параметр setMaxBufferedItemCount ожидаемому количеству возвращаемых результатов (или более высокому числу), это позволяет запросу получить максимальное преимущество от предварительной выборки.

Предварительная выборка работает одинаково, независимо от MaxDegreeOfParallelism, и существует один буфер для данных из всех разделов.
Реализация отката в интервалах getRetryAfterInMilliseconds

Во время тестирования производительности необходимо увеличивать нагрузку до тех пор, пока небольшая часть запросов не начнет ограничиваться. Если происходит ограничение, клиентское приложение должно уменьшить активность в соответствии с заданным сервером интервалом повторных попыток. Учитывая обратный выход, вы гарантируете, что вы тратите минимальное время ожидания между повторными попытками. Поддержка политики повторных попыток включена в пакет SDK для Java для синхронизации Azure Cosmos DB версии 1.8.0 и выше. Дополнительные сведения см. в разделе getRetryAfterInMilliseconds.
Горизонтальное увеличение масштаба рабочей нагрузки клиента

Если вы тестируете на высоком уровне пропускной способности (>50 000 ЕЗ/с), клиентское приложение может стать узким местом из-за ограничения компьютера на загрузку ЦП или сети. Если вы достигли этой точки, то можете повысить производительность Azure Cosmos DB, развернув клиентские приложения на нескольких серверах.
Использование адресации на основе имен

Используйте адресацию на основе имен, где ссылки имеют формат dbs/MyDatabaseId/colls/MyCollectionId/docs/MyDocumentId, а не SelfLinks (_self), которые имеют формат dbs/<database_rid>/colls/<collection_rid>/docs/<document_rid> , чтобы избежать извлечения ResourceId всех ресурсов, используемых для создания ссылки. Кроме того, так как эти ресурсы создаются повторно (возможно, с тем же именем), кэширование этих ресурсов может не помочь.
Настройка размера страницы для повышения производительности запросов и лент чтения

При выполнении массового чтения документов с помощью функциональности потока чтения (например, readDocuments) или при выполнении SQL-запроса результаты возвращаются сегментировано, если результирующий набор слишком велик. По умолчанию результаты возвращаются в блоках из 100 элементов или 1 МБ, в зависимости от того, какой предел будет достигнут в первую очередь.

Чтобы уменьшить количество сетевых обходов, необходимых для получения всех применимых результатов, можно увеличить размер страницы с помощью заголовка запроса x-ms-max-item-count до 1000. В случаях, когда необходимо отобразить только несколько результатов, например, если пользовательский интерфейс или API приложения возвращает только 10 результатов за раз, можно также уменьшить размер страницы до 10, чтобы уменьшить пропускную способность, потребляемую для операций чтения и запросов.

Вы также можете задать размер страницы с помощью метода setPageSize.

Политика индексирования

Исключите неиспользуемые пути из индексирования, чтобы ускорить выполнение операций записи

Политика индексирования Azure Cosmos DB позволяет указать пути к документам для включения или исключения из индексирования с помощью путей индексирования (setIncludedPaths и setExcludedPaths). Возможность управления путями индексирования позволяет оптимизировать производительность записи и снизить затраты на хранение индекса для сценариев с заранее определенными шаблонами запросов. Это связано с тем, что затраты на индексирование непосредственно зависят от количества уникальных путей индексирования. Например, в следующем коде показано, как исключить весь раздел (поддерев) документов из индексирования с помощью подстановочного знака "*".

Синхронизация пакета SDK Java версии 2 (Maven com.microsoft.azure::azure-documentdb)
```
Index numberIndex = Index.Range(DataType.Number);
numberIndex.set("precision", -1);
indexes.add(numberIndex);
includedPath.setIndexes(indexes);
includedPaths.add(includedPath);
indexingPolicy.setIncludedPaths(includedPaths);
collectionDefinition.setIndexingPolicy(indexingPolicy);
```
Дополнительные сведения см. в статье Политики индексации Azure Cosmos DB.

Пропускная способность

Измерение и настройка для снижения использования единиц запроса в секунду

Azure Cosmos DB предоставляет обширный набор операций с документами в коллекции базы данных, в том числе реляционные и иерархические запросы с использованием UDF, хранимых процедур и триггеров. Затраты, связанные с каждой из этих операций, зависят от типа процессора, операций ввода-вывода и памяти, необходимой для завершения операции. Вместо того чтобы думать о закупке и управлении аппаратными ресурсами, вы можете думать о единице запроса (RU) как единой меры для ресурсов, необходимых для выполнения различных операций с базами данных и обслуживания запросов приложений.

Пропускная способность выделяется на основе количества единиц запроса, заданного для каждого контейнера. Удельный расход единиц запросов оценивается в расчете на одну секунду. Частота запросов для приложений, у которых она превышает подготовленные единицы запросов для контейнера, будет ограничена, пока она не упадет ниже зарезервированного для контейнера уровня. Если приложению требуется более высокий уровень пропускной способности, можно увеличить ее путем выделения дополнительных единиц запросов.

Сложность запроса влияет на количество единиц запроса, потребляемых операцией. Количество и характер предикатов, количество UDF, размер набора исходных данных — все это влияет на затраты на операции запроса.

Чтобы измерить затраты на любую операцию (создание, обновление или удаление), проверьте заголовок x-ms-request-charge (или эквивалентное свойство RequestCharge в ResourceResponse T< или FeedResponse><T>, чтобы измерить количество единиц запросов, потребляемых этими операциями.

Синхронизация пакета SDK Java версии 2 (Maven com.microsoft.azure::azure-documentdb)
```
ResourceResponse<Document> response = client.createDocument(collectionLink, documentDefinition, null, false);

response.getRequestCharge();
```
Стоимость запроса, указанная в этом заголовке, составляет долю от вашей выделенной пропускной способности. Например, если у вас подготовлено 2000 RU/с, и предыдущий запрос возвращает 1000 документов по 1 КБ, стоимость операции составляет 1000. Таким образом, перед ограничением частоты выполнения последующих запросов сервер за одну секунду выполняет только два таких запроса. Чтобы узнать больше, ознакомьтесь с единицами запроса и калькулятором единиц запроса.
Обработка ограничения скорости / слишком высокая частота запросов

Выполнение запроса, который превышает лимит зарезервированной пропускной способности для учетной записи, не приводит к снижению производительности сервера, так как пользователь не сможет превысить это зарезервированное значение. Сервер заранее завершит запрос с ошибкой RequestRateTooLarge (код состояния HTTP: 429) и вернет заголовок x-ms-retry-after-ms, индиицирующий время (в миллисекундах), которое пользователь должен подождать, прежде чем повторно попытаться выполнить этот запрос.
```
    HTTP Status 429,
    Status Line: RequestRateTooLarge
    x-ms-retry-after-ms :100
```
Все пакеты SDK автоматически перехватывают этот ответ, соблюдают указанный сервером заголовок retry-after и повторяют запрос. Если к вашей учетной записи параллельно имеет доступ только один клиент, следующая попытка будет успешной.

Если у вас более одного клиента, постоянно превышающего скорость запросов, количество повторных попыток по умолчанию, равное 9 внутри клиента, может оказаться недостаточным; в этом случае клиент выбрасывает DocumentClientException с кодом состояния 429 приложению. Число повторных попыток по умолчанию можно изменить с помощью setRetryOptions в экземпляре ConnectionPolicy . По умолчанию, DocumentClientException с кодом состояния 429 возвращается после суммарного времени ожидания в 30 секунд, если запрос продолжает превышать установленную квоту запросов. Это происходит, даже если текущее значение количества повторных попыток (по умолчанию (9) или определенное пользователем) меньше максимального значения.

Хотя автоматическое повторное выполнение запроса помогает улучшить устойчивость и удобство использования большинства приложений, оно может встать в противоречие при проведении тестов производительности, особенно при измерении задержек. Если эксперимент достигает ограничения сервера и заставляет клиентский SDK повторять попытки в тихом режиме, на стороне клиента могут возникать пиковые задержки. Чтобы избежать скачков латентности во время экспериментов с производительностью, измерьте затраты каждой операции и убедитесь, что запросы работают ниже зарезервированной скорости запросов. Дополнительные сведения см. в статье Единицы запросов.
Использование меньших документов для более высокой пропускной способности

Стоимость запроса (плата за обработку запроса) для каждой операции напрямую зависит от размера документа. Операции с большими документами стоят больше, чем операции с маленькими документами.

Дальнейшие шаги

Дополнительные сведения о создании приложения с высокой масштабируемостью и производительностью см. в статье Partitioning and scaling in Azure Cosmos DB (Секционирование и масштабирование в Azure Cosmos DB).

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2025-12-19

Поделиться через

Советы по производительности для пакета SDK java для синхронизации Azure Cosmos DB версии 2

Нетворкинг

Синхронизация пакета SDK Java версии 2 (Maven com.microsoft.azure::azure-documentdb)

Использование пакета SDK

Политика индексирования

Синхронизация пакета SDK Java версии 2 (Maven com.microsoft.azure::azure-documentdb)

Пропускная способность

Синхронизация пакета SDK Java версии 2 (Maven com.microsoft.azure::azure-documentdb)

Дальнейшие шаги

Обратная связь

Дополнительные ресурсы