Подключение к Azure Synapse Link для Azure Cosmos DB
В этой статье описывается, как получить доступ к базе данных Azure Cosmos DB из Azure Synapse Analytics Studio с помощью Azure Synapse Link.
Предварительные требования
Перед подключением базы данных Azure Cosmos DB к рабочей области вам потребуется следующее:
- имеющаяся база данных Azure Cosmos DB (можно также создать учетную запись, следуя инструкциям из краткого руководства по управлению учетной записью Azure Cosmos DB);
- имеющаяся рабочая область Azure Synapse (можно также создать рабочую область, следуя инструкциям из краткого руководства по созданию рабочей области Synapse).
Включение Synapse Link для учетной записи базы данных Azure Cosmos DB
Чтобы запустить крупномасштабную аналитику в Azure Cosmos DB без негативных последствий для производительности в рабочей среде, рекомендуем включить Synapse Link для Azure Cosmos DB. Synapse Link предоставляет возможность HTAP для контейнера и встроенную поддержку в Azure Synapse.
Перейдите в Synapse Studio
В рабочей области Azure Synapse выберите Запуск Synapse Studio. На домашней странице Synapse Studio выберите Данные, чтобы перейти в обозреватель объектов данных.
Подключение базы данных Azure Cosmos DB к рабочей области Azure Synapse
База данных Azure Cosmos DB подключается в качестве связанной службы. Связанная служба Azure Cosmos DB позволяет пользователям просматривать и изучать данные, а также считывать и записывать их из Apache Spark для Azure Synapse Analytics или SQL в Azure Cosmos DB.
В обозревателе объектов данных можно напрямую подключиться к базе данных Azure Cosmos DB, выполнив указанные ниже действия.
- Выберите значок + рядом с областью Данные.
- Выберите Connect to external data (Подключение к внешнем данным).
- Выберите API, к которому необходимо подключиться, например API SQL или API для MongoDB.
- Выберите Continue (Продолжить).
- Чтобы присвоить имя связанной службе, используйте понятное имя. Имя появится в обозревателе объектов данных и будет использоваться средами выполнения Azure Synapse для подключения к базе данных и контейнерам.
- Выберите имя учетной записи Azure Cosmos DB и имя базы данных.
- (Необязательно) Если регион не указан, операции среды выполнения Azure Synapse будут направляться в ближайший регион, где включено аналитическое хранилище. Вы также можете вручную задать регион, который пользователи будут использовать для доступа к аналитическому хранилищу Azure Cosmos DB. Выберите Additional connection properties (Дополнительные свойства подключения), а затем — Создать. Для параметра Имя свойства введите PreferredRegions. Задайте значение необходимого региона, например WestUS2. (Между словами и числом нет пробелов.)
- Нажмите кнопку создания.
Базы данных Azure Cosmos DB отображаются на вкладке Связано в разделе Azure Cosmos DB. Azure Cosmos DB позволяет отличить контейнер с поддержкой HTAP от контейнера, поддерживающего только OLTP, по указанным ниже значкам.
Контейнер, поддерживающий только OLTP:
Контейнер с поддержкой HTAP:
Быстрое взаимодействие с созданными кодом действиями
Щелкнув правой кнопкой мыши контейнер, вы получите список жестов, которые активируют среду выполнения Spark или SQL. Запись в контейнер происходит через хранилище транзакций Azure Cosmos DB и приводит к использованию единиц запросов.
Дальнейшие действия
- Узнайте, какие общие возможности поддерживают Azure Synapse и Azure Cosmos DB.
- Настройка частных конечных точек для аналитического хранилища Azure Cosmos DB
- Узнайте, как отправлять запросы в аналитическое хранилище с помощью Spark 3.
- Узнайте, как отправлять запросы в аналитическое хранилище с помощью Spark 2.