Поделиться через


Добавление Azure Cosmos DB CDC в качестве источника в концентраторе реального времени (предварительная версия)

В этой статье описывается, как добавить Azure Cosmos DB для NoSQL Change Data Capture (CDC) в качестве источника событий в Концентраторе реального времени Fabric.

Соединитель источника отслеживания измененных данных Azure Cosmos DB позволяет записать моментальный снимок текущих данных в базе данных Azure Cosmos DB. Затем соединитель отслеживает и записывает любые будущие изменения на уровне строк в эти данные. После записи изменений в потоке можно обрабатывать эти данные CDC в режиме реального времени и отправлять их в разные места назначения в Fabric для дальнейшей обработки или анализа.

Примечание.

Концентратор реального времени в настоящее время находится в предварительной версии.

Необходимые компоненты

  • Доступ к рабочей области Fabric premium с разрешениями участника или более высокого уровня.
  • Доступ к учетной записи и базе данных NoSQL для Azure Cosmos DB.
  • База данных Azure Cosmos DB для NoSQL должна быть общедоступной, а не за брандмауэром или защищенной в виртуальной сети.

Получение сведений о подключении из портал Azure

Метки для элементов, которые необходимо собрать из портал Azure, показаны на следующих шагах. Вам всегда нужен универсальный код ресурса (URI) конечной точки( например https://<account>.<api>.azure.com:<port>/, первичный ключ и идентификаторы элементов базы данных, для которого требуется собирать данные.

Примечание.

Azure Cosmos DB для NoSQL CDC использует последний режим версии канала изменений Azure Cosmos DB. Он фиксирует изменения записей в последней версии. Обратите внимание, что удаления не записываются в этом режиме.

  1. На странице портал Azure учетной записи Azure Cosmos DB выберите "Ключи" в разделе "Параметры" в области навигации слева.

  2. На странице "Ключи" скопируйте URI и значения первичного ключа, которые будут использоваться для настройки подключения к потоку событий.

    Снимок экрана: URI и первичный ключ на странице ключей Azure Cosmos DB в портал Azure.

  3. На странице обзора портал Azure учетной записи Azure Cosmos DB запишите идентификатор базы данных и элемента, для которого требуется собрать данные.

    Снимок экрана: список контейнеров для учетной записи API NoSQL Azure Cosmos DB.

Получение событий из CDC Azure Cosmos DB

События из CDC Azure Cosmos DB можно получить в центре реального времени одним из способов:

Запуск добавления исходного интерфейса

  1. Войдите в Microsoft Fabric.

  2. Выберите концентратор реального времени на левой панели навигации.

  3. На странице центра реального времени выберите +Добавить источник в правом верхнем углу страницы.

    Снимок экрана: запуск концентратора реального времени в Microsoft Fabric.

Используйте инструкции из раздела "Добавление CDC Azure Cosmos DB" в качестве исходного раздела.

Страница источников Майкрософт

  1. В центре реального времени выберите источники Майкрософт.

  2. В раскрывающемся списке "Источник" выберите Azure Cosmos DB (CDC).

  3. Для подписки выберите подписку Azure с группой ресурсов с учетной записью Cosmos DB.

  4. Для группы ресурсов выберите группу ресурсов с учетной записью Cosmos DB.

  5. В регионе выберите расположение, в котором находится Cosmos DB.

  6. Теперь переместите указатель мыши на имя источника CDC Cosmos DB, который требуется подключить к концентратору реального времени в списке баз данных, и нажмите кнопку "Подключить" или нажмите кнопку "Подключить". (многоточие) и нажмите кнопку "Подключить".

    Снимок экрана: страница источников Майкрософт с фильтрами для отображения CdC Cosmos DB и кнопки подключения.

    Чтобы настроить сведения о подключении, используйте действия из раздела "Добавление CDC Azure Cosmos DB" в качестве исходного раздела. Пропустите первый шаг выбора CDC Azure Cosmos DB в качестве исходного типа в мастере добавления источника.

Добавление Azure Cosmos DB CDC в качестве источника

  1. На экране "Выбор источника данных" выберите Azure Cosmos DB (CDC).

    Снимок экрана: страница выбора источника данных с выбранным элементом Azure Cosmos DB (CDC).

  2. Выберите ссылку "Перейти к ресурсу", если вы хотите перейти к учетной записи Azure Cosmos DB в портал Azure.

    Снимок экрана: страница

  3. На странице "Подключение" выберите "Создать подключение".

    Снимок экрана: страница

  4. В разделе параметров подключения укажите конечную точку Cosmos DB. Введите URI или конечную точку для учетной записи Cosmos DB, скопированной из портал Azure.

    Снимок экрана: раздел

  5. Разверните дополнительные параметры и выполните следующие действия.

    1. Для числа повторных попыток укажите максимальное количество раз, когда соединитель должен повторно передавать запрос в базу данных Cosmos DB, если запрос завершается ошибкой, допускаемой восстановлением.

    2. Чтобы включить передачу функции AVERAGE, укажите, должен ли соединитель передавать агрегатную функцию AVG в базу данных Cosmos DB.

    3. Чтобы включить передачу SORT для нескольких столбцов, укажите, должен ли соединитель разрешать передачу нескольких столбцов в базу данных Cosmos DB при указании в предложении ORDER BY запроса SQL.

      Снимок экрана: дополнительные параметры настройки соединителя Azure Cosmos DB.

  6. Прокрутите вниз и в разделе учетных данных подключения выполните следующие действия.

    1. Выберите существующее подключение и сохраните параметр "Создать новое подключение" по умолчанию.
    2. Чтобы создать подключение, введите следующие значения:
      1. В поле "Имя подключения" введите имя подключения.

      2. Для типа проверки подлинности выберите ключ учетной записи.

      3. В поле "Ключ учетной записи" введите значение ключа, сохраненное ранее.

      4. Нажмите Подключиться.

        Снимок экрана: раздел учетных данных подключения на странице

  7. Теперь на странице "Подключение" выполните следующие действия:

    1. Укажите идентификатор контейнера в учетной записи Azure Cosmos DB.

    2. В разделе "Сведения о потоке" справа выберите рабочую область Fabric, в которой вы хотите сохранить поток событий, создаваемый мастером.

    3. Для имени потока событий введите имя потока событий. Мастер создает поток событий с выбранным центром CDC Azure Cosmos DB в качестве источника.

    4. Имя потока автоматически создается путем добавления -stream к имени потока событий. Этот поток отображается на странице " Все потоки данных в реальном времени" при завершении работы мастера.

    5. Выберите Далее.

      Снимок экрана, на котором показана заполненная страница подключения мастера добавления источника.

  8. На экране "Рецензирование" и "Создать" просмотрите сводку и выберите "Создать источник".

    Снимок экрана: заполненный мастер добавления источника и страница создания.

Просмотр сведений о потоке данных

  1. На странице "Проверка и создание" при выборе "Открыть поток событий" мастер открывает поток событий, созданный для вас с выбранным источником CDC Azure Cosmos DB. Чтобы закрыть мастер, нажмите кнопку Закрыть или X* в правом верхнем углу страницы.

    Снимок экрана: страница проверки и создания после успешного создания источника.

  2. В концентраторе реального времени выберите все потоки данных. Чтобы просмотреть новый поток данных, обновите страницу "Все потоки данных".

    Снимок экрана: страница

    Подробные инструкции см. в разделе "Просмотр сведений о потоках данных" в Концентраторе реального времени Fabric.

Дополнительные сведения об использовании потоков данных см. в следующих статьях: