Подключение к MongoDB и управление ими в Microsoft Purview

В этой статье описывается, как зарегистрировать MongoDB, а также как проверить подлинность MongoDB и взаимодействовать с ним в Microsoft Purview. Дополнительные сведения о Microsoft Purview см. в вводной статье.

Поддерживаемые возможности

Извлечение метаданных Полная проверка Добавочное сканирование Сканирование с заданной областью Классификация Присвоение подписей Политика доступа Линии Общий доступ к данным Динамическое представление
Да Да Нет Да Нет Нет Нет Нет Нет Нет

Поддерживаемые версии MongoDB — от 2.6 до 5.1.

При сканировании источника MongoDB Microsoft Purview поддерживает извлечение технических метаданных, в том числе:

  • Сервер
  • Databases
  • Коллекции, включая схему
  • Представления, включая схему

Во время сканирования Microsoft Purview извлекает и анализирует образцы документов для вывода схемы коллекции и представления. Размер выборки можно настроить.

При настройке сканирования можно выбрать полное сканирование одной или нескольких баз данных MongoDB или дополнительно область проверку на подмножество коллекций, соответствующих заданным именам или шаблонам имен.

Известные ограничения

При удалении объекта из источника данных в настоящее время при последующей проверке соответствующий ресурс в Microsoft Purview автоматически не удаляется.

Предварительные требования

Регистрация

В этом разделе описывается, как зарегистрировать MongoDB в Microsoft Purview с помощью портала управления Microsoft Purview.

Действия по регистрации

Чтобы зарегистрировать новый источник MongoDB в каталоге данных, сделайте следующее:

  1. Перейдите к учетной записи Microsoft Purview на портале управления Microsoft Purview.
  2. Выберите Карта данных в области навигации слева.
  3. Выберите Зарегистрировать
  4. В разделе Регистрация источников выберите MongoDB. Нажмите Продолжить.

На экране Регистрация источников (MongoDB) выполните следующие действия.

  1. Введите имя , которое источник данных будет указан в каталоге.

  2. Введите имя сервера . Укажите имя для уникальной идентификации экземпляра MongoDB в организации. Например, host для автономного развертывания для MyReplicaSetName реплика задано, MyClusterName для сегментированного кластера. Это значение будет использоваться в полном имени ресурса и не может быть изменено.

  3. Выберите коллекцию или создайте новую (необязательно).

  4. Завершите регистрацию источника данных.

    Параметры регистрации источников

Проверка

Выполните следующие действия, чтобы проверить MongoDB для автоматической идентификации ресурсов. Дополнительные сведения о сканировании в целом см. в статье Введение в сканирование и прием данных.

Проверка подлинности для сканирования

Поддерживаемый тип проверки подлинности для источника MongoDB — обычная проверка подлинности.

Создание и запуск сканирования

Чтобы создать и запустить новую проверку, сделайте следующее:

  1. В Центре управления выберите Среды выполнения интеграции. Убедитесь, что настроена локальная среда выполнения интеграции. Если она не настроена, выполните описанные здесь действия, чтобы создать локальную среду выполнения интеграции.

  2. Перейдите в раздел Источники.

  3. Выберите зарегистрированный источник MongoDB.

  4. Выберите + Создать сканирование.

  5. Укажите следующие сведения:

    1. Имя: имя сканирования

    2. Подключение через среду выполнения интеграции. Выберите локальную среду выполнения интеграции, используемую для выполнения сканирования.

    3. Учетные данные. Выберите учетные данные для подключения к источнику данных. Убедитесь, что:

      • При создании учетных данных выберите Обычная проверка подлинности .
      • Укажите имя пользователя, используемое для подключения к MongoDB, в поле Ввода имени пользователя.
      • Сохраните пароль пользователя, используемый для подключения к MongoDB, в секретном ключе.
    4. Строка подключения. Укажите строку подключения MongoDB, используемую для подключения к MongoDB, за исключением имени пользователя и пароля. Например, mongodb://mongodb0.example.com:27017,mongodb1.example.com:27017/?replicaSet=myRepl.

    5. Базы данных. Укажите список баз данных MongoDB для импорта. Список может содержать одно или несколько имен баз данных, разделенных точкой с запятой (;), например database1; database2.

    6. Коллекции: подмножество коллекций для импорта, выраженное в виде списка коллекций, разделенных точкой с запятой, например collection1; collection2. Все коллекции импортируются, если список пуст.

      Допустимые шаблоны имен коллекций, использующие синтаксис выражений SQL LIKE, включают использование %. Например: A%; %B; %C%; D:

      • Начните с A или
      • Заканчивается на B или
      • Содержать C или
      • Равный D

      Использование символов NOT и специальных символов недопустимо.

    7. Количество примеров документов: количество примеров документов, которые необходимо проанализировать для извлечения схемы. Значение по умолчанию: 10.

    8. Максимальный доступный объем памяти (применяется при использовании локальной среды выполнения интеграции): максимальный объем памяти (в ГБ), доступный на виртуальной машине клиента для использования процессами сканирования. Это зависит от размера проверяемого источника MongoDB.

      Сканирование MongoDB

  6. Выберите Проверить подключение , чтобы проверить конфигурации.

  7. Нажмите Продолжить.

  8. Выберите триггер сканирования. Вы можете настроить расписание или запустить проверку один раз.

  9. Просмотрите проверку и выберите Сохранить и запустить.

Просмотр проверок и запусков сканирования

Чтобы просмотреть существующие проверки, выполните приведенные далее действия.

  1. Перейдите на портал управления Microsoft Purview. В левой области выберите Карта данных.
  2. Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .
  3. Выберите сканирование с результатами, которые вы хотите просмотреть. На панели отображаются все предыдущие запуски сканирования, а также состояние и метрики для каждого запуска сканирования.
  4. Выберите идентификатор запуска, чтобы проверка сведения о выполнении проверки.

Управление проверками

Чтобы изменить, отменить или удалить сканирование:

  1. Перейдите на портал управления Microsoft Purview. В левой области выберите Карта данных.

  2. Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .

  3. Выберите проверку, которой вы хотите управлять. Далее вы можете:

    • Измените сканирование, выбрав Изменить проверку.
    • Отмените выполняемую проверку, выбрав Отмена выполнения проверки.
    • Удалите сканирование, выбрав Удалить сканирование.

Примечание.

  • При удалении сканирования ресурсы каталога, созданные на основе предыдущих проверок, не удаляются.
  • Ресурс больше не будет обновляться с изменениями схемы, если исходная таблица изменилась и вы повторно просканируете исходную таблицу после изменения описания на вкладке Схема Microsoft Purview.

Дальнейшие действия

Теперь, когда вы зарегистрировали источник, следуйте приведенным ниже руководствам, чтобы узнать больше о Microsoft Purview и ваших данных.