Подключение к Cassandra и управление ими в Microsoft Purview
В этой статье описывается, как зарегистрировать Cassandra, а также как проверить подлинность Cassandra и взаимодействовать с ним в Microsoft Purview. Дополнительные сведения о Microsoft Purview см. в вводной статье.
Поддерживаемые возможности
Извлечение метаданных | Полная проверка | Добавочное сканирование | Сканирование с заданной областью | Классификация | Присвоение подписей | Политика доступа | Линии | Общий доступ к данным | Динамическое представление |
---|---|---|---|---|---|---|---|---|---|
Да | Да | Нет | Да | Нет | Нет | Нет | Да | Нет | Нет |
Поддерживаемые версии сервера Cassandra — 3. x или 4. x.
При сканировании источника Cassandra Microsoft Purview поддерживает:
Извлечение технических метаданных, включая:
- Кластер
- Пространства ключей
- Таблицы, включая столбцы и индексы
- Материализованные представления, включая столбцы
Получение статического происхождения данных о связях ресурсов между таблицами и материализованными представлениями.
При настройке проверки можно выбрать сканирование всего экземпляра Cassandra или область сканирование на подмножество пространств ключей, соответствующих заданным именам или шаблонам имен.
Известные ограничения
При удалении объекта из источника данных в настоящее время при последующей проверке соответствующий ресурс в Microsoft Purview автоматически не удаляется.
Предварительные требования
- Учетная запись Azure с активной подпиской. Создайте учетную запись бесплатно.
- Активная учетная запись Microsoft Purview.
- Для регистрации источника данных и управления им на портале управления Microsoft Purview требуются разрешения администратора источника и читателя данных. Дополнительные сведения о разрешениях см. в статье Управление доступом в Microsoft Purview.
Примечание.
Если хранилище данных не является общедоступным (если хранилище данных ограничивает доступ из локальной сети, частной сети или определенных IP-адресов и т. д.), необходимо настроить локальную среду выполнения интеграции для подключения к нему.
- Если хранилище данных не является общедоступным, настройте последнюю локальную среду выполнения интеграции. Дополнительные сведения см. в руководстве по созданию и настройке локальной среды выполнения интеграции.
- Убедитесь, что JDK 11 установлен на компьютере, где установлена локальная среда выполнения интеграции. Перезапустите компьютер после установки JDK, чтобы он вступил в силу.
- Убедитесь, что на локальном компьютере среды выполнения интеграции установлен Распространяемый компонент Visual C++ (версия Visual Studio 2012 с обновлением 4 или более поздней). Если это обновление не установлено, его можно скачать здесь.
Регистрация
В этом разделе описывается, как зарегистрировать Cassandra в Microsoft Purview с помощью портала управления Microsoft Purview.
Действия по регистрации
Чтобы зарегистрировать новый сервер Cassandra в каталоге данных:
Откройте портал управления Microsoft Purview, выполнив следующие действия.
- Перейдите непосредственно к https://web.purview.azure.com учетной записи Microsoft Purview и выберите ее.
- Открытие портал Azure, поиск и выбор учетной записи Microsoft Purview. Нажмите кнопку портала управления Microsoft Purview .
Выберите Карта данных в левой области.
Нажмите Зарегистрировать.
На экране Регистрация источников выберите Cassandra и нажмите кнопку Продолжить:
На экране Регистрация источников (Cassandra) выполните следующие действия:
- Введите Имя. Источник данных будет использовать это имя в каталоге.
- В поле Узел введите адрес сервера, на котором работает сервер Cassandra. Например, 20.190.193.10.
- В поле Порт введите порт, используемый сервером Cassandra.
- Выберите коллекцию или создайте новую (необязательно).
- Нажмите Зарегистрировать.
Проверка
Выполните следующие действия, чтобы проверить Cassandra для автоматической идентификации ресурсов. Дополнительные сведения о сканировании в целом см. в статье Введение в сканирование и прием данных.
Создание и запуск сканирования
Чтобы создать и запустить новую проверку, выполните приведенные ниже действия.
Если сервер является общедоступным, перейдите к шагу 2. В противном случае необходимо убедиться, что настроена локальная среда выполнения интеграции:
- На портале управления Microsoft Purview перейдите в Центр управления и выберите Среды выполнения интеграции.
- Убедитесь, что локальная среда выполнения интеграции доступна. Если она не настроена, выполните описанные здесь действия, чтобы настроить локальную среду выполнения интеграции.
На портале управления Microsoft Purview перейдите в раздел Источники.
Выберите зарегистрированный сервер Cassandra.
Выберите Создать сканирование.
Укажите следующие сведения.
Имя. Укажите имя для сканирования.
Подключение через среду выполнения интеграции. Выберите среду выполнения интеграции Azure с автоматическим разрешением, если ваш сервер является общедоступным, или настроенную локальную среду выполнения интеграции, если она не является общедоступной.
Учетные данные. При настройке учетных данных Cassandra убедитесь, что:
- Выберите Обычная проверка подлинности в качестве метода проверки подлинности.
- В поле Имя пользователя укажите имя пользователя, для который вы выполняете подключение.
- В секрете хранилища ключей сохраните пароль пользователя Cassandra, для который вы выполняете подключение.
Дополнительные сведения см. в разделе Учетные данные для проверки подлинности источника в Microsoft Purview.
Пространства ключей. Укажите список пространств ключей Cassandra для импорта. Несколько пространств ключей должны быть разделены точкой с запятой. Например, keyspace1; keyspace2. Если список пуст, импортируются все доступные пространства ключей.
Вы можете использовать шаблоны имен пространств ключей, которые используют синтаксис выражений SQL LIKE, включая %.
Например: A%; %B; %C%; D
Это выражение означает:
- Начинается с A или
- Заканчивается на B или
- Содержит C или
- Равно D
Вы не можете использовать НЕ или специальные символы.
Использование протокола SSL. Выберите Значение True или False , чтобы указать, следует ли использовать протокол SSL при подключении к серверу Cassandra. По умолчанию этот параметр имеет значение False.
Максимальный объем доступной памяти (применимо при использовании локальной среды выполнения интеграции). Укажите максимальный объем памяти (в ГБ), доступный на виртуальной машине, который будет использоваться для процессов сканирования. Это значение зависит от размера проверяемого сервера Cassandra.
Выберите Проверить подключение , чтобы проверить параметры.
Нажмите Продолжить.
Выберите триггер сканирования. Вы можете настроить расписание или запустить проверку один раз.
Просмотрите проверку и выберите Сохранить и запустить.
Просмотр проверок и запусков сканирования
Чтобы просмотреть существующие проверки, выполните приведенные далее действия.
- Перейдите на портал управления Microsoft Purview. В левой области выберите Карта данных.
- Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .
- Выберите сканирование с результатами, которые вы хотите просмотреть. На панели отображаются все предыдущие запуски сканирования, а также состояние и метрики для каждого запуска сканирования.
- Выберите идентификатор запуска, чтобы проверка сведения о выполнении проверки.
Управление проверками
Чтобы изменить, отменить или удалить сканирование:
Перейдите на портал управления Microsoft Purview. В левой области выберите Карта данных.
Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .
Выберите проверку, которой вы хотите управлять. Далее вы можете:
- Измените сканирование, выбрав Изменить проверку.
- Отмените выполняемую проверку, выбрав Отмена выполнения проверки.
- Удалите сканирование, выбрав Удалить сканирование.
Примечание.
- При удалении сканирования ресурсы каталога, созданные на основе предыдущих проверок, не удаляются.
- Ресурс больше не будет обновляться с изменениями схемы, если исходная таблица изменилась и вы повторно просканируете исходную таблицу после изменения описания на вкладке Схема Microsoft Purview.
Линии
После сканирования источника Cassandra можно просмотреть каталог данных или выполнить поиск в каталоге данных , чтобы просмотреть сведения об активе.
Перейдите на вкладку asset — lineage (Ресурс —> происхождение), и при необходимости вы увидите связь активов. Сведения о поддерживаемых сценариях происхождения происхождения Cassandra см. в разделе поддерживаемых возможностей . Дополнительные сведения о происхождении данных в целом см. в руководстве пользователя по происхождению данных и происхождению данных.
Дальнейшие действия
Теперь, когда вы зарегистрировали источник, следуйте приведенным ниже руководствам, чтобы узнать больше о Microsoft Purview и ваших данных.