Поделиться через


Управление данными с помощью каталога Unity

В этом руководстве показано, как управлять доступом к данным и объектам ИИ в Azure Databricks. Сведения о безопасности Azure Databricks см. в руководстве по безопасности. Azure Databricks обеспечивает централизованное управление данными и функции ИИ с помощью каталога Unity и разностного общего доступа.

Централизованное управление доступом с помощью каталога Unity

Каталог Unity — это точное решение для управления данными и ИИ на платформе Databricks. Это помогает упростить безопасность и управление ресурсами ИИ, предоставляя централизованное место для администрирования и аудита доступа к данным и ресурсам ИИ.

В большинстве учетных записей каталог Unity включен по умолчанию при создании рабочей области. Дополнительные сведения см. в разделе "Автоматическое включение каталога Unity".

Обсуждение эффективного использования каталога Unity см . в рекомендациях по каталогу Unity.

Отслеживание происхождения данных с помощью каталога Unity

Каталог Unity можно использовать для сбора происхождения данных среды выполнения в запросах на любом языке, выполняемых в кластере Azure Databricks или хранилище SQL. Происхождение записывается до уровня столбца и включает записные книжки, задания и панели мониторинга, связанные с запросом. Дополнительные сведения см. в статье "Сбор и просмотр происхождения данных с помощью каталога Unity".

Обнаружение данных с помощью обозревателя каталогов

Обозреватель каталога Databricks предоставляет пользовательский интерфейс для изучения данных и ресурсов ИИ, включая схемы (базы данных), таблицы, тома (не табличные данные) и зарегистрированные модели машинного обучения, а также разрешения на ресурсы, владельцы данных, внешние расположения и учетные данные. Вкладка "Аналитика" в обозревателе каталогов позволяет просматривать самые частые последние запросы и пользователей любой таблицы, зарегистрированной в каталоге Unity.

Совместное использование данных с помощью разностного общего доступа

Разностный общий доступ — это открытый протокол, разработанный Databricks для защиты данных и совместного использования ресурсов ИИ с другими организациями, или с другими командами в организации независимо от того, какие вычислительные платформы они используют.

Настройка ведения журналов аудита

Databricks предоставляет доступ к журналам действий аудита, выполняемых пользователями Databricks, что позволяет вашей организации отслеживать подробные шаблоны использования Databricks.

Каталог Unity позволяет легко получать доступ к операционным данным учетной записи и запрашивать их, включая журналы аудита, оплачиваемое использование и происхождение с помощью системных таблиц (общедоступная предварительная версия).

Настройка удостоверения

Каждая хорошая история управления данными начинается с надежной основы идентификации. Сведения о том, как настроить удостоверение в Azure Databricks, см. в рекомендациях по настройке удостоверений.

Устаревшие решения по управлению данными

Azure Databricks также предоставляет эти устаревшие модели управления:

  • Управление доступом к таблицам — это устаревшая модель управления данными, которая позволяет программно предоставлять и отменять доступ к объектам, управляемым встроенным хранилищем метаданных Hive рабочей области. Databricks рекомендует использовать каталог Unity вместо управления доступом к таблицам. Каталог Unity помогает упростить защиту и управление данными благодаря централизованному управлению и проверке доступа к данным во множестве рабочих областей в вашей учетной записи.

  • Сквозное руководство по управлению учетными данными Azure Data Lake Storage (устаревшая версия) также является устаревшей функцией управления данными, которая позволяет автоматически выполнять проверку подлинности для служба хранилища Azure из кластеров Azure Databricks с помощью того же удостоверения Идентификатора Microsoft Entra, который вы используете для входа в Azure Databricks. Databricks рекомендует использовать каталог Unity.