Управление данными с помощью каталога Unity

В этом руководстве показано, как управлять доступом к данным и объектам ИИ в Azure Databricks. Сведения о безопасности Azure Databricks см. в руководстве по безопасности. Azure Databricks обеспечивает централизованное управление данными и функции ИИ с помощью каталога Unity и разностного общего доступа.

Централизованное управление доступом с помощью каталога Unity

Каталог Unity — это точное решение для управления данными и ИИ на платформе Databricks. Это помогает упростить безопасность и управление ресурсами ИИ, предоставляя централизованное место для администрирования и аудита доступа к данным и ресурсам ИИ.

В большинстве учетных записей каталог Unity включен по умолчанию при создании рабочей области. Дополнительные сведения см. в разделе "Автоматическое включение каталога Unity".

Обсуждение эффективного использования каталога Unity см . в рекомендациях по каталогу Unity.

Отслеживание происхождения данных с помощью каталога Unity

Каталог Unity можно использовать для сбора происхождения данных среды выполнения в запросах на любом языке, выполняемых в кластере Azure Databricks или хранилище SQL. Происхождение записывается до уровня столбца и включает записные книжки, рабочие процессы и панели мониторинга, связанные с запросом. Дополнительные сведения см. в статье "Сбор и просмотр происхождения данных с помощью каталога Unity".

Обнаружение данных с помощью Обозреватель каталога

Каталог Databricks Обозреватель предоставляет пользовательский интерфейс для изучения данных и ресурсов ИИ, включая схемы (базы данных), таблицы, тома (не табличные данные) и зарегистрированные модели машинного обучения, а также разрешения на использование ресурсов, владельцы данных, внешние расположения и учетные данные. Вкладку Аналитика Обозреватель каталога можно использовать для просмотра наиболее частых последних запросов и пользователей любой таблицы, зарегистрированной в каталоге Unity.

Совместное использование данных с помощью разностного общего доступа

Разностный общий доступ — это открытый протокол, разработанный Databricks для защиты данных и совместного использования ресурсов ИИ с другими организациями, или с другими командами в организации независимо от того, какие вычислительные платформы они используют.

Настройка ведения журналов аудита

Databricks предоставляет доступ к журналам действий аудита, выполняемых пользователями Databricks, что позволяет вашей организации отслеживать подробные шаблоны использования Databricks.

Каталог Unity позволяет легко получать доступ к операционным данным учетной записи и запрашивать их, включая журналы аудита, оплачиваемое использование и происхождение с помощью системных таблиц (общедоступная предварительная версия).

Настройка удостоверения

Каждая хорошая история управления данными начинается с надежной основы идентификации. Сведения о том, как настроить удостоверение в Azure Databricks, см. в рекомендациях по настройке удостоверений.

Устаревшие решения по управлению данными

Azure Databricks также предоставляет эти устаревшие модели управления:

  • Управление доступом к таблицам — это устаревшая модель управления данными, которая позволяет программно предоставлять и отменять доступ к объектам, управляемым встроенным хранилищем метаданных Hive рабочей области. Databricks рекомендует использовать каталог Unity вместо управления доступом к таблицам. Каталог Unity упрощает безопасность и управление данными, предоставляя централизованное место для администрирования и аудита доступа к данным в нескольких рабочих областях в вашей учетной записи.

  • Сквозное руководство по управлению данными Azure Data Lake служба хранилища (устаревшее) также является устаревшей функцией управления данными, которая позволяет автоматически служба хранилища Azure выполнять проверку подлинности из кластеров Azure Databricks с помощью того же удостоверения Microsoft Entra ID (ранее Azure Active Directory), который вы используете для входа в Azure Databricks. Databricks рекомендует использовать каталог Unity.