Управление данными с помощью каталога Unity
В этом руководстве показано, как управлять доступом к данным и объектам ИИ в Azure Databricks. Сведения о безопасности Azure Databricks см. в руководстве по безопасности. Azure Databricks обеспечивает централизованное управление данными и функции ИИ с помощью каталога Unity и разностного общего доступа.
Централизованное управление доступом с помощью каталога Unity
Каталог Unity — это точное решение для управления данными и ИИ на платформе Databricks. Это помогает упростить безопасность и управление ресурсами ИИ, предоставляя централизованное место для администрирования и аудита доступа к данным и ресурсам ИИ.
В большинстве учетных записей каталог Unity включен по умолчанию при создании рабочей области. Дополнительные сведения см. в разделе "Автоматическое включение каталога Unity".
Обсуждение эффективного использования каталога Unity см . в рекомендациях по каталогу Unity.
Отслеживание происхождения данных с помощью каталога Unity
Каталог Unity можно использовать для сбора происхождения данных среды выполнения в запросах на любом языке, выполняемых в кластере Azure Databricks или хранилище SQL. Происхождение записывается до уровня столбца и включает записные книжки, рабочие процессы и панели мониторинга, связанные с запросом. Дополнительные сведения см. в статье "Сбор и просмотр происхождения данных с помощью каталога Unity".
Обнаружение данных с помощью Обозреватель каталога
Каталог Databricks Обозреватель предоставляет пользовательский интерфейс для изучения данных и ресурсов ИИ, включая схемы (базы данных), таблицы, тома (не табличные данные) и зарегистрированные модели машинного обучения, а также разрешения на использование ресурсов, владельцы данных, внешние расположения и учетные данные. Вкладку Аналитика Обозреватель каталога можно использовать для просмотра наиболее частых последних запросов и пользователей любой таблицы, зарегистрированной в каталоге Unity.
Совместное использование данных с помощью разностного общего доступа
Разностный общий доступ — это открытый протокол, разработанный Databricks для защиты данных и совместного использования ресурсов ИИ с другими организациями, или с другими командами в организации независимо от того, какие вычислительные платформы они используют.
Настройка ведения журналов аудита
Databricks предоставляет доступ к журналам действий аудита, выполняемых пользователями Databricks, что позволяет вашей организации отслеживать подробные шаблоны использования Databricks.
Каталог Unity позволяет легко получать доступ к операционным данным учетной записи и запрашивать их, включая журналы аудита, оплачиваемое использование и происхождение с помощью системных таблиц (общедоступная предварительная версия).
Настройка удостоверения
Каждая хорошая история управления данными начинается с надежной основы идентификации. Сведения о том, как настроить удостоверение в Azure Databricks, см. в рекомендациях по настройке удостоверений.
Устаревшие решения по управлению данными
Azure Databricks также предоставляет эти устаревшие модели управления:
Управление доступом к таблицам — это устаревшая модель управления данными, которая позволяет программно предоставлять и отменять доступ к объектам, управляемым встроенным хранилищем метаданных Hive рабочей области. Databricks рекомендует использовать каталог Unity вместо управления доступом к таблицам. Каталог Unity упрощает безопасность и управление данными, предоставляя централизованное место для администрирования и аудита доступа к данным в нескольких рабочих областях в вашей учетной записи.
Сквозное руководство по управлению данными Azure Data Lake служба хранилища (устаревшее) также является устаревшей функцией управления данными, которая позволяет автоматически служба хранилища Azure выполнять проверку подлинности из кластеров Azure Databricks с помощью того же удостоверения Microsoft Entra ID (ранее Azure Active Directory), который вы используете для входа в Azure Databricks. Databricks рекомендует использовать каталог Unity.