Предоставление общего доступа к данным с помощью протокола открытого общего доступа (для поставщиков)

В этой статье приводятся общие сведения о том, как поставщики могут использовать протокол открытого общего доступа Delta Share для совместного использования данных из рабочей области Azure Databricks с поддержкой каталога Unity с любым пользователем на любой вычислительной платформе в любом месте.

Примечание.

Если вы являетесь получателем данных (пользователь или группа пользователей, которым предоставляется общий доступ к данным), см. вместо этого доступ к данным с помощью разностного общего доступа (для получателей).

Кто следует использовать протокол открытого общего доступа Delta Sharing?

Существует три способа совместного использования данных с помощью разностного общего доступа:

  1. Протокол общего доступа Databricks, описанный в этой статье, позволяет совместно использовать данные, управляемые в рабочей области Databricks с поддержкой каталога Unity, с пользователями на любой вычислительной платформе.

    Этот подход использует сервер Delta Share, встроенный в Azure Databricks, и полезен при управлении данными с помощью каталога Unity и хотите поделиться им с пользователями, которые не используют Databricks или не имеют доступа к рабочей области Databricks с поддержкой каталога Unity. Интеграция с каталогом Unity на стороне поставщика упрощает настройку и управление поставщиками.

  2. Управляемая клиентом реализация сервера с открытым исходным кодом Delta Sharing позволяет предоставлять общий доступ от любой платформы к любой платформе, независимо от того, используется ли Databricks или нет.

    См . github.com/delta-io/delta-sharing.

  3. Протокол общего доступа Databricks to Databricks позволяет предоставлять доступ к данным из рабочей области с поддержкой каталога Unity пользователям, у которых также есть доступ к рабочей области Databricks с поддержкой каталога Unity.

    См. раздел "Общий доступ к данным" с помощью протокола Delta Share Databricks to Databricks (для поставщиков).

Общие сведения о разностном совместном использовании и дополнительные сведения об этих трех подходах см. в статье "Общий доступ к данным и ресурсам искусственного интеллекта" безопасно с помощью разностного общего доступа.

Рабочий процесс открытого общего доступа для разностного общего доступа

В этом разделе представлен общий обзор рабочего процесса открытого общего доступа с ссылками на подробную документацию для каждого шага.

В модели открытого общего доступа Delta Sharing:

  1. Поставщик данных создает получателя, который является именованным объектом, который представляет пользователя или группу пользователей, с которыми поставщик данных хочет предоставить общий доступ к данным.

    Когда поставщик данных создает получателя, Azure Databricks создает маркер, файл учетных данных, содержащий маркер, и ссылку активации, которую поставщик данных может отправить получателю для доступа к файлу учетных данных.

    Дополнительные сведения см . в шаге 1. Создание получателя.

  2. Поставщик данных создает общую папку, которая представляет собой именованный объект, содержащий коллекцию таблиц, зарегистрированных в хранилище метаданных каталога Unity в учетной записи поставщика.

    Дополнительные сведения см. в разделе "Создание общих папок и управление ими для разностного общего доступа".

  3. Поставщик данных предоставляет получателю доступ к общей папке.

    Дополнительные сведения см. в разделе "Управление доступом к общим папкам данных Delta Sharing" (для поставщиков).

  4. Поставщик данных отправляет ссылку активации получателю через безопасный канал, а также инструкции по использованию ссылки активации для скачивания файла учетных данных, который получатель будет использовать для установления безопасного подключения к поставщику данных для получения общих данных.

    Дополнительные сведения см. в шаге 2. Получение ссылки на активацию.

  5. Получатель данных следует ссылке активации для скачивания файла учетных данных, а затем использует файл учетных данных для доступа к общим данным.

    Общие данные доступны только для чтения. Пользователи могут получить доступ к данным с помощью выбранной платформы или инструментов.

    Дополнительные сведения см. в разделе "Чтение данных" с помощью открытого общего доступа для разностного общего доступа (для получателей).

Рекомендации по настройке и безопасности для открытого общего доступа

Хорошее управление маркерами — это ключ к безопасному обмену данными при использовании открытой модели общего доступа:

  • Поставщики данных, которые намерены использовать открытый общий доступ, должны настроить время существования маркера получателя по умолчанию при включении delta Sharing для хранилища метаданных каталога Unity. Databricks рекомендует устанавливать конечный срок действия маркеров. См. раздел "Включить разностный общий доступ" в хранилище метаданных.
  • Если необходимо изменить время существования маркера по умолчанию, см. раздел "Изменить время существования маркера получателя".
  • Поощряйте получателей безопасно управлять скачанным файлом учетных данных.
  • Дополнительные сведения об управлении маркерами и безопасности открытого общего доступа см. в разделе "Управление маркерами получателя (открытый общий доступ)".

Поставщики данных могут обеспечить дополнительную безопасность, назначив списки IP-доступа, чтобы ограничить доступ получателя к определенным сетевым расположениям. См. раздел "Ограничить доступ получателей разностного доступа" с помощью списков IP-доступа (открытый общий доступ).