Настройка доступа к данным для приема
В этой статье описывается, как администраторы могут настроить доступ к данным в контейнере в Azure Data Lake Storage 2-го поколения (ADLS 2-го поколения), чтобы пользователи Azure Databricks могли загружать данные из ADLS 2-го поколения в таблицу в Azure Databricks.
В этой статье описаны следующие способы настройки безопасного доступа к исходным данным:
(Рекомендуется) Создайте том каталога Unity.
Создайте внешнее расположение каталога Unity с учетными данными хранилища.
Запустите вычислительный ресурс, использующий субъект-службу.
Создайте временные учетные данные (маркер SAS BLOB-объектов).
Подготовка к работе
Прежде чем настроить доступ к данным в ADLS 2-го поколения, убедитесь, что у вас есть следующие возможности:
Данные в контейнере в учетной записи хранения Azure. Сведения о создании контейнера см. в статье "Создание контейнера " в документации по службе хранилища Azure.
Чтобы получить доступ к данным с помощью тома каталога Unity (рекомендуется),
READ VOLUME
привилегии тома. Дополнительные сведения см. в разделе "Что такое тома каталога Unity?", а также привилегии каталога Unity и защищаемые объекты.Чтобы получить доступ к данным с помощью внешнего расположения каталога Unity,
READ FILES
привилегия в внешнем расположении. Дополнительные сведения см. в статье "Создание внешнего расположения для подключения облачного хранилища к Azure Databricks".Чтобы получить доступ к данным с помощью вычислительного ресурса с субъектом-службой, разрешения администратора рабочей области Azure Databricks.
Чтобы получить доступ к данным с помощью временных учетных данных, выполните следующее:
- Разрешения администратора рабочей области Azure Databricks.
- Разрешения в учетной записи Azure для создания маркеров SAS BLOB-объектов. Это позволяет создавать временные учетные данные.
Хранилище SQL Databricks. Дополнительные сведения см. в разделе Создание хранилища SQL.
Опыт работы с пользовательским интерфейсом SQL Databricks.
Настройка доступа к облачному хранилищу
Используйте один из следующих методов для настройки доступа к ADLS 2-го поколения:
(Рекомендуется) Создайте том каталога Unity. Дополнительные сведения см. в разделе "Что такое тома каталога Unity?".
Настройте внешнее расположение каталога Unity с учетными данными хранилища. Дополнительные сведения о внешних расположениях см. в статье "Создание внешнего расположения для подключения облачного хранилища к Azure Databricks".
Настройте вычислительный ресурс для использования субъекта-службы. Дополнительные сведения см. в разделе "Настройка субъекта-службы".
Создайте временные учетные данные (маркер SAS BLOB-объектов) для совместного использования с другими пользователями Azure Databricks. Дополнительные сведения см. в разделе "Создание временных учетных данных для приема".
Очистка
Вы можете очистить связанные ресурсы в облачной учетной записи и Azure Databricks, если вы больше не хотите их хранить.
Удаление учетной записи хранения ADLS 2-го поколения
- Войдите на портал Azure для своей учетной записи Azure, обычно по адресу https://portal.azure.com.
- Перейдите к учетной записи хранения и откройте ее.
- Нажмите Удалить.
- Введите имя учетной записи хранения и нажмите кнопку " Удалить".
Остановка хранилища SQL
Если вы не используете хранилище SQL для других задач, его следует остановить, чтобы избежать дополнительных затрат.
- В SQL на боковой панели щелкните Хранилища SQL.
- Рядом с именем хранилища SQL щелкните Остановить.
- При появлении запроса щелкните Остановить снова.
Следующие шаги
Выполнив действия, описанные в этой статье, пользователи могут выполнить COPY INTO
команду, чтобы загрузить данные из контейнера ADLS 2-го поколения в рабочую область Azure Databricks.
Сведения о загрузке данных с помощью тома каталога Unity или внешнего расположения см. в разделе "Загрузка данных с помощью COPY INTO" с томами каталога Unity или внешними расположениями.
Сведения о загрузке данных с помощью хранилища SQL с субъектом-службой см. в разделе "Загрузка данных с помощью COPY INTO" с субъектом-службой.
Сведения о загрузке данных с помощью временных учетных данных (маркер SAS BLOB-объектов) см. в разделе "Загрузка данных с помощью COPY INTO" с временными учетными данными.