Ссылка на данные в Lakehouse для проектов Обработка и анализ данных
В этом кратком руководстве объясняется, как ссылаться на данные, хранящиеся во внешней учетной записи ADLS, и использовать их в проектах обработки и анализа данных. После выполнения этого краткого руководства у вас будет ярлык к хранилищу ADLS в lakehouse и записной книжке с кодом Spark, который обращается к внешним данным.
Подготовка данных к ярлыку
Создание учетной записи ADLS 2-го поколения в Azure
Включение иерархических пространств имен
Создание папок для данных
Отправка данных
Добавление удостоверения пользователя в роль BLOB-объектов служба хранилища Contributor
Получение конечной точки учетной записи хранения
Создание ярлыка
Откройте озеро, чтобы добраться до Lakehouse Обозреватель
В файлах создается папка, в которой ссылались данные
Щелкните правой кнопкой мыши (...) и выберите "Создать ярлык" рядом с именем папки
Выбор внешних источников > ADLS 2-го поколения
Укажите имя ярлыка, конечную точку учетной записи хранения, укажите расположение папки данных в учетной записи хранения.
Выберите "Создать"
Доступ к данным, на которые ссылается записная книжка
- Открытие существующей или создание записной книжки
- Закрепление lakehouse в записной книжке
- Просмотр данных в папке ярлыка
- Выберите файл со структурированными данными и перетащите его в записную книжку, чтобы получить созданный код
- Выполнение кода для получения содержимого файла
- Добавление кода для анализа данных
Связанный контент
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по