Ссылки на данные в Lakehouse для проектов Обработка и анализ данных
В этом кратком руководстве объясняется, как ссылаться на данные, хранящиеся во внешней учетной записи ADLS, и использовать их в проектах обработки и анализа данных. После выполнения этого краткого руководства вы получите ярлык к хранилищу ADLS в lakehouse и записную книжку с кодом Spark, который обращается к внешним данным.
Важно!
Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эти сведения относятся к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении предоставленной здесь информации.
Подготовка данных к ярлыку
В Azure создайте учетную запись ADLS 2-го поколения
Включение иерархических пространств имен
Создание папок для данных
Отправка данных
Добавление удостоверения пользователя в роль BlobStorageContributor
Получение конечной точки учетной записи хранения
Создание ярлыка
Откройте lakehouse, чтобы добраться до Lakehouse Обозреватель
В разделе файлы создайте папку, в которой вы ссылаетесь на данные.
Щелкните правой кнопкой мыши (...) и выберите Создать ярлык рядом с именем папки.
Выбор внешних источников > ADLS 2-го поколения
Укажите имя ярлыка, конечную точку учетной записи хранения, а также укажите расположение папки данных в учетной записи хранения.
Выбор кнопки "Создать"
Доступ к данным, на которые ссылается, в записной книжке
- Открытие существующей или создание записной книжки
- Закрепление lakehouse в записной книжке
- Просмотр данных в ярлыке
- Выберите файл со структурированными данными и перетащите его в записную книжку, чтобы получить созданный код
- Выполнение кода для получения содержимого файла
- Добавление кода для анализа данных