Ссылки на данные в Lakehouse для проектов Обработка и анализ данных

В этом кратком руководстве объясняется, как ссылаться на данные, хранящиеся во внешней учетной записи ADLS, и использовать их в проектах обработки и анализа данных. После выполнения этого краткого руководства вы получите ярлык к хранилищу ADLS в lakehouse и записную книжку с кодом Spark, который обращается к внешним данным.

Важно!

Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эти сведения относятся к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении предоставленной здесь информации.

Подготовка данных к ярлыку

  1. В Azure создайте учетную запись ADLS 2-го поколения

  2. Включение иерархических пространств имен

    Снимок экрана: иерархические пространства имен в учетной записи хранения.

  3. Создание папок для данных

  4. Отправка данных

  5. Добавление удостоверения пользователя в роль BlobStorageContributor

  6. Получение конечной точки учетной записи хранения

Создание ярлыка

  1. Откройте lakehouse, чтобы добраться до Lakehouse Обозреватель

  2. В разделе файлы создайте папку, в которой вы ссылаетесь на данные.

  3. Щелкните правой кнопкой мыши (...) и выберите Создать ярлык рядом с именем папки.

    Снимок экрана: новая ярлыкная ссылка.

  4. Выбор внешних источников > ADLS 2-го поколения

  5. Укажите имя ярлыка, конечную точку учетной записи хранения, а также укажите расположение папки данных в учетной записи хранения.

    Снимок экрана: диалоговое окно создания ярлыка.

  6. Выбор кнопки "Создать"

Доступ к данным, на которые ссылается, в записной книжке

  1. Открытие существующей или создание записной книжки
  2. Закрепление lakehouse в записной книжке
  3. Просмотр данных в ярлыке
  4. Выберите файл со структурированными данными и перетащите его в записную книжку, чтобы получить созданный код
  5. Выполнение кода для получения содержимого файла
  6. Добавление кода для анализа данных

Дальнейшие действия