Руководство по анализу данных с помощью записной книжки

Применимо к: Конечная точка и хранилище SQL в Microsoft Fabric

Из этого руководства вы узнаете, как сохранить данные один раз, а затем использовать их со многими другими службами. Также можно создать ярлыки для данных, хранящихся в Azure Data Lake Storage и S3, чтобы вы могли напрямую обращаться к разностным таблицам из внешних систем.

Важно!

Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эти сведения относятся к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении предоставленной здесь информации.

Создание lakehouse

Во-первых, мы создадим новый lakehouse. Чтобы создать lakehouse в рабочей области Microsoft Fabric, выполните приведенные далее действия.

  1. Выберите рабочую Data Warehouse Tutorial область в меню навигации.

  2. Выберите + Создать>Lakehouse (предварительная версия).

    Снимок экрана: меню + Создать на портале Fabric. Lakehouse (предварительная версия) упакована красным цветом.

  3. В поле Имя введите ShortcutExercise и выберите Создать.

    Снимок экрана: поле имени нового lakehouse на портале Fabric. Предоставленное имя — ShortcutExercise.

  4. Новый lakehouse загружается, и откроется представление Обозреватель с помощью меню Получение данных в вашем lakehouse. В разделе Загрузка данных в lakehouse нажмите кнопку Создать ярлык .

    Снимок экрана с портала Fabric: загрузка данных в меню lakehouse на целевой странице. Кнопка Создать ярлык имеет красный цвет.

  5. В окне Создать ярлык нажмите кнопку Для Microsoft OneLake.

    Снимок экрана портала Fabric с окном создания ярлыка. Кнопка для Microsoft OneLake имеет красный цвет.

  6. В окне Выбор типа источника данных прокрутите список, пока не найдете созданное ранее хранилище WideWorldImporters . Выберите его, а затем нажмите кнопку Далее.

  7. В обозревателе объектов OneLake разверните узел Таблицы, разверните схему dbo , а затем нажмите переключатель рядом с dimension_customer. Нажмите кнопку Создать.

    Снимок экрана с портала Fabric с браузером объектов OneLake. В разделе WideWorldImporters, Tables, dbo dimension_customer упаковается красным цветом.

  8. Если вы видите папку с именем Unidentifiedв разделе Таблицы, щелкните значок Обновить в горизонтальной строке меню.

    Снимок экрана портала Fabric с кнопкой обновления в горизонтальной строке меню и неопознанными таблицами в разделе ShortcutExercise в обозревателе Lakehouse.

  9. Выберите в dimension_customer списке Таблица , чтобы просмотреть данные. Обратите внимание, что в lakehouse отображаются данные из dimension_customer таблицы из хранилища.

    Снимок экрана с портала Fabric, показывающий предварительный просмотр данных dimension_customer таблицы.

  10. Затем создайте записную книжку для запроса таблицы dimension_customer . На ленте Главная выберите раскрывающийся список Открыть записную книжку и выберите Создать записную книжку.

    Снимок экрана с портала Fabric: нажата кнопка

  11. Выберите и перетащите dimension_customer из списка Таблицы в открытую ячейку записной книжки. Вы увидите, что был написан запрос PySpark для запроса всех данных из ShortcutExercise.dimension_customer. Этот интерфейс записной книжки аналогичен Visual Studio Code записной книжке Jupyter. Записную книжку также можно открыть в VS Code.

    Снимок экрана: представление записной книжки на портале Fabric. Стрелка указывает путь для выбора dimension_customer, а затем перетащите его в открытую ячейку записной книжки.

  12. На ленте Главная нажмите кнопку Запустить все . После завершения запроса вы увидите, что вы можете легко использовать PySpark для запроса таблиц хранилища.

    Снимок экрана с портала Fabric, показывающий результаты выполнения записной книжки для отображения данных из dimension_customer.

Дальнейшие действия