Руководство по анализу данных с помощью записной книжки
Применимо к: Конечная точка и хранилище SQL в Microsoft Fabric
Из этого руководства вы узнаете, как сохранить данные один раз, а затем использовать их со многими другими службами. Также можно создать ярлыки для данных, хранящихся в Azure Data Lake Storage и S3, чтобы вы могли напрямую обращаться к разностным таблицам из внешних систем.
Важно!
Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эти сведения относятся к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении предоставленной здесь информации.
Создание lakehouse
Во-первых, мы создадим новый lakehouse. Чтобы создать lakehouse в рабочей области Microsoft Fabric, выполните приведенные далее действия.
Выберите рабочую
Data Warehouse Tutorial
область в меню навигации.Выберите + Создать>Lakehouse (предварительная версия).
В поле Имя введите
ShortcutExercise
и выберите Создать.Новый lakehouse загружается, и откроется представление Обозреватель с помощью меню Получение данных в вашем lakehouse. В разделе Загрузка данных в lakehouse нажмите кнопку Создать ярлык .
В окне Создать ярлык нажмите кнопку Для Microsoft OneLake.
В окне Выбор типа источника данных прокрутите список, пока не найдете созданное ранее хранилище
WideWorldImporters
. Выберите его, а затем нажмите кнопку Далее.В обозревателе объектов OneLake разверните узел Таблицы, разверните схему
dbo
, а затем нажмите переключатель рядом сdimension_customer
. Нажмите кнопку Создать.Если вы видите папку с именем
Unidentified
в разделе Таблицы, щелкните значок Обновить в горизонтальной строке меню.Выберите в
dimension_customer
списке Таблица , чтобы просмотреть данные. Обратите внимание, что в lakehouse отображаются данные изdimension_customer
таблицы из хранилища.Затем создайте записную книжку для запроса таблицы
dimension_customer
. На ленте Главная выберите раскрывающийся список Открыть записную книжку и выберите Создать записную книжку.Выберите и перетащите
dimension_customer
из списка Таблицы в открытую ячейку записной книжки. Вы увидите, что был написан запрос PySpark для запроса всех данных изShortcutExercise.dimension_customer
. Этот интерфейс записной книжки аналогичен Visual Studio Code записной книжке Jupyter. Записную книжку также можно открыть в VS Code.На ленте Главная нажмите кнопку Запустить все . После завершения запроса вы увидите, что вы можете легко использовать PySpark для запроса таблиц хранилища.