Руководство. Анализ данных с помощью записной книжки

Область применения: конечная точка аналитики SQL и хранилище в Microsoft Fabric

В этом руководстве вы узнаете, как сохранить данные один раз, а затем использовать их со многими другими службами. Сочетания клавиш также можно создать для данных, хранящихся в Azure Data Lake служба хранилища и S3, чтобы обеспечить прямой доступ к разностным таблицам из внешних систем.

Создание озера

Во-первых, мы создадим новый лейкхаус. Чтобы создать новый lakehouse в рабочей области Microsoft Fabric, выполните следующие действия.

  1. Выберите рабочую Data Warehouse Tutorial область в меню навигации.

  2. Выберите +Создать> **Lakehouse ***.

    A screenshot from the Fabric portal showing the + New menu. Lakehouse is boxed in red.

  3. В поле "Имя" введите ShortcutExercise и нажмите кнопку "Создать".

    A screenshot from the Fabric portal showing name field for the new lakehouse. The name provided is ShortcutExercise.

  4. Откроется новое озеро и откроется представление Обозреватель с данными в меню Lakehouse. В разделе "Загрузка данных" в lakehouse нажмите кнопку "Создать ярлык ".

    A screenshot from the Fabric portal showing the Load data in your lakehouse menu on the landing page. The New shortcut button is boxed in red.

  5. В окне "Создать ярлык" нажмите кнопку для Microsoft OneLake.

    A screenshot from the Fabric portal showing the New shortcut window. The button for Microsoft OneLake is boxed in red.

  6. В окне выбора типа источника данных прокрутите список, пока не найдете созданное ранее хранилищеWideWorldImporters. Выберите его, а затем нажмите кнопку "Далее".

  7. В браузере объектов OneLake разверните таблицы, разверните схему dbo и нажмите переключатель рядомdimension_customer. Выберите кнопку Создать.

    A screenshot from the Fabric portal showing the OneLake object browser. Under WideWorldImporters, Tables, dbo, the dimension_customer is boxed in red.

  8. Если вы видите папку Unidentified в разделе "Таблицы", щелкните значок "Обновить " в горизонтальной строке меню.

    A screenshot from the Fabric portal showing the refresh button on the horizontal menu bar, and the Unidentified tables under ShortcutExercise in the Lakehouse explorer.

  9. Выберите в списке dimension_customerтаблиц , чтобы просмотреть данные. Обратите внимание, что lakehouse отображает данные из таблицы из dimension_customer хранилища!

    A screenshot from the Fabric portal showing the data preview of the dimension_customer table.

  10. Затем создайте записную книжку для запроса dimension_customer таблицы. На ленте "Главная" выберите раскрывающийся список "Открыть записную книжку" и выберите "Создать записную книжку".

    A screenshot from the Fabric portal showing the Open notebook button pressed, and the New notebook option selected.

  11. Выберите, а затем перетащите dimension_customer его из списка таблиц в ячейку открытой записной книжки. Вы можете увидеть, что запрос PySpark написан для запроса всех данных из ShortcutExercise.dimension_customer. Этот интерфейс записной книжки аналогичен интерфейсу записной книжки Jupyter Visual Studio Code. Вы также можете открыть записную книжку в VS Code.

    A screenshot from the Fabric portal notebook view. An arrow indicates the path to select dimension_customer, then drag and drop it into the open notebook cell.

  12. На ленте "Главная" нажмите кнопку "Запустить все". После завершения запроса вы увидите, что вы можете легко использовать PySpark для запроса таблиц хранилища!

    A screenshot from the Fabric portal showing the results of running the notebook to display data from dimension_customer.

Следующий шаг