Подготовка системы к работе с руководством по обработке и анализу данных

Прежде чем приступить к работе с комплексными модулями по обработке и анализу данных, ознакомьтесь с предварительными условиями, примером набора данных, импортируемыми записными книжками и способами подключения lakehouse к этим записным книжкам.

Важно!

Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эта информация относится к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении информации, представленной здесь.

Предварительные требования

  1. Power BI Premium подписку. Дополнительные сведения см. в статье Как купить Power BI Premium.

  2. Рабочая область Power BI с назначенной емкостью premium.

  3. Существующее хранилище озера Microsoft Fabric. Создайте lakehouse, выполнив действия, описанные в разделе Создание lakehouse в Microsoft Fabric.

Пример набора данных

В этом руководстве мы используем желтый набор данных о такси и лимузине Нью-Йорка, который представляет собой крупномасштабный набор данных, содержащий поездки на такси в городе с 2009 по 2018 год. Набор данных включает различные функции, такие как даты и высадки, время, места, тарифы, типы оплаты и количество пассажиров. Набор данных можно использовать для различных целей, таких как анализ шаблонов трафика, тенденций спроса, стратегий ценообразования и поведения драйвера.

Импорт записных книжек учебника

Мы используем элемент записной книжки в интерфейсе Обработка и анализ данных для демонстрации различных возможностей Fabric. Записные книжки доступны в виде файлов записных книжек Jupyter, которые можно импортировать в рабочую область с поддержкой Fabric.

  1. Скачайте файлы записных книжек (.ipynb) для этого руководства из родительской папки Обработка и анализ данных исходный код руководства.

  2. Переключитесь на интерфейс Обработка и анализ данных, используя значок переключателя интерфейса в левом углу домашней страницы.

    Снимок экрана: меню переключателя взаимодействия, показывающее, где выбрать Обработка и анализ данных.

  3. На домашней странице интерфейса обработки и анализа данных выберите Импорт записной книжки и отправьте файлы записной книжки для модулей 1–5, скачанные на шаге 1.

    Снимок экрана: выбор пункта Импорт записной книжки на домашней странице обработки и анализа данных.

    Снимок экрана: диалоговое окно состояния импорта, в котором показано, где нажать кнопку Отправить.

  4. После импорта записных книжек выберите Перейти к рабочей области в диалоговом окне импорта.

    Снимок экрана: диалоговое окно успешного импорта, в котором показано, где выбрать команду Перейти к рабочей области.

  5. Импортированные записные книжки теперь доступны в рабочей области для использования.

    Снимок экрана: список доступных записных книжек в рабочей области.

Присоединение lakehouse к записным книжкам

Чтобы продемонстрировать функции Fabric lakehouse, первые пять модулей в этом руководстве требуют подключения lakehouse по умолчанию к записным книжкам. Ниже показано, как добавить существующий lakehouse в записную книжку в рабочей области с поддержкой Fabric.

  1. Откройте записную книжку для первого модуля 01 Прием данных в Lakehouse с помощью Apache Spark в рабочей области.

  2. Выберите Добавить lakehouse в области слева и выберите Существующий lakehouse , чтобы открыть диалоговое окно Центр данных .

  3. Выберите рабочую область и lakehouse, которые вы планируете использовать в этих руководствах, и нажмите кнопку Добавить.

  4. После добавления lakehouse он отображается в области lakehouse в пользовательском интерфейсе записной книжки, где можно просматривать таблицы и файлы, хранящиеся в lakehouse.

Примечание

Перед выполнением всех записных книжек необходимо выполнить эти действия для каждой записной книжки в этом руководстве.

Схема шагов по присоединению lakehouse к записной книжке.

Дальнейшие действия