Использование потока данных в конвейере
В этом руководстве вы создадите конвейер данных для перемещения OData из источника Northwind в место назначения Lakehouse и отправки уведомления по электронной почте после завершения конвейера.
Важно!
Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эти сведения относятся к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении предоставленной здесь информации. См. документацию по Фабрика данных Azure для службы в Azure.
Предварительные требования
Чтобы приступить к работе, необходимо выполнить следующие предварительные требования.
- Убедитесь, что у вас есть рабочая область с поддержкой Microsoft Fabric , которая не является моей рабочей областью по умолчанию.
Создание Lakehouse
Для начала необходимо создать lakehouse. Lakehouse — это озеро данных, оптимизированное для аналитики. В этом руководстве вы создадите lakehouse, который используется в качестве назначения для потока данных.
Переключитесь на интерфейс Инжиниринг данных.
Перейдите в рабочую область с поддержкой Fabric.
Выберите Lakehouse в меню создания.
Введите имя для lakehouse.
Нажмите кнопку создания.
Теперь вы создали lakehouse и можете настроить поток данных.
создание потока данных;
Поток данных — это повторно используемое преобразование данных, которое можно использовать в конвейере. В этом руководстве вы создадите поток данных, который получает данные из источника OData и записывает их в место назначения Lakehouse.
Переключитесь на интерфейс Фабрики данных .
Перейдите в рабочую область с поддержкой Fabric.
Выберите Dataflow 2-го поколения в меню создания.
Прием данных из источника OData.
Выберите Получить данные.
Выберите OData.
Введите URL-адрес источника OData. Для работы с этим руководством используйте пример службы OData.
Выберите Далее.
Выберите сущность , которую вы хотите принять. В этом руководстве используется сущность Orders .
Нажмите кнопку создания.
Теперь, когда вы получили данные из источника OData, можно настроить назначение Lakehouse.
Чтобы принять данные в место назначения Lakehouse, выполните следующие действия.
Выберите Добавить назначение данных.
Выберите Lakehouse.
Настройте подключение, которое вы хотите использовать для подключения к lakehouse. Параметры по умолчанию в порядке.
Выберите Далее.
Перейдите в рабочую область, в которой вы создали lakehouse.
Выберите lakehouse, созданный на предыдущих шагах.
Подтвердите имя таблицы.
Выберите Далее.
Подтвердите метод обновления и выберите Сохранить параметры.
Опубликуйте поток данных.
Теперь, когда вы получили данные в место назначения Lakehouse, можно настроить конвейер данных.
Создание конвейера данных
Конвейер данных — это рабочий процесс, который можно использовать для автоматизации обработки данных. В этом руководстве вы создадите конвейер данных, в котором выполняется поток данных 2-го поколения, созданный в предыдущей процедуре.
Вернитесь на страницу обзора рабочей области и выберите Конвейеры данных в меню создания.
Укажите имя для конвейера данных.
Выберите действие Поток данных .
Выберите поток данных , созданный в предыдущей процедуре, в раскрывающемся списке Поток данных в разделе Параметры.
Добавьте действие уведомления Email.
Настройте действие уведомления Email.
Выполните проверку подлинности с помощью учетной записи Office 365.
Выберите адрес Email, по которому нужно отправить уведомление.
Введите тему сообщения электронной почты.
Введите текст сообщения электронной почты.
Запуск и планирование конвейера данных
В этом разделе вы запустите и запланируйте конвейер данных. Это расписание позволяет запускать конвейер данных по расписанию.
Перейдите в рабочую область.
Откройте раскрывающееся меню конвейера данных, созданного в предыдущей процедуре, а затем выберите Расписание.
В разделе Запланированное выполнение выберите Включено.
Укажите расписание, которое вы хотите использовать для запуска конвейера данных.
- Повторяйте, например, каждый день или каждую минуту.
- Если выбрано значение Ежедневно, можно также выбрать значение Время.
- Начать с определенной даты.
- Окончание на определенную дату.
- Выберите часовой пояс.
Нажмите Применить, чтобы применить изменения.
Вы создали конвейер данных, который выполняется по расписанию, обновляет данные в lakehouse и отправляет вам уведомление по электронной почте. Вы можете проверка состояние конвейера данных, перейдя в Центр мониторинга. Вы также можете проверка состояние конвейера данных, перейдя в раздел Конвейер данных и выбрав вкладку Журнал выполнения в раскрывающемся меню.
Дальнейшие действия
В этом примере показано, как использовать поток данных в конвейере с фабрикой данных в Microsoft Fabric. Вы ознакомились с выполнением следующих задач:
- Создание потока данных.
- Создайте конвейер, вызывающий поток данных.
- Запустите и запланируйте конвейер данных.
Затем перейдите к дополнительным сведениям о мониторинге выполнения конвейера.