Краткое руководство. Перемещение и преобразование данных с помощью потоков данных и конвейеров данных

В этом руководстве вы узнаете, как поток данных и конвейер данных могут создать мощное и комплексное решение фабрики данных.

Важно!

Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эта информация относится к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении информации, представленной здесь. См. Фабрика данных Azure документацию по службе в Azure.

Предварительные требования

Чтобы приступить к работе, необходимо выполнить следующие предварительные требования:

Преобразование данных с помощью потоков данных

Выполните следующие действия, чтобы настроить поток данных.

Шаг 1. Создание потока данных

  1. Выберите рабочую область с поддержкой Fabric и нажмите кнопку Создать. Затем выберите Поток данных 2-го поколения.

    Снимок экрана: с чего начать создание потока данных 2-го поколения.

  2. Откроется окно редактора потока данных. Выберите карта Импорт из SQL Server.

    Снимок экрана: окно редактора потока данных.

Шаг 2. Получение данных

  1. В диалоговом окне Подключение к источнику данных введите сведения о подключении к базе данных Azure SQL, а затем нажмите кнопку Далее. В этом примере используется пример базы данных AdventureWorksLT, настроенный при настройке базы данных Azure SQL в предварительных требованиях.

    Снимок экрана: подключение к базе данных Azure SQL.

  2. Выберите данные, которые вы хотите преобразовать, и нажмите кнопку Создать. В этом кратком руководстве выберите SalesLT.Customer из примера данных AdventureWorksLT, предоставленных для базы данных Azure SQL, а затем нажмите кнопку Выбрать связанные таблицы, чтобы автоматически включить две другие связанные таблицы.

    Снимок экрана: выбор из доступных данных.

Шаг 3. Преобразование данных

  1. Если он не выбран, нажмите кнопку Представление диаграммы в строке состояния в нижней части страницы или выберите Представление схемы в меню Вид в верхней части редактора Power Query. Любой из этих параметров может переключить представление схемы.

    Снимок экрана: выбор представления схемы.

  2. Щелкните правой кнопкой мыши запрос SalesLT Customer или щелкните вертикальное многоточие справа от запроса, а затем выберите Объединить запросы.

    Снимок экрана, показывающий, где найти параметр

  3. Настройте слияние, выбрав таблицу SalesOrderHeader в качестве правой таблицы для слияния, столбец CustomerID из каждой таблицы в качестве столбца соединения и левый внешний тип соединения. Затем нажмите кнопку ОК при добавлении запроса на слияние.

    Снимок экрана конфигурации слияния.

  4. Нажмите кнопку Добавить назначение данных , которая выглядит как символ базы данных со стрелкой над ним, в новом запросе на слияние, который вы только что создали. Затем выберите Azure SQL базу данных в качестве типа назначения.

    Снимок экрана: выделена кнопка

  5. Укажите сведения о подключении к базе данных Azure SQL, в которой будет опубликован запрос на слияние. В этом примере можно использовать базу данных AdventureWorksLT , которую мы использовали в качестве источника данных для назначения.

    Снимок экрана: диалоговое окно

  6. Выберите базу данных для хранения данных и укажите имя таблицы, а затем нажмите кнопку Далее.

    Снимок экрана: окно

  7. Вы можете оставить параметры по умолчанию в диалоговом окне Выбор параметров назначения и просто выбрать Сохранить параметры , не внося никаких изменений.

    Снимок экрана: диалоговое окно

  8. Выберите Опубликовать на странице редактора потока данных, чтобы опубликовать поток данных.

    Снимок экрана: выделена кнопка

Перемещение данных с помощью конвейеров данных

Теперь, когда вы создали поток данных 2-го поколения, вы можете работать с ним в конвейере. В этом примере мы скопируем данные, созданные из потока данных, в текстовый формат в учетной записи Хранилище BLOB-объектов Azure.

Шаг 1. Создание нового конвейера данных

  1. В рабочей области выберите Создать, а затем — Конвейер данных.

    Снимок экрана, показывающий, где начать новый конвейер данных.

  2. Присвойте конвейеру имя, а затем выберите Создать.

    Снимок экрана: запрос на создание нового конвейера с примером имени конвейера.

Шаг 2. Настройка потока данных

  1. Добавьте новое действие потока данных в конвейер данных, выбрав Поток данных на вкладке Действия .

    Снимок экрана: выбор параметра Поток данных.

  2. Выберите поток данных на холсте конвейера, а затем перейдите на вкладку Параметры . Выберите созданный ранее поток данных в раскрывающемся списке.

    Снимок экрана: выбор созданного потока данных.

  3. Выберите Сохранить, а затем Выполнить , чтобы запустить поток данных для первоначального заполнения объединенной таблицы запросов, созданной на предыдущем шаге.

    Снимок экрана, показывающий, где нажать кнопку Выполнить.

Шаг 3. Добавление действия копирования с помощью помощника по копированию

  1. Выберите Копировать данные на холсте, чтобы открыть помощник по копированию для начала работы. Или выберите Использовать помощник по копированию в раскрывающемся списке Копировать данные на вкладке Действия на ленте.

    Снимок экрана: два способа доступа к помощнику по копированию.

  2. Выберите источник данных, выбрав тип источника данных. В этом руководстве вы будете использовать базу данных Azure SQL, которая использовалась ранее при создании потока данных, для создания нового запроса на слияние. Прокрутите вниз под примерами предложений данных и выберите вкладку Azure в разделе Источники данных, а затем Azure SQL База данных. Нажмите кнопку Далее, чтобы продолжить.

    Снимок экрана: выбор источника данных.

  3. Создайте подключение к источнику данных, выбрав Создать подключение. Введите необходимые сведения о подключении на панели и введите AdventureWorksLT для базы данных, в которой мы создали запрос на слияние в потоке данных. Нажмите кнопку Далее.

    Снимок экрана, показывающий, где создать новое подключение.

  4. Выберите таблицу, созданную ранее на шаге потока данных, и нажмите кнопку Далее.

    Снимок экрана: выбор из доступных таблиц.

  5. В поле назначения выберите Хранилище BLOB-объектов Azure, а затем нажмите кнопку Далее.

    Снимок экрана: назначение данных Хранилище BLOB-объектов Azure.

  6. Создайте подключение к месту назначения, выбрав Создать новое подключение. Укажите сведения о подключении, а затем нажмите кнопку Далее.

    Снимок экрана: создание подключения.

  7. Выберите путь к папке и укажите имя файла, а затем нажмите кнопку Далее.

    Снимок экрана: выбор пути к папке и имени файла.

  8. Нажмите кнопку Далее еще раз, чтобы принять формат файла по умолчанию, разделитель столбцов, разделитель строк и тип сжатия, при необходимости включая заголовок.

    Снимок экрана: параметры конфигурации для файла в Хранилище BLOB-объектов Azure.

  9. Завершите настройку параметров. Затем просмотрите и нажмите кнопку ОК , чтобы завершить процесс.

    Снимок экрана: проверка параметров копирования данных.

Шаг 5. Проектирование конвейера данных и сохранение для запуска и загрузки данных

  1. Чтобы запустить действие Копирования после действия Потока данных , перетащите элемент Из успешного действия потока данных в действие Копирование . Действие Копирования будет выполняться только после успешного выполнения действия Потока данных .

    Снимок экрана: выполнение потока данных после действия копирования.

  2. Нажмите кнопку Сохранить , чтобы сохранить конвейер данных. Затем нажмите кнопку Выполнить , чтобы запустить конвейер данных и загрузить данные.

    Снимок экрана, на котором показано, где выбрать команду Сохранить и выполнить.

Планирование выполнения конвейера

Завершив разработку и тестирование конвейера, вы можете запланировать его автоматическое выполнение.

  1. На вкладке Главная окна редактора конвейера выберите Расписание.

    Снимок экрана: кнопка

  2. Настройте расписание по мере необходимости. В этом примере конвейер будет выполняться ежедневно в 20:00 до конца года.

    Снимок экрана: настройка расписания для ежедневного запуска конвейера в 20:00 до конца года.

Дальнейшие действия

В этом примере показано, как создать и настроить поток данных 2-го поколения, чтобы создать запрос на слияние и сохранить его в базе данных Azure SQL, а затем скопировать данные из базы данных в текстовый файл в Хранилище BLOB-объектов Azure. Вы ознакомились с выполнением следующих задач:

  • Создание потока данных.
  • Преобразование данных с помощью потока данных.
  • Создайте конвейер данных с помощью потока данных.
  • Упорядочение выполнения шагов в конвейере.
  • Копирование данных с помощью помощника по копированию.
  • Запустите и запланируйте конвейер данных.

Затем перейдите к дополнительным сведениям о мониторинге выполнения конвейера.