Прием данных в хранилище с помощью конвейеров данных

Область применения: хранилище в Microsoft Fabric

Конвейеры данных предлагают альтернативу использованию команды COPY через графический пользовательский интерфейс. Конвейер данных — это логическая группировка действий, которые вместе выполняют задачу приема данных. Конвейеры позволяют управлять действиями извлечения, преобразования и загрузки (ETL), а не управлять каждым из них по отдельности.

В этом руководстве вы создадите новый конвейер, который загружает примеры данных в хранилище в Microsoft Fabric.

Примечание.

Некоторые функции из Фабрика данных Azure недоступны в Microsoft Fabric, но концепции взаимозаменяемы. Дополнительные сведения о Фабрика данных Azure и конвейерах в конвейерах и действиях см. в Фабрика данных Azure и Azure Synapse Analytics. Краткое руководство см. в кратком руководстве . Создание первого конвейера для копирования данных.

Создание конвейера данных

  1. Чтобы создать конвейер, перейдите к рабочей области, нажмите кнопку +Создать и выберите конвейер данных. Screenshot of the top section of the user's workspace showing the New button, and with the options Warehouse, Data pipeline, and Show All.

  2. В диалоговом окне "Создать конвейер" укажите имя нового конвейера и нажмите кнопку "Создать".

  3. Вы перейдете в область холста конвейера, где вы увидите три варианта начала работы: добавление действия конвейера, копирование данных и выбор задачи для запуска.

    Screenshot showing the three options to select for starting ingestion.

    Каждый из этих вариантов предлагает различные альтернативные варианты для создания конвейера:

    • Добавление действия конвейера: этот параметр запускает редактор конвейера, где можно создавать новые конвейеры с нуля с помощью действий конвейера.
    • Копирование данных: этот параметр запускает пошаговые помощник, помогающие выбрать источник данных, назначение и настроить параметры загрузки данных, такие как сопоставления столбцов. При завершении создается новое действие конвейера с задачей копирования данных, уже настроенной для вас.
    • Выберите задачу для запуска: этот параметр запускает набор предопределенных шаблонов, которые помогут вам приступить к работе с конвейерами на основе различных сценариев.

    Выберите параметр "Копировать данные", чтобы запустить помощник копирования.

  4. Первая страница помощник копирования данных помогает выбрать собственные данные из различных источников данных или выбрать один из предоставленных примеров, чтобы приступить к работе. В этом руководстве мы будем использовать пример COVID-19 Data Lake . Выберите этот параметр и нажмите кнопку "Далее".

    Screenshot showing choices to use sample data or other data sources.

  5. На следующей странице можно выбрать набор данных, формат исходного файла и просмотреть выбранный набор данных. Выберите Bing COVID-19, формат CSV и нажмите кнопку "Далее".

    Screenshot showing different dataset options for the COVID-19 sample, file formats, and a grid showing a preview of the data.

  6. На следующей странице назначения данных можно настроить тип целевой рабочей области. Мы загрузим данные в хранилище в нашей рабочей области, поэтому выберите вкладку "Хранилище" и параметр "Хранилище данных". Выберите Далее.

    Screenshot showing different destination options.

  7. Теперь пришло время выбрать хранилище для загрузки данных. Выберите требуемое хранилище в раскрывающемся списке и нажмите кнопку "Далее".

    Screenshot showing a dropdown list with a warehouse selected.

  8. Последним шагом настройки назначения является указание имени целевой таблицы и настройка сопоставлений столбцов. Здесь можно загрузить данные в новую таблицу или в существующую, указать имена схем и таблиц, изменить имена столбцов, удалить столбцы или изменить их сопоставления. Вы можете принять значения по умолчанию или настроить параметры в соответствии с вашими предпочтениями.

    Screenshot showing the options to load data to an existing table or to create a new one.

    После завершения проверки параметров нажмите кнопку "Далее".

  9. На следующей странице вы можете использовать промежуточный режим или предоставить дополнительные параметры для операции копирования данных (которая использует команду T-SQL COPY). Просмотрите параметры без их изменения и нажмите кнопку "Далее".

  10. Последняя страница в помощник содержит сводку действия копирования. Выберите параметр "Запустить передачу данных немедленно " и нажмите кнопку "Сохранить и запустить".

    Screenshot showing the option to start the data transfer operation immediately, and the buttons Back and Save + Run.

  11. Вы направляетесь в область холста конвейера, где для вас уже настроено новое действие копирования данных. Конвейер запускается автоматически. Состояние конвейера можно отслеживать в области вывода :

    Screenshot showing the pipeline canvas with a Copy activity in the center, and the pipeline execution status showing the current status In progress.

  12. Через несколько секунд конвейер успешно завершится. Переход к хранилищу позволяет выбрать таблицу для предварительного просмотра данных и убедиться, что операция копирования завершена.

    Screenshot showing a warehouse with the bing_covid_19 table selected, and a grid showing a preview of the data in the table.

Дополнительные сведения о приеме данных в хранилище в Microsoft Fabric см. в следующих целях:

Следующий шаг