Копирование данных с помощью действия копирования

В конвейере данных можно использовать действие Copy для копирования данных между хранилищами данных, расположенными в облаке.

Важно!

Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эта информация относится к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении информации, представленной здесь. См. Фабрика данных Azure документацию по службе в Azure.

После копирования данных можно использовать другие действия для дальнейшего преобразования и анализа. С помощью действия копирования можно также публиковать результаты преобразования и анализа для бизнес-аналитики и использования приложения.

Чтобы скопировать данные из источника в место назначения, служба, запускающая действие Copy, выполняет следующие действия:

  1. Считывает данные из источника данных.
  2. Выполняет сериализацию или десериализацию, сжатие или распаковку, сопоставление столбцов и т. д. Эти операции выполняются на основе конфигурации.
  3. Записывает данные в целевое хранилище данных.

Предварительные требования

Чтобы приступить к работе, необходимо выполнить следующие предварительные требования:

  • Учетная запись клиента Microsoft Fabric с активной подпиской. Создайте учетную запись бесплатно.

  • Убедитесь, что у вас есть рабочая область с поддержкой Microsoft Fabric.

Добавление действия копирования с помощью помощника по копированию

Выполните следующие действия, чтобы настроить действие копирования с помощью помощника по копированию.

Начало работы с помощником по копированию

  1. Откройте существующий конвейер данных или создайте новый конвейер данных.

  2. Выберите Копировать данные на холсте, чтобы открыть помощник по копированию для начала работы. Или выберите Использовать помощник по копированию в раскрывающемся списке Копировать данные на вкладке Действия на ленте.

    Снимок экрана: параметры для открытия помощника по копированию.

Настройка источника

  1. Выберите тип источника данных из категории. В качестве примера вы будете использовать Хранилище BLOB-объектов Azure. Выберите Хранилище BLOB-объектов Azure и нажмите кнопку Далее.

    Снимок экрана выбора источника данных.

    Снимок экрана, показывающий, где выбрать правильный источник данных.

  2. Создайте подключение к источнику данных, выбрав Создать подключение.

    Снимок экрана: выбор нового подключения.

    Выбрав Создать подключение, введите необходимые сведения о подключении и нажмите кнопку Далее. Дополнительные сведения о создании подключения для каждого типа источника данных см. в статье о каждом соединителе.

    Если у вас есть существующие подключения, можно выбрать Существующее подключение и выбрать подключение в раскрывающемся списке.

    Снимок экрана: существующее подключение.

  3. Выберите файл или папку для копирования на этом шаге настройки источника, а затем нажмите кнопку Далее.

    Снимок экрана, показывающий, где выбрать данные для копирования.

Настройка назначения

  1. Выберите тип источника данных из категории. В качестве примера вы будете использовать Хранилище BLOB-объектов Azure. Выберите Хранилище BLOB-объектов Azure, а затем нажмите кнопку Далее.

    Снимок экрана: выбор Хранилище BLOB-объектов Azure.

  2. Вы можете создать новое подключение, которое ссылается на новую учетную запись Хранилище BLOB-объектов Azure, выполнив действия, описанные в предыдущем разделе, или использовать существующее подключение из раскрывающегося списка подключений. Для каждого выбранного подключения доступны возможности Test connection (Проверить подключение ) и Edit (Изменить ).

    Снимок экрана: параметры подключения к данным.

  3. Настройте и сопоставьте исходные данные с назначением. Затем нажмите кнопку Далее , чтобы завершить настройку назначения.

    Снимок экрана: экран

    Снимок экрана: подключение к назначению данных.

Просмотр и создание действия копирования

  1. Просмотрите параметры действия копирования на предыдущих шагах и нажмите кнопку ОК , чтобы завершить. Вы также можете вернуться к предыдущим шагам, чтобы при необходимости изменить параметры в средстве.

    Снимок экрана: экран проверки и создания.

После завершения действия копирования будет добавлено на холст конвейера данных. Все параметры, включая дополнительные параметры для этого действия копирования, доступны на вкладках при его выборе.

Снимок экрана: действие копирования на холсте конвейера данных.

Теперь вы можете сохранить конвейер данных с помощью этого однократного действия копирования или продолжить проектирование конвейера данных.

Добавление действия копирования напрямую

Выполните следующие действия, чтобы добавить действие копирования напрямую.

Добавление действия копирования

  1. Откройте существующий конвейер данных или создайте новый конвейер данных.

  2. Добавьте действие копирования, выбрав Добавить действие>конвейера действие Copy или выбрав Копировать данные>Добавить на холст на вкладке Действия.

    Снимок экрана: два способа добавления действия копирования.

Настройка общих параметров на вкладке "Общие"

Сведения о настройке общих параметров см. в разделе Общие.

Настройка источника на вкладке "Источник"

  1. Выберите + Создать рядом с элементом Подключение , чтобы создать подключение к источнику данных.

    Снимок экрана, показывающий, где нажать кнопку Создать.

    1. Выберите тип источника данных во всплывающем окне. В качестве примера вы будете использовать базу данных Azure SQL. Выберите База данных SQL Azure и нажмите кнопку Продолжить.

      Снимок экрана: выбор источника данных.

    2. Он перейдет на страницу создания подключения. Введите необходимые сведения о подключении на панели и нажмите кнопку Создать. Дополнительные сведения о создании подключения для каждого типа источника данных см. в статье о каждом соединителе.

      Снимок экрана: страница

    3. После успешного создания подключения вы вернелись на страницу конвейера данных. Затем выберите Обновить , чтобы получить созданное подключение из раскрывающегося списка. Вы также можете выбрать существующее подключение к базе данных Azure SQL в раскрывающемся списке, если вы уже создали его ранее. Для каждого выбранного подключения доступны возможности Test connection (Проверить подключение ) и Edit (Изменить ). Затем выберите Azure SQL База данных в поле Тип подключения.

      Снимок экрана: место обновления подключения.

  2. Укажите таблицу для копирования. Выберите Предварительный просмотр данных , чтобы просмотреть исходную таблицу. Вы также можете использовать запрос и хранимую процедуру для чтения данных из источника.

    Снимок экрана: параметры исходной таблицы.

  3. Разверните раздел Дополнительно , чтобы получить дополнительные параметры.

    Снимок экрана: параметр

Настройка назначения на вкладке назначения

  1. Выберите тип назначения. Это может быть внутреннее хранилище данных первого класса из рабочей области, например Lakehouse, или внешние хранилища данных. В качестве примера вы будете использовать Lakehouse.

    Снимок экрана: выбор типа назначения.

  2. Выберите использование Lakehouse в типе хранилища данных рабочей области. Выберите + Создать, и вы перейдете на страницу создания Lakehouse. Укажите имя Lakehouse и нажмите кнопку Создать.

    Снимок экрана: создание Lakehouse.

  3. После успешного создания подключения вы вернееесь на страницу конвейера данных. Затем выберите Обновить , чтобы получить подключение, созданное из раскрывающегося списка. Вы также можете выбрать существующее подключение Lakehouse непосредственно из раскрывающегося списка, если вы уже создали его ранее.

    Снимок экрана: выбор подключения.

  4. Укажите таблицу или настройте путь к файлу, чтобы определить файл или папку в качестве места назначения. Здесь выберите Таблицы и укажите таблицу для записи данных.

    Снимок экрана, показывающий, где найти параметры таблицы.

  5. Разверните раздел Дополнительно , чтобы получить дополнительные параметры.

    Снимок экрана: дополнительные параметры.

Теперь вы можете сохранить конвейер данных с помощью одного действия копирования или продолжить проектирование конвейера данных.

Настройка сопоставлений на вкладке "Сопоставление"

Если применяемый соединитель поддерживает сопоставление, перейдите на вкладку Сопоставление , чтобы настроить сопоставление.

  1. Выберите Импорт схем, чтобы импортировать схему данных.

    Снимок экрана: параметры сопоставления 1.

  2. Вы увидите, что отображается автоматическое сопоставление. Укажите исходный столбец и целевой столбец. Если вы создаете новую таблицу в назначении, вы можете настроить имя столбца назначения здесь. Если вы хотите записать данные в существующую целевую таблицу, изменить имя существующего целевого столбца нельзя. Вы также можете просмотреть тип исходных и целевых столбцов.

    Снимок экрана: параметры сопоставления 2.

Кроме того, можно выбрать + Новое сопоставление , чтобы добавить новое сопоставление, выбрать Очистить , чтобы очистить все параметры сопоставления, и сбросить , чтобы сбросить все исходные столбцы сопоставления.

Настройка преобразования типов

Разверните раздел Параметры преобразования типов , чтобы при необходимости настроить преобразование типов.

Снимок экрана: преобразование типа сопоставления.

Сведения о параметрах см. в следующей таблице.

Параметр Описание
Разрешить усечение данных Разрешить усечение данных при преобразовании исходных данных в место назначения с другим типом во время копирования. Например, от десятичного до целого числа, от DatetimeOffset до Datetime.
Рассматривать логическое значение как число Рассматривайте логическое значение как число. Например, сработайте значение true как 1.
Формат даты и времени Форматирование строки при преобразовании между датами без смещения часового пояса и строк. Например, "гггг-ММ-дд ЧЧ:мм:сс.fff".
Формат DateTimeOffset Форматирование строки при преобразовании между датами со смещением часового пояса и строками. Например, "гггг-ММ-дд ЧЧ:мм:сс.fff zzz".
Формат TimeSpan Форматирование строки при преобразовании между периодами времени и строками. Например, "dd.hh:mm:ss".
Язык и региональные параметры Сведения о языке и региональных параметрах, используемые при преобразовании типов. Например, "en-us", "fr-fr".

Настройка других параметров на вкладке "Параметры"

Вкладка Параметры содержит параметры производительности, промежуточного хранения и т. д.

Снимок экрана: вкладка

Описание каждого параметра см. в следующей таблице.

Параметр Описание
Интеллектуальная оптимизация пропускной способности Укажите для оптимизации пропускной способности. Можно выбрать одно из следующих значений.
Авто
Стандартный
Сбалансированный
Максимальное значение
При выборе параметра Автоматически оптимальный параметр применяется динамически в зависимости от пары "источник-назначение" и шаблона данных. Вы также можете настроить пропускную способность, а пользовательское значение может быть от 2 до 256, в то время как большее значение подразумевает большую выгоду.
Степень параллелизма копирования Укажите степень параллелизма, которую будет использовать загрузка данных.
Отказоустойчивость При выборе этого параметра можно игнорировать некоторые ошибки, возникшие в процессе копирования. Например, несовместимые строки между исходным и целевым хранилищем, удаление файла во время перемещения данных и т. д.
Включение ведения журналов При выборе этого параметра можно записывать скопированные файлы, пропущенные файлы и строки.
Включить промежуточный режим Укажите, следует ли копировать данные через промежуточное хранилище. Включите промежуточное хранение только для полезных сценариев.
Подключение к промежуточной учетной записи При выборе параметра Включить промежуточное хранение укажите подключение к источнику данных службы хранилища Azure в качестве промежуточного хранилища. Выберите + Создать , чтобы создать промежуточное подключение, если у вас его нет.

Дальнейшие действия