Поделиться через


Узнайте, как создать задание копирования в Фабрике данных для Microsoft Fabric

Задание копирования в фабрике данных упрощает перемещение данных из источника в место назначения без создания конвейера. Вы можете настроить передачу данных с помощью встроенных шаблонов для пакетной и добавочной копии, а также копировать один раз или по расписанию. Выполните действия, описанные в этой статье, чтобы начать копирование данных из базы данных или из хранилища.

Создайте задание копирования для загрузки данных из базы данных

Выполните следующие действия, чтобы настроить задание копирования, которое перемещает данные из базы данных:

  1. Создайте новую рабочую область или используйте существующую рабочую область.

  2. Выберите +Создать элемент, щелкните значок "Копировать задание ", назовите задание копирования и нажмите кнопку "Создать".

    Снимок экрана, показывающий, куда перейти на главную страницу Data Factory и создать новое задание на копирование.

  3. Выберите базу данных для копирования данных. В этом примере мы используем базу данных SQL Azure.

    Снимок экрана: выбор источника данных для задания копирования.

  4. Для базы данных SQL Azure введите путь к серверу и учетные данные. Вы можете безопасно копировать данные в среде виртуальной сети с помощью локального или шлюза виртуальной сети. Для других баз данных сведения о подключении будут отличаться.

    Снимок экрана: место ввода учетных данных.

  5. Выберите таблицы и столбцы для копирования. Используйте поле поиска для определения определенных таблиц и столбцов, которые требуется скопировать.

    Снимок экрана: выбор таблиц и столбцов для задания копирования.

  6. Выберите целевое хранилище. В этом примере мы используем другую базу данных SQL Azure.

    Снимок экрана, показывающий, где выбрать целевое хранилище для задания копирования.

  7. (Необязательно) Выберите метод Update , чтобы решить, как данные записываются в место назначения. Если выбрать слияние, выберите ключевые столбцы, определяющие каждую строку.

    Снимок экрана: место обновления метода.

    Снимок экрана: обновление метода.

  8. (Необязательно) Настройте сопоставление таблиц или столбцов, чтобы переименовать таблицы или столбцы в месте назначения либо применить преобразования типов данных. По умолчанию данные копируются с тем же именем таблицы, именем столбца и типом данных, что и источник.

    Снимок экрана: место указания сопоставлений таблиц.

    Снимок экрана: место указания сопоставлений столбцов.

  9. Выберите режим копирования: полная копия данных или добавочная копия. В этом примере мы используем инкрементную копию. Выберите добавочный столбец для каждой таблицы, чтобы отслеживать, какие строки были изменены. Для поиска правого столбца можно использовать кнопку предварительного просмотра. Дополнительные сведения об этом столбце см. в разделе " Добавочный столбец".

    Примечание.

    При выборе режима добавочного копирования задание копирования изначально выполняет полную нагрузку и выполняет добавочные копии в следующих запусках.

    Снимок экрана: место для выбора режима задания копирования.

  10. Просмотрите сводку задания, выберите вариант запуска один раз или по расписанию и нажмите кнопку "Сохранить и запустить".

    Снимок экрана: место для просмотра и сохранения только что созданного задания копирования.

  11. Задание копирования начнется немедленно, и вы можете отслеживать состояние задания из встроенной панели мониторинга с информацией, включая количество строк и длительность копирования для каждой таблицы. Узнайте больше о мониторинге задания копирования

    Снимок экрана: панель заданий копирования, в которой можно отслеживать журнал выполнения.

  12. Задание копирования можно запускать всякий раз, даже если оно настроено на выполнение по расписанию. Просто нажмите кнопку "Запустить " в любое время, и задание копирования копирует только измененные данные с момента последнего запуска.

  13. Вы также можете редактировать задание копирования в любое время, включая добавление или удаление таблиц и столбцов для копирования, настройки расписания или настройки дополнительных параметров. Некоторые изменения, такие как обновление добавочного столбца, сбрасывают инкрементальную копию, чтобы начать с начальной полной загрузки в следующем запуске.

    Снимок экрана, показывающий как редактировать задачу копирования.

Создайте задачу копирования для импорта файлов из хранилища данных

Выполните следующие действия, чтобы настроить задание копирования, которое перемещает данные из хранилища файлов:

  1. Создайте новую рабочую область или используйте существующую рабочую область.

  2. Выберите +Создать элемент, щелкните значок "Копировать задание ", назовите задание копирования и нажмите кнопку "Создать".

    Снимок экрана, показывающий, куда перейти на главную страницу Data Factory и создать новое задание на копирование.

  3. Выберите хранилища данных для копирования данных. В этом примере мы использовали Azure Data Lake Storage 2-го поколения.

    Снимок экрана: выбор источника хранилища для задания копирования.

  4. Чтобы подключиться к Azure Data Lake Storage 2-го поколения, введите URL-адрес хранилища и учетные данные для подключения к Azure Data Lake Storage 2-го поколения. Для других хранилищ данных сведения о подключении будут отличаться. Вы можете безопасно копировать данные в среде виртуальной сети с помощью локального или шлюза виртуальной сети.

    Снимок экрана: место ввода учетных данных для хранилища.

  5. Выберите папку или файлы для копирования. Вы можете скопировать всю папку со всеми его файлами или один файл.

    Подсказка

    Не зависящая от схемы (двоичная копия) копирует файлы в другое хранилище данных, не анализируя схему. Это может значительно повысить производительность копирования.

    Снимок экрана, показывающий, где выбрать папку для задания копирования.

  6. Выберите целевое хранилище. В этом примере мы выбрали Lakehouse.

    Снимок экрана, показывающий, где выбрать целевое хранилище хранилища для задания копирования.

  7. Выберите путь к папке в целевом хранилище. Выберите "Сохранить иерархию ", чтобы сохранить ту же структуру папок, что и исходная, или "Плоская иерархия ", чтобы поместить все файлы в одну папку.

    Снимок экрана: выбор целевой папки.

  8. Выберите режим копирования: полная копия данных или добавочная копия. В этом примере мы используем добавочную копию , чтобы задание копирования копировать все файлы при первом запуске, а затем копировать только новые или обновленные файлы в следующих запусках.

    Снимок экрана: выбор режима задания копирования для хранилища.

  9. Просмотрите сводку задания, выберите вариант запуска один раз или по расписанию и нажмите кнопку "Сохранить и запустить".

    Снимок экрана, где можно просмотреть и сохранить вновь созданную задачу копирования в хранилище.

  10. Задание копирования начнется немедленно, и вы можете отслеживать состояние задания из встроенной панели мониторинга с информацией, включая количество строк и длительность копирования для каждой таблицы. Узнайте больше о мониторинге задания копирования

    Снимок экрана: панель заданий копирования, в которой можно отслеживать журнал выполнения для перемещения данных между хранилищем.

  11. Вы можете повторно запустить задание копирования в любое время, даже если оно запланировано выполняться по расписанию. Просто нажмите кнопку "Запустить " в любое время, и задание копирования копирует только измененные данные с момента последнего запуска.

  12. Вы также можете изменить задание копирования в любое время, включая настройку расписания или настройку дополнительных параметров.

    Снимок экрана, показывающий, как изменить задачу копирования данных для хранилища данных.

Известные ограничения