Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этом руководстве вы загружаете больше измерений и фактов из Wide World Importers (WWI) в хранилище данных. Пайплайны позволяют обрабатывать данные в большом масштабе с возможностью планировать рабочие процессы с данными.
Предварительные условия
- Если у вас нет озера, необходимо создать озеро.
Прием данных
В этом разделе используйте активность копирования данных в конвейере Data Factory, чтобы импортировать образцы данных из учетной записи хранения Azure в раздел "Файлы"озера данных, созданного в предыдущем руководстве.
В рабочей области, созданной в предыдущем руководстве, выберите новый элемент.
В строке поиска найдите Pipeline и выберите элемент Pipeline.
В диалоговом окне "Создать конвейер" укажите имя в качестве IngestDataFromSourceToLakehouse и нажмите кнопку "Создать".
На вкладке «Главная» нового конвейера выберите «Активность конвейера»> и выберите «Копировать данные».
Выберите новое действие копирования данных на холсте. Свойства активности отображаются на панели под холстом, упорядоченные на разных вкладках, включая Общие, Источник, Назначение, Сопоставление и Параметры. Возможно, потребуется развернуть панель вверх, перетащив верхний край.
На вкладке "Общие " введите "Копирование данных в Lakehouse " в поле "Имя ". Оставьте другие поля значениями по умолчанию.
На вкладке "Источник" выберите раскрывающийся список "Подключение" и нажмите кнопку "Обзор всех".
На странице «Выбор источника данных для начала работы» найдите и выберите блобы Azure.
Введите следующие сведения на странице источника данных Connect . Затем нажмите кнопку "Подключиться ", чтобы создать подключение к источнику данных. В этом руководстве все примеры данных доступны в общедоступном контейнере хранилища BLOB-объектов Azure. Вы подключаетесь к этому контейнеру для копирования данных из него.
Свойство Значение Имя учетной записи или URL-адрес https://fabrictutorialdata.blob.core.windows.net/sampledata/Соединение Создание нового подключения Имя подключения wwisampledata Тип проверки подлинности Анонимные На вкладке "Источник " по умолчанию выбрано только что созданное соединение. Перед перемещением в параметры назначения укажите следующие свойства.
Свойство Значение Соединение wwisampledata Тип пути к файлу Путь к файлу Путь к файлу Имя контейнера (первое текстовое поле): sampledata
Имя каталога (второе текстовое поле): WideWorldImportersDW/parquetРекурсивно Проверено Формат файла Binary На вкладке "Назначение " укажите следующие свойства:
Свойство Значение Соединение wwilakehouse (выберите свой lakehouse, если вы назвали его по-другому) Корневая папка Files Путь к файлу Имя каталога (первое текстовое поле): wwi-raw-data Формат файла Binary Вы настроили действие копирования данных. Щелкните значок "Сохранить " на верхней ленте (ниже "Главная"), чтобы сохранить изменения, и нажмите кнопку "Выполнить ", чтобы выполнить конвейер и его действие. Вы также можете запланировать конвейеры для обновления данных в определенных интервалах в соответствии с вашими бизнес-требованиями. В этом руководстве мы запускаем конвейер только один раз, нажав кнопку "Выполнить".
Это действие инициирует копирование данных из исходного источника в указанное хранилище данных и может занять до минуты. Вы можете отслеживать выполнение конвейера и его активность на вкладке "Выходные данные". Состояние активности изменяется с Ожидается>В процессе>Успешно завершено.
Подсказка
Выберите Просмотреть сведения о запуске, чтобы увидеть дополнительную информацию о выполнении.
После успешного выполнения действия копирования откройте lakehouse (wwilakehouse) и просмотрите данные. Обновите раздел "Файлы", чтобы увидеть загруженные данные. В разделе файлов отображается новая папка wwi-raw-data , а данные из таблиц BLOB-объектов Azure копируются там.
Чтобы загрузить инкрементальные данные в lakehouse, см. Инкрементальная загрузка данных из хранилища данных в lakehouse.