Руководство по Lakehouse. Прием данных в lakehouse
В этом руководстве вы будете принимать дополнительные таблицы измерений и фактов из Wide World Importers (WWI) в lakehouse.
Важно!
Microsoft Fabric находится в предварительной версии.
Предварительные требования
Прием данных
В этом разделе вы используете действие Копирование данных конвейера Фабрики данных для приема примеров данных из учетной записи хранения Azure в раздел Файлы созданного ранее lakehouse.
Выберите созданную рабочую область во всплывающем окне Рабочая область слева. На странице рабочей области на кнопке +Создать выберите Конвейер данных.
В диалоговом окне Новый конвейер укажите имя IngestDataFromSourceToLakehouse и нажмите кнопку Создать. Создается и открывается новый конвейер фабрики данных.
В созданном конвейере фабрики данных выберите Добавить действие конвейера , чтобы добавить действие в конвейер, и выберите Копировать данные. Это добавит действие копирования данных на холст конвейера.
Выберите только что добавленное действие копирования данных на холсте. В нижней части отображаются свойства действия. На вкладке Общие укажите имя действия копирования данных Копирование данных в Lakehouse.
На вкладке Источник выбранного действия копирования данных выберите Внешнийтип хранилища данных , а затем нажмите + Создать , чтобы создать подключение к источнику данных.
В этом руководстве все примеры данных доступны в общедоступном контейнере хранилища BLOB-объектов Azure. Вы подключаетесь к этому контейнеру для копирования данных из него. В мастере создания подключения выберите Хранилище BLOB-объектов Azure, а затем нажмите кнопку Продолжить.
На следующем экране мастера создания подключения введите следующие сведения и нажмите кнопку Создать , чтобы создать подключение к источнику данных.
Свойство Значение Имя учетной записи или универсальный код ресурса (URI) https://azuresynapsestorage.blob.core.windows.net/sampledata
Подключение Создание подключения Имя соединения wwisampledata Тип проверки подлинности Анонимные После создания нового подключения вернитесь на вкладку Источник действия копирования данных, и созданное подключение будет выбрано по умолчанию. Перед переходом к целевым параметрам укажите следующие свойства.
Свойство Значение Тип хранилища данных External Подключение wwisampledata Тип пути к файлу Путь к файлу Путь к файлу Имя контейнера (первое текстовое поле): sampledata
Имя каталога (второе текстовое поле): WideWorldImportersDW/parquetРекурсивно Флажок установлен Формат файла Двоичные данные На вкладке Назначение выбранного действия копирования данных укажите следующие свойства:
Свойство Значение Тип хранилища данных Рабочая область Тип хранилища данных рабочей области Гибридное решение "хранилище и озеро данных" Гибридное решение "хранилище и озеро данных" wwilakehouse Корневая папка Файлы Путь к файлу Имя каталога (первое текстовое поле): wwi-raw-data Формат файла Двоичные данные Вы завершили настройку действия копирования данных. Нажмите кнопку Сохранить в разделе Главная , чтобы сохранить внесенные изменения, и нажмите кнопку Выполнить , чтобы выполнить конвейер и его действие. Вы также можете запланировать обновление данных через определенные интервалы конвейеров в соответствии с бизнес-требованиями. В этом руководстве мы запустим конвейер только один раз, нажав кнопку Выполнить .
Это запускает копирование данных из базового источника данных в указанный lakehouse и может занять до минуты. Вы можете отслеживать выполнение конвейера и его действия на вкладке Вывод , которая отображается при щелчке в любом месте холста. При необходимости можно щелкнуть значок очков, чтобы просмотреть сведения о передаче данных.
После копирования данных перейдите в представление элементов рабочей области и выберите wwilakehouse , чтобы запустить обозреватель Lakehouse для выбранного lakehouse.
Убедитесь, что в представлении обозревателя Lakehouse создана новая папка wwi-raw-data и скопированы данные для всех таблиц.
Дальнейшие действия
Перейдите к следующей статье, чтобы узнать о