Параметры для получения данных в Fabric Lakehouse

Интерфейс получения данных охватывает все пользовательские сценарии для переноса данных в lakehouse, например:

  • Подключение к существующей SQL Server и копирование данных в разностную таблицу в lakehouse.
  • Отправка файлов с компьютера.
  • Копирование и слияние нескольких таблиц из других lakehouses в новую разностную таблицу.
  • Подключение к источнику потоковой передачи для отправки данных в lakehouse.
  • Ссылки на данные без копирования из других внутренних озерных домов или внешних источников.

Важно!

Microsoft Fabric находится в предварительной версии.

Различные способы загрузки данных в Lakehouse

В Microsoft Fabric существует несколько способов получения данных в lakehouse.

  • Отправка файлов с локального компьютера.
  • Запустите средство копирования в конвейерах.
  • Настройка потока данных.
  • Библиотеки Apache Spark в коде записной книжки

Отправка локального файла

Вы также можете отправлять данные, хранящиеся на локальном компьютере. Вы можете сделать это непосредственно в lakehouse explorer.

Снимок экрана: диалоговое окно отправки файлов в Обозреватель Lakehouse.

Средство копирования в конвейерах

Средство копирования — это высокомасштабируемое решение Интеграция данных, которое позволяет подключаться к разным источникам данных и загружать данные в исходном формате или преобразовывать их в разностную таблицу. Средство копирования является частью действий конвейеров, которые можно оркестрировать несколькими способами, такими как планирование или активация на основе события. См. раздел Копирование данных с помощью действия копирования.

Потоки данных

Для пользователей, знакомых с потоками данных Power BI, доступно одно и то же средство для получения данных в Lakehouse. Вы можете быстро получить к нему доступ из обозревателя Lakehouse "Получить данные" и данные о земле из более чем 200 соединителей. См. статью Создание первого потока данных для получения и преобразования данных.

Код записной книжки

Доступные библиотеки Spark можно использовать для прямого подключения к источнику данных, загрузки данных в кадр данных, а затем их сохранения в lakehouse. Это самый открытый способ загрузки данных в lakehouse, которыми полностью управляет пользовательский код.

Примечание

Внешние разностные таблицы, созданные с помощью кода Spark, не будут видны конечной точке SQL. Используйте сочетания клавиш в пространстве таблиц, чтобы внешние разностные таблицы отображались для конечной точки SQL.

Рекомендации при выборе подхода к загрузке данных

Вариант использования Рекомендация
Отправка небольших файлов с локального компьютера Использование отправки локальных файлов
Небольшие данные или определенный соединитель Использование потоков данных
Большой источник данных Использование средства копирования в конвейерах
Сложные преобразования данных Использование кода записной книжки

Дальнейшие действия