Получение данных из OneLake

Статья
05/21/2024

Из этой статьи вы узнаете, как получить данные из OneLake в новую или существующую таблицу.

Необходимые компоненты

Рабочая область с емкостью с поддержкой Microsoft Fabric
Лейкхаус
База данных KQL с разрешениями на редактирование

Копирование пути к файлу из Lakehouse

В переключателе интерфейса выберите Инжиниринг данных.
Выберите среду Lakehouse, содержащую источник данных, который вы хотите использовать.
Поместите курсор в нужный файл и выберите меню "Дополнительно", а затем выберите "Свойства".
Внимание
- Пути к папкам не поддерживаются.
- Подстановочные знаки (*) не поддерживаются.
В разделе URL-адрес выберите значок копирования в буфер обмена и сохраните его где-то, чтобы получить его на следующем шаге.
Вернитесь в рабочую область и выберите базу данных KQL.

Исходный код

На нижней ленте базы данных KQL выберите " Получить данные".

В окне "Получение данных" выбрана вкладка "Источник".
Выберите источник данных из доступного списка. В этом примере вы используете данные из OneLake.

Настройка

Выберите целевую таблицу. Если вы хотите принять данные в новую таблицу, нажмите кнопку +Создать таблицу и введите имя таблицы.

Примечание.

Имена таблиц могут содержать до 1024 символов, включая пробелы, буквенно-цифровые символы, дефисы и символы подчеркивания. Специальные символы не поддерживаются.
В файле OneLake вставьте путь к файлу Lakehouse, скопированный в путь к файлу копирования из Lakehouse.

Примечание.

Вы можете добавить до 10 элементов размером до 1 ГБ.
Выберите Далее.

Проверка

Откроется вкладка "Проверка " с предварительным просмотром данных.

Чтобы завершить процесс приема, нажмите кнопку Готово.

Необязательно.

Выберите средство просмотра команд, чтобы просмотреть и скопировать автоматические команды, созданные из входных данных.
Используйте раскрывающийся список файла определения схемы, чтобы изменить файл, из который выводится схема.
Измените автоматически выведенный формат данных, выбрав нужный формат из раскрывающегося списка. Дополнительные сведения см. в разделе "Форматы данных", поддерживаемые аналитикой в режиме реального времени.
Изменение столбцов.
Изучите дополнительные параметры на основе типа данных.

Изменить столбцы

Примечание.

Для табличных форматов (CSV, TSV, PSV) невозможно сопоставить столбец дважды. Чтобы сопоставить существующий столбец, сначала удалите новый столбец.
Нельзя изменить тип существующего столбца. При попытке выполнить сопоставление для столбца, имеющего другой формат, могут отобразиться пустые столбцы.

Изменения, которые вы можете внести в таблицу, зависят от следующих параметров:

Тип таблицы — новая или существующая.
Тип сопоставления — новое или существующее.

Тип таблицы	Тип сопоставления	Доступные корректировки
Новая таблица	Создать сопоставление	Переименование столбца, изменение типа данных, изменение источника данных, преобразование сопоставления, добавление столбца, удаление столбца
Существующая таблица	Создать сопоставление	Добавьте столбец (в котором можно изменить тип данных, переименовать и обновить)
Существующая таблица	Существующее сопоставление	ничего

Преобразования сопоставлений

Некоторые сопоставления форматов данных (Parquet, JSON и Avro) поддерживают простые преобразования во время приема. Чтобы применить преобразования сопоставления, создайте или обновите столбец в окне "Изменение столбцов ".

Преобразования сопоставления можно выполнять в столбце строки типа или даты и времени с источником с типом данных int или long. Поддерживаются следующие преобразования сопоставлений:

DateTimeFromUnixSeconds;
DateTimeFromUnixMilliseconds;
DateTimeFromUnixMicroseconds;
DateTimeFromUnixNanoseconds.

Дополнительные параметры на основе типа данных

Табличные (CSV, TSV, PSV):

При приеме табличных форматов в существующей таблице можно выбрать> схему расширенного сохранения таблицы. Табличные данные не обязательно включают имена столбцов, которые используются для сопоставления исходных данных с существующими столбцами. При проверке этого параметра сопоставление выполняется по порядку, а схема таблицы остается той же. Если этот параметр снят, для входящих данных создаются новые столбцы независимо от структуры данных.
Чтобы использовать первую строку в качестве имен столбцов, выберите "Дополнительно>первая строка" — заголовок столбца.

JSON:

Чтобы определить деление данных JSON, выберите расширенные>вложенные уровни от 1 до 100.
Если выбрать строки JSON расширенного>пропускания с ошибками, данные будут приема в формате JSON. Если этот флажок не выбран, данные будут приема в формате multijson.

Итоги

В окне подготовки данных все три шага помечаются зелеными флажками при успешном завершении приема данных. Вы можете выбрать карточку для запроса, удалить данные приема или просмотреть панель мониторинга сводки приема.

Поделиться через

Получение данных из OneLake

Необходимые компоненты

Копирование пути к файлу из Lakehouse

Исходный код

Настройка

Проверка

Изменить столбцы

Преобразования сопоставлений

Дополнительные параметры на основе типа данных

Итоги

Обратная связь

Обратная связь

Дополнительные ресурсы

Поделиться через

Получение данных из OneLake

Необходимые компоненты

Копирование пути к файлу из Lakehouse

Исходный код

Настройка

Проверка

Изменить столбцы

Преобразования сопоставлений

Дополнительные параметры на основе типа данных

Итоги

Связанный контент

Обратная связь

Обратная связь

Дополнительные ресурсы