Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В Microsoft Fabric архитектура lakehouse сочетает в себе масштабируемость озера данных с возможностями запроса хранилища данных. Вы храните структурированные и неструктурированные данные в одном расположении, управляете им с помощью Delta Lake и анализируете их с помощью Apache Spark и SQL — все без перемещения данных между системами. С помощью сочетаний клавиш OneLake и общего доступа к данным между клиентами можно также получить доступ к управляемым данным из внешних источников и других организаций без дублирования.
Лейкхаус дает вам:
- Одна копия данных для рабочих нагрузок данных инженерии и аналитики
- Формат Delta Lake для транзакций ACID, принудительного применения схемы и перемещения по времени
- Доступ к Spark и SQL, инженеры данных используют записные книжки, а аналитики используют T-SQL
- Встроенная интеграция с Power BI, конвейерами, потоками данных и другими элементами Fabric
Lakehouse и хранилище данных
Основные различия между озером данных и хранилищем данных data warehouse в Microsoft Fabric сводятся к предпочитаемым средствам разработки, типам данных и шаблонам рабочей нагрузки. Оба используют один и тот же механизм SQL и хранят данные в формате Delta в OneLake, но предназначены для различных сценариев:
| Lakehouse | Хранилище данных | |
|---|---|---|
| Основное средство разработки | Apache Spark (Python, Scala, SQL, R) | T-SQL |
| Типы данных | Структурированные и неструктурированные | Структурированный |
| Транзакции с несколькими таблицами | нет | Да |
| Прием данных | Записные книжки, конвейеры, потоки данных, сочетания клавиш OneLake (динамический доступ без копирования) | T-SQL (COPY INTO, INSERT, CTAS), конвейеры |
| лучше всего подходит для | Инженерия данных, наука о данных, медальные архитектуры | BI-отчеты, моделирование данных, команды, ориентированные на SQL |
Вы можете использовать оба в одной рабочей области — например, загрузить и преобразовать данные в лейкхаусе с помощью Spark, а затем предоставить упорядоченные наборы данных в хранилище для отчетов на основе SQL. Подробные инструкции см. в разделе "Выбор между хранилищем и Lakehouse".
Работа с данными Lakehouse
Вы можете загружать, преобразовывать и запрашивать данные в lakehouse с помощью нескольких средств Fabric:
Сочетания клавиш OneLake — доступ к данным из внешних источников (включая других клиентов через общий доступ к данным между клиентами) без копирования в lakehouse. Сочетания клавиш предоставляют динамические и доступные только для чтения ссылки на операционные и аналитические данные в OneLake. См. сочетания клавиш OneLake.
Обозреватель Lakehouse — просмотр таблиц и файлов, загрузка данных и управление метаданными непосредственно в браузере. Вы можете переключаться между представлением таблицы и представлением файлов и добавлять в обозреватель несколько озер. См. обозреватель "Fabric Lakehouse".
Notebooks — написание кода Spark (Python, Scala, SQL, R) для чтения, преобразования и записи данных в таблицы и папки Lakehouse. Изучите данные с помощью ноутбука и загрузите данные с помощью ноутбука.
Конвейеры — используйте действие копирования и другие средства интеграции данных для извлечения данных из внешних источников в lakehouse. См. статью "Копирование данных с помощью действия копирования".
Определения заданий в Spark — выполнение скомпилированных приложений Spark на Java, Scala или Python для промышленного ETL. См. Что такое определение задачи Apache Spark?
Потоки данных 2-го поколения — прием и подготовка данных с низким кодом, визуальным интерфейсом. См. статью "Создание первого потока данных".
Для полного сравнения вариантов загрузки см. раздел Варианты получения данных в Fabric Lakehouse.
Конечная точка SQL-аналитики для Lakehouse
При создании лейкхауса Fabric автоматически создает конечную точку SQL-аналитики. Эта конечная точка позволяет:
- Запрос к таблицам Delta с использованием T-SQL — используйте знакомый синтаксис SQL без необходимости настройки отдельного хранилища.
- Подключите Power BI напрямую — создайте семантическую модель Power BI для построения отчетов на данных Lakehouse.
- Общий доступ только для чтения . Аналитики и построители отчетов могут запрашивать данные, не затрагивая рабочие нагрузки Spark.
Заметка
С 5 сентября 2025 г. семантические модели по умолчанию больше не создаются автоматически при создании lakehouse. Существующие семантические модели по умолчанию были отделены от родительских элементов к 30 ноября 2025 года и стали независимыми семантическими моделями. Дополнительные сведения см. в разделе Power BI семантические модели в Microsoft Fabric.
Конечная точка аналитики SQL доступна только для чтения и не поддерживает полную поверхность T-SQL хранилища данных. Используйте его для изучения, создания отчетов и нерегламентированных запросов.
Заметка
В конечной точке аналитики SQL отображаются только разностные таблицы. К ним относятся таблицы Delta, доступные через ярлыки OneLake, которые видны и доступны для запросов вместе с локально хранимыми таблицами. Запросы к Parquet, CSV и другим форматам не могут выполняться через эту конечную точку. Если таблица не отображается, преобразуйте ее в разностный формат.
Автоматическое обнаружение и регистрация таблиц
Lakehouse организует данные в две папки верхнего уровня: Tables для управляемых таблиц Delta и Files для неструктурированных или не-Deltа данных. При добавлении файла в папку Tables Fabric автоматически:
- Проверяет файл в соответствии с поддерживаемыми форматами (в настоящее время только форматы Delta tables).
- Извлекает метаданные — имена столбцов, типы данных, сжатие и секционирование.
- Регистрирует таблицу в хранилище метаданных, чтобы сразу же запросить ее с помощью Spark SQL или T-SQL.
Это управляемое взаимодействие с файлами в таблицу означает, что вам не нужно создавать инструкции вручную для данных, которые вы помещаете CREATE TABLE в управляемую область.
Многозадачность с lakehouse
Lakehouse использует конструктор вкладок браузера, который позволяет открывать и переключаться между несколькими элементами, не теряя место:
Сохранение текущих операций: Данные продолжают загружаться и отправляться при переходе на другую вкладку.
Сохраните контекст: Выбранные таблицы, файлы и объекты остаются открытыми при переходе между вкладками.
Обновление списка без блокировки: Список файлов и таблиц обновляется в фоновом режиме, не прерывая вашу работу.
Уведомления с указанием источника: Всплывающие уведомления показывают, из какого Lakehouse они поступили, что позволяет отслеживать обновления во вкладках.
Доступный дизайн дома у озера
Lakehouse поддерживает вспомогательные технологии и доступные шаблоны взаимодействия.
- Совместимость средства чтения с экрана: Работает с популярными средствами чтения с экрана для навигации и взаимодействия.
- Альтернативный текст для изображений: Все изображения включают описательный замещающий текст.
- Форма с помеченными полями: Все поля формы имеют связанные метки для пользователей экранных дикторов и клавиатуры.
- Перетек текста: Адаптивный макет, который адаптируется к разным размерам экрана и ориентациям.
- Навигация по клавиатуре: Полная поддержка клавиатуры для навигации по озеру без мыши.