Что такое озёрный дом в Microsoft Fabric?

В Microsoft Fabric архитектура lakehouse сочетает в себе масштабируемость озера данных с возможностями запроса хранилища данных. Вы храните структурированные и неструктурированные данные в одном расположении, управляете им с помощью Delta Lake и анализируете их с помощью Apache Spark и SQL — все без перемещения данных между системами. С помощью сочетаний клавиш OneLake и общего доступа к данным между клиентами можно также получить доступ к управляемым данным из внешних источников и других организаций без дублирования.

Лейкхаус дает вам:

  • Одна копия данных для рабочих нагрузок данных инженерии и аналитики
  • Формат Delta Lake для транзакций ACID, принудительного применения схемы и перемещения по времени
  • Доступ к Spark и SQL, инженеры данных используют записные книжки, а аналитики используют T-SQL
  • Встроенная интеграция с Power BI, конвейерами, потоками данных и другими элементами Fabric

Lakehouse и хранилище данных

Основные различия между озером данных и хранилищем данных data warehouse в Microsoft Fabric сводятся к предпочитаемым средствам разработки, типам данных и шаблонам рабочей нагрузки. Оба используют один и тот же механизм SQL и хранят данные в формате Delta в OneLake, но предназначены для различных сценариев:

Lakehouse Хранилище данных
Основное средство разработки Apache Spark (Python, Scala, SQL, R) T-SQL
Типы данных Структурированные и неструктурированные Структурированный
Транзакции с несколькими таблицами нет Да
Прием данных Записные книжки, конвейеры, потоки данных, сочетания клавиш OneLake (динамический доступ без копирования) T-SQL (COPY INTO, INSERT, CTAS), конвейеры
лучше всего подходит для Инженерия данных, наука о данных, медальные архитектуры BI-отчеты, моделирование данных, команды, ориентированные на SQL

Вы можете использовать оба в одной рабочей области — например, загрузить и преобразовать данные в лейкхаусе с помощью Spark, а затем предоставить упорядоченные наборы данных в хранилище для отчетов на основе SQL. Подробные инструкции см. в разделе "Выбор между хранилищем и Lakehouse".

Работа с данными Lakehouse

Вы можете загружать, преобразовывать и запрашивать данные в lakehouse с помощью нескольких средств Fabric:

Для полного сравнения вариантов загрузки см. раздел Варианты получения данных в Fabric Lakehouse.

Конечная точка SQL-аналитики для Lakehouse

При создании лейкхауса Fabric автоматически создает конечную точку SQL-аналитики. Эта конечная точка позволяет:

  • Запрос к таблицам Delta с использованием T-SQL — используйте знакомый синтаксис SQL без необходимости настройки отдельного хранилища.
  • Подключите Power BI напрямую — создайте семантическую модель Power BI для построения отчетов на данных Lakehouse.
  • Общий доступ только для чтения . Аналитики и построители отчетов могут запрашивать данные, не затрагивая рабочие нагрузки Spark.

Заметка

С 5 сентября 2025 г. семантические модели по умолчанию больше не создаются автоматически при создании lakehouse. Существующие семантические модели по умолчанию были отделены от родительских элементов к 30 ноября 2025 года и стали независимыми семантическими моделями. Дополнительные сведения см. в разделе Power BI семантические модели в Microsoft Fabric.

Конечная точка аналитики SQL доступна только для чтения и не поддерживает полную поверхность T-SQL хранилища данных. Используйте его для изучения, создания отчетов и нерегламентированных запросов.

Заметка

В конечной точке аналитики SQL отображаются только разностные таблицы. К ним относятся таблицы Delta, доступные через ярлыки OneLake, которые видны и доступны для запросов вместе с локально хранимыми таблицами. Запросы к Parquet, CSV и другим форматам не могут выполняться через эту конечную точку. Если таблица не отображается, преобразуйте ее в разностный формат.

Автоматическое обнаружение и регистрация таблиц

Lakehouse организует данные в две папки верхнего уровня: Tables для управляемых таблиц Delta и Files для неструктурированных или не-Deltа данных. При добавлении файла в папку Tables Fabric автоматически:

  • Проверяет файл в соответствии с поддерживаемыми форматами (в настоящее время только форматы Delta tables).
  • Извлекает метаданные — имена столбцов, типы данных, сжатие и секционирование.
  • Регистрирует таблицу в хранилище метаданных, чтобы сразу же запросить ее с помощью Spark SQL или T-SQL.

Это управляемое взаимодействие с файлами в таблицу означает, что вам не нужно создавать инструкции вручную для данных, которые вы помещаете CREATE TABLE в управляемую область.

Многозадачность с lakehouse

Lakehouse использует конструктор вкладок браузера, который позволяет открывать и переключаться между несколькими элементами, не теряя место:

  • Сохранение текущих операций: Данные продолжают загружаться и отправляться при переходе на другую вкладку.

  • Сохраните контекст: Выбранные таблицы, файлы и объекты остаются открытыми при переходе между вкладками.

  • Обновление списка без блокировки: Список файлов и таблиц обновляется в фоновом режиме, не прерывая вашу работу.

  • Уведомления с указанием источника: Всплывающие уведомления показывают, из какого Lakehouse они поступили, что позволяет отслеживать обновления во вкладках.

Доступный дизайн дома у озера

Lakehouse поддерживает вспомогательные технологии и доступные шаблоны взаимодействия.

  • Совместимость средства чтения с экрана: Работает с популярными средствами чтения с экрана для навигации и взаимодействия.
  • Альтернативный текст для изображений: Все изображения включают описательный замещающий текст.
  • Форма с помеченными полями: Все поля формы имеют связанные метки для пользователей экранных дикторов и клавиатуры.
  • Перетек текста: Адаптивный макет, который адаптируется к разным размерам экрана и ориентациям.
  • Навигация по клавиатуре: Полная поддержка клавиатуры для навигации по озеру без мыши.