Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
OneLake — это единое, единое, логическое озеро данных для всей организации. Как и OneDrive, OneLake автоматически поставляется с каждым клиентом Microsoft Fabric и предназначен для единого места для всех данных аналитики.
OneLake приносит клиентам:
- Одно озеро данных для всей организации
- Одна копия данных для использования с несколькими аналитическими подсистемами
Одно озеро данных для всей организации
До OneLake многие организации создали несколько озер для разных бизнес-групп, что привело к дополнительным затратам на управление несколькими ресурсами. OneLake устраняет эти проблемы путем улучшения совместной работы:
- Каждый клиент Fabric автоматически получает один OneLake
- Невозможно создать несколько OneLakes или удалить OneLake
- Дополнительные ресурсы не требуются для настройки или управления
Эта простота помогает вашей организации совместно работать с одним унифицированным озером данных.
Управляется по умолчанию распределенным владением для совместной работы
Верхний уровень организации и управления данными Fabric — это клиент. Все данные, приземляющиеся в OneLake, автоматически защищаются политиками уровня клиента для обеспечения безопасности, соответствия требованиям и управления данными.
В среде арендатора совместная работа осуществляется в рабочих областях. Вы можете создать любое количество рабочих областей для упорядочивания данных. Рабочие области позволяют различным частям организации распространять политики владения и доступа. Каждое рабочее пространство является частью выделенного ресурса, привязанного к конкретному региону и оплачиваемого отдельно.
В рабочей области вы создаете и обращаетесь ко всем данным с помощью элементов данных. Аналогично тому, как Office хранит файлы Word, Excel и PowerPoint в OneDrive, Fabric хранит озера, склады и другие элементы в OneLake. Каждый тип элемента предоставляет специализированные возможности для разных типов пользователей, например, опыт разработчика Apache Spark в архитектуре lakehouse.
Основан на открытых стандартах и форматах
OneLake построен на основе Azure Data Lake Storage (ADLS) 2-го поколения и может поддерживать любой тип файла, структурированного или неструктурированного. Все элементы данных Fabric, такие как хранилища данных и озера, автоматически хранят данные в OneLake в формате Delta Parquet. Если инженер данных загружает данные в lakehouse с помощью Apache Spark, а затем разработчик SQL использует T-SQL для загрузки данных в полностью транзакционный хранилище данных, оба способствуют тому же озеру данных. OneLake сохраняет все табличные данные в формате Delta Parquet.
OneLake поддерживает те же API-интерфейсы ADLS 2-го поколения и пакеты SDK для совместимости с существующими приложениями ADLS 2-го поколения, включая Azure Databricks. Вы можете обращаться к данным в OneLake, как если бы это одна большая учетная запись хранения ADLS для всей организации. Каждая рабочая область отображается как контейнер в этой учетной записи хранения, а различные элементы данных отображаются как папки в этих контейнерах.
Дополнительные сведения об API и конечных точках см. в статье OneLake access and API. Примеры интеграции OneLake с Azure см. в статьях Azure Synapse Analytics, обозревателя службы хранилища Azure, Azure Databricks и Azure HDInsight .
Проводник OneLake для Windows
Вы можете в Windows просматривать данные OneLake с помощью проводника OneLake для Windows. Вы можете перемещаться по всем рабочим областям и элементам данных, легко загружать, загружать или изменять файлы так же, как и в Office. Обозреватель файлов OneLake упрощает работу с озерами данных, позволяя даже нетехническим бизнес-пользователям использовать их.
Дополнительные сведения см. в проводнике OneLake.
Одна копия данных
OneLake стремится обеспечить максимальное значение из одной копии данных без перемещения или дублирования данных. Вам не нужно копировать данные только для использования с другим механизмом или для анализа данных из нескольких источников.
Сочетания клавиш подключают данные между доменами без перемещения данных
Ярлык — это ссылка на данные, хранящиеся в других расположениях файлов. Эти расположения файлов могут находиться в одной рабочей области или в разных рабочих областях, внутри OneLake или вне OneLake, например ADLS, S3 или Dataverse. Независимо от расположения ярлыки делают файлы и папки похожими на то, что они хранятся локально.
Ярлыки позволяют организации совместно использовать данные между пользователями и приложениями без необходимости перемещать и дублировать информацию. Если команды работают независимо в отдельных рабочих областях, сочетания клавиш позволяют объединять данные между различными бизнес-группами и доменами в продукт виртуальных данных в соответствии с конкретными потребностями пользователя.
Дополнительные сведения об использовании сочетаний клавиш см. в разделе "Сочетания клавиш OneLake".
Подключение данных к нескольким аналитическим модулям
Данные часто оптимизированы для одного модуля, что затрудняет повторное использование одних и того же данных для нескольких приложений. В Fabric различные аналитические движки (T-SQL, Apache Spark, Analysis Services и другие) хранят данные в открытом формате Delta Parquet, чтобы позволить использовать одни и те же данные в нескольких движках.
Вам не нужно копировать данные только для использования с другим движком или быть привязанным к использованию определённого движка, так как там ваши данные. Например, представьте, что команда инженеров SQL создает полностью транзакционный хранилище данных. Они могут использовать подсистему T-SQL и все возможности T-SQL для создания таблиц, преобразования данных и загрузки данных в таблицы. Если дата-сайентист хочет использовать эти данные, ему не нужно использовать специальный драйвер Spark/SQL. OneLake сохраняет все данные в формате Delta Parquet. Специалист по обработке и анализу данных может использовать полную мощность подсистемы Spark и ее библиотек с открытым кодом непосредственно по данным.
Бизнес-пользователи могут создавать отчеты Power BI непосредственно на основе OneLake с помощью режима Direct Lake в подсистеме служб Analysis Services. Подсистема служб Analysis Services поддерживает семантические модели Power BI, и она всегда предлагает два режима доступа к данным: импорт и прямой запрос. Этот третий режим, режим Direct Lake, дает пользователям все скорость импорта без необходимости копировать данные, сочетая лучший из импорта и прямого запроса. Дополнительные сведения см. в разделе Direct Lake.
Дальнейшие шаги
Готовы начать работу с OneLake? Здесь описано, как приступить к работе.