Поделиться через


Что такое автомасштабирование Lakebase?

Это важно

Автомасштабирование Lakebase находится в бета-версии в следующих регионах: eastus2, , westeuropewestus.

Автомасштабирование Lakebase — это последняя версия Lakebase с автомасштабированием вычислений, масштабированием до нуля, ветвлением и мгновенным восстановлением. Сравнение функций с Lakebase Provisioned см. в разделе выбора между версиями.

Автомасштабирование Lakebase Postgres — это полностью управляемая база данных Postgres, интегрированная в платформу интеллектуального анализа данных Databricks. Оно предоставляет возможности обработки онлайн-транзакций (OLTP) в lakehouse-архитектуру, что позволяет создавать программы для транзакционной обработки в реальном времени вместе с рабочими нагрузками аналитики.

Автомасштабирование в Lakebase Postgres сочетает надежность и привычность Postgres с современными возможностями базы данных, такими как автоматическое масштабирование, уменьшение масштабирования до нуля, разветвление и мгновенное восстановление. Эти функции обеспечивают гибкие рабочие процессы разработки, экономичные операции и быструю итерацию.

Интеграция Lakebase с каталогом Unity и приложениями

Порядок организации проектов

Общие сведения о иерархии объектов Lakebase помогают упорядочивать ресурсы и управлять ими:

Databricks Workspace
  └── Project(s)
      └── Branch(es)
          ├── Compute (primary R/W)
          ├── Read replica(s) (optional)
          ├── Role(s)
          └── Database(s)
                 └── Schema(s)

Каждый уровень в иерархии служит определенной целью:

Object Description
Проект Контейнер верхнего уровня для ресурсов базы данных. Проект содержит ветви, базы данных, роли и вычислительные ресурсы. См. статью "Управление проектами".
Филиал Изолированная среда базы данных, которая предоставляет общий доступ к хранилищу с родительской ветвью. Каждый проект может содержать несколько ветвей. См. раздел "Управление ветвями".
Вычисление Сервер Postgres, который управляет ветвью. Каждая ветвь имеет собственные вычислительные ресурсы, которые предоставляют вычислительные мощности и память для операций с базами данных. См. раздел "Управление вычислениями".
База данных Стандартная база данных Postgres в ветви. Каждая ветвь может содержать несколько баз данных с собственными таблицами, схемами и данными. См. раздел "Управление базами данных".

Общие сведения о ветвях

Одним из самых мощных функций Lakebase Postgres является ветвление. Как и ветви Git для кода, ветви позволяют создавать изолированные среды базы данных для разработки и тестирования, не влияя на рабочую среду.

Почему это важно: Для традиционных рабочих процессов базы данных требуются отдельные серверы разработки и промежуточные серверы, обновления данных вручную и тщательная координация. С помощью ветвей можно:

  • Мгновенное создание среды разработки с рабочими данными
  • Безопасно тестируйте изменения схемы перед применением их к промышленной среде.
  • Восстановление от ошибок путем создания ветвей с любого момента времени
  • Оплата только за измененные данные, а не полные повторяющиеся базы данных
Тема Description
Филиалы Узнайте, как работают ветви, распространенные рабочие процессы и рекомендации для вашей команды.
Управление ветвями Создавайте, сбрасывайте и удаляйте ветки для разработки и тестирования.
Защищенные ветви Защита продуктивных ветвей от случайных изменений и удалений.

Основные понятия

Lakebase основан на нескольких ключевых инновациях, которые отличают его от традиционных систем баз данных:

  • Разделенные вычислительные ресурсы и хранилище: Масштабируйте вычислительные ресурсы независимо от хранилища для повышения эффективности затрат и гибкости.
  • Автомасштабирование: Вычислительные ресурсы автоматически настраиваются на основе спроса на рабочую нагрузку, с поддержкой масштабирования до нуля во время простаивания.
  • Копирование при записи: Позволяет мгновенное ветвление, где вы оплачиваете только изменения данных, а не полное копирование.
  • Мгновенные операции на момент времени: Создание ветвей или восстановление в любой момент в течение настроенного периода восстановления (0–30 дней)

Эти понятия работают вместе, чтобы обеспечить гибкие рабочие процессы разработки, эффективные операции и быстрое восстановление после ошибок.

Подробное описание каждой основной концепции см. в разделе "Основные понятия".