Поделиться через


Создание рабочей области

В этой статье приведен обзор вариантов создания рабочих областей и управления ими.

Что такое рабочая область?

Рабочая область — это развертывание Azure Databricks в учетной записи облачной службы. Она предоставляет единую среду для работы с ресурсами Azure Databricks для указанного набора пользователей.

Доступны два типа рабочих областей Databricks:

  • Бессерверные рабочие области (общедоступная предварительная версия): развертывание рабочей области в учетной записи Databricks, которая предварительно настроена с бессерверными вычислительными ресурсами и хранилищем по умолчанию, чтобы обеспечить полностью бессерверный интерфейс. Вы по-прежнему можете подключиться к облачному хранилищу из бессерверных рабочих областей.
  • Гибридные рабочие пространства: также называется Классическим рабочим пространством, такое развертывание предполагает подготовку хранилища и вычислительных ресурсов в существующей учетной записи Azure. Бессерверные вычисления по-прежнему доступны в гибридных рабочих областях.

Требования

Перед созданием рабочей области Azure Databricks необходимо иметь подписку Azure , которая не является бесплатной пробной подпиской.

Если у вас есть бесплатная учетная запись, выполните следующие действия.

  1. Перейдите в профиль и измените подписку на оплату по мере использования. См . бесплатную учетную запись Azure.
  2. Удалите ограничение расходов.
  3. Запросить увеличение квоты для виртуальных ЦП в вашем регионе.

Обязательные разрешения Azure

Чтобы создать рабочую область Azure Databricks, необходимо быть одной из следующих:

  • Пользователь с ролью участника Azure или владельца на уровне подписки.
  • Пользователь с пользовательским определением роли, имеющий следующий список разрешений:
    • Microsoft.Databricks/workspaces/*
    • Microsoft.Resources/subscriptions/resourceGroups/read
    • Microsoft.Resources/subscriptions/resourceGroups/write
    • Microsoft.Databricks/accessConnectors/*
    • Microsoft.Compute/register/action
    • Microsoft.ManagedIdentity/register/action
    • Microsoft.Storage/register/action
    • Microsoft.Network/register/action
    • Microsoft.Resources/deployments/validate/action
    • Microsoft.Resources/deployments/write
    • Microsoft.Resources/deployments/read

Замечание

Разрешения Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action не требуются, если эти поставщики уже зарегистрированы в подписке. См. раздел "Регистрация поставщика ресурсов".

Выбор типа рабочей области

В следующих разделах описывается, какой тип рабочей области лучше всего подходит для распространенных вариантов использования. Используйте эти рекомендации, чтобы решить, следует ли развертывать бессерверную или классическую рабочую область.

Выбор бессерверных рабочих областей

Бессерверные рабочие области лучше всего подходят для следующих вариантов использования:

  • Предоставление бизнес-пользователям доступа к Databricks One
  • Создание панелей мониторинга AI/BI
  • Создание приложений Databricks
  • Анализ аналитических данных с помощью записных книжек или хранилищ SQL
  • Подключение к поставщикам SaaS через Федерацию Lakehouse (но не Lakeflow Connect)
  • Использование Genie Spaces для бизнес-вариантов использования
  • Тестирование новых функций ИИ Мозаики перед их перемещением в рабочую среду
  • Создание бессерверных декларативных конвейеров Spark Lakeflow

Когда выбирать классические рабочие пространства

Классические рабочие области лучше всего подходят для следующих вариантов использования:

  • Работа по разработке искусственного интеллекта или машинного обучения, требующая GPU
  • Использование Databricks Runtime для машинного обучения или Apache Spark MLib
  • Перенос существующего устаревшего кода Spark, использующего RDD Spark
  • Использование Scala или R в качестве основного языка программирования
  • Стриминг данных, требующий триггерных интервалов по умолчанию или на основе времени
  • Подключение к API Databricks через подключение PrivateLink
  • Подключение к локальным системам или частным базам данных напрямую через Lakeflow Connect

Параметры создания рабочей области

Существует несколько способов развертывания рабочей области Azure Databricks. Стандартный метод развертывания осуществляется через портал Azure или Terraform.

Кроме того, вы можете создавать рабочие области с помощью следующих средств: