Compartir a través de


Creación de un área de trabajo

Este artículo es una introducción a las opciones para crear y administrar áreas de trabajo.

¿Qué es un espacio de trabajo?

Un área de trabajo es una implementación de Azure Databricks en una cuenta de servicio en la nube. Proporciona un entorno unificado para trabajar con recursos de Azure Databricks para un conjunto especificado de usuarios.

Hay dos tipos de áreas de trabajo de Databricks disponibles:

  • Áreas de trabajo sin servidor: una implementación de área de trabajo en la cuenta de Azure Databricks que viene preconfigurada con proceso sin servidor y almacenamiento predeterminado para proporcionar una experiencia completamente sin servidor. Todavía puede conectarse al almacenamiento en la nube desde áreas de trabajo sin servidor.
  • Áreas de trabajo híbridas: también denominada área de trabajo clásica , esta implementación de área de trabajo aprovisiona recursos de proceso y almacenamiento en la cuenta de Azure existente. El proceso sin servidor sigue estando disponible en áreas de trabajo híbridas.

Requisitos

Antes de crear un área de trabajo de Azure Databricks, debe tener una suscripción de Azure que no sea una suscripción de evaluación gratuita.

Si tiene una cuenta gratuita, complete los pasos siguientes:

  1. Vaya a su perfil y cambie la suscripción a pago por uso. Consulte Cuenta gratuita de Azure.
  2. Quite el límite de gasto.
  3. Solicite un aumento de cuota para las vCPU de su región.

Permisos necesarios de Azure

Para crear un área de trabajo de Azure Databricks, debe ser uno de los siguientes:

  • Un usuario con la Colaboradoro rol Propietario en el nivel de suscripción.
  • Un usuario con una definición de rol personalizada que tiene la siguiente lista de permisos:
    • Microsoft.Databricks/workspaces/*
    • Microsoft.Resources/subscriptions/resourceGroups/read
    • Microsoft.Resources/subscriptions/resourceGroups/write
    • Microsoft.Databricks/accessConnectors/*
    • Microsoft.Compute/register/action
    • Microsoft.ManagedIdentity/register/action
    • Microsoft.Storage/register/action
    • Microsoft.Network/register/action
    • Microsoft.Resources/deployments/validate/action
    • Microsoft.Resources/deployments/write
    • Microsoft.Resources/deployments/read

Nota:

Los permisos Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action no son necesarios si estos proveedores ya están registrados en la suscripción. Consulte Registro del proveedor de recursos.

Elección de un tipo de área de trabajo

En las secciones siguientes se describe qué tipo de área de trabajo es mejor para casos de uso comunes. Use estas recomendaciones para ayudarle a decidir si quiere implementar un área de trabajo sin servidor o un área de trabajo clásica.

Cuándo elegir áreas de trabajo sin servidor

Las áreas de trabajo sin servidor son la mejor opción para la mayoría de los casos de uso y la manera más fácil de empezar a trabajar con casos de uso operativos y de consumidor, como Lakebase, Genie y Databricks Apps.

Las áreas de trabajo sin servidor son la mejor opción para los siguientes casos de uso:

  • Permitir que los usuarios empresariales accedan a Databricks One
  • Creación de paneles de IA/BI
  • Creación de aplicaciones de Databricks
  • Realización de análisis exploratorios mediante cuadernos o almacenes de SQL
  • Conexión a proveedores de SaaS a través de la federación de Lakehouse (pero no a Lakeflow Connect)
  • Uso de Genie Spaces para casos de uso empresariales
  • Uso de características de inteligencia artificial como la búsqueda vectorial, el servicio de modelos, las funciones de IA y los módulos del agente
  • Creación de canalizaciones declarativas de Spark de Lakeflow sin servidor

Cuándo elegir áreas de trabajo clásicas

Las áreas de trabajo clásicas son la mejor opción para los siguientes casos de uso:

  • Migración del código Spark antiguo existente que utiliza RDDs de Spark
  • Uso de Scala o R como lenguaje de codificación principal
  • Datos de streaming que requieren intervalos de activación basados en tiempo
  • Conexión directa a sistemas locales o bases de datos privadas mediante Lakeflow Connect

Opciones de creación de áreas de trabajo

Hay varias maneras de implementar un área de trabajo de Azure Databricks. El método de implementación estándar se realiza a través de Azure Portal o Terraform.

Además, puede crear áreas de trabajo con las siguientes herramientas: