Comparteix via


Creación de un área de trabajo

Este artículo es una introducción a las opciones para crear y administrar áreas de trabajo.

¿Qué es un espacio de trabajo?

Un área de trabajo es una implementación de Azure Databricks en una cuenta de servicio en la nube. Proporciona un entorno unificado para trabajar con recursos de Azure Databricks para un conjunto especificado de usuarios.

Hay dos tipos de áreas de trabajo de Databricks disponibles:

  • Áreas de trabajo sin servidor (versión preliminar pública): una implementación del área de trabajo en la cuenta de Databricks que viene preconfigurada con proceso sin servidor y almacenamiento predeterminado para proporcionar una experiencia completamente sin servidor. Todavía puede conectarse al almacenamiento en la nube desde áreas de trabajo sin servidor.
  • Áreas de trabajo clásicas: una implementación de área de trabajo en la cuenta de Databricks que aprovisiona recursos de almacenamiento y proceso en la cuenta en la nube existente. La computación sin servidor continúa disponible en espacios de trabajo clásicos.

Requisitos

Antes de crear un área de trabajo de Azure Databricks, debe tener una suscripción de Azure que no sea una suscripción de evaluación gratuita.

Si tiene una cuenta gratuita, complete los pasos siguientes:

  1. Vaya a su perfil y cambie la suscripción a pago por uso. Consulte Cuenta gratuita de Azure.
  2. Quite el límite de gasto.
  3. Solicite un aumento de cuota para las vCPU de su región.

Permisos necesarios de Azure

Para crear un área de trabajo de Azure Databricks, debe ser uno de los siguientes:

  • Un usuario con la Colaboradoro rol Propietario en el nivel de suscripción.

  • Un usuario con una definición de rol personalizada que tiene la siguiente lista de permisos:

    • Microsoft.Databricks/workspaces/*
    • Microsoft.Resources/subscriptions/resourceGroups/read
    • Microsoft.Resources/subscriptions/resourceGroups/write
    • Microsoft.Databricks/accessConnectors/*
    • Microsoft.Compute/register/action
    • Microsoft.ManagedIdentity/register/action
    • Microsoft.Storage/register/action
    • Microsoft.Network/register/action
    • Microsoft.Resources/deployments/validate/action
    • Microsoft.Resources/deployments/write
    • Microsoft.Resources/deployments/read

Nota:

Los permisos Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action no son necesarios si estos proveedores ya están registrados en la suscripción. Consulte Registro del proveedor de recursos.

Elección de un tipo de área de trabajo

En las secciones siguientes se describe qué tipo de área de trabajo es mejor para casos de uso comunes. Use estas recomendaciones para ayudarle a decidir si debe implementar un área de trabajo sin servidor o clásica.

Cuándo elegir áreas de trabajo sin servidor

Las áreas de trabajo sin servidor son la mejor opción para los siguientes casos de uso:

  • Permitir que los usuarios empresariales accedan a Databricks One
  • Creación de paneles de IA/BI
  • Creación de aplicaciones de Databricks
  • Realizar análisis exploratorios mediante cuadernos o almacenes de SQL
  • Conexión a proveedores de SaaS a través de la federación de Lakehouse (pero no a Lakeflow Connect)
  • Uso de Genie Spaces para casos de uso empresariales
  • Prueba de las nuevas características de Mosaic AI antes de moverlas a producción
  • Creación de canalizaciones declarativas sin servidor de Lakeflow Spark

Cuándo elegir áreas de trabajo clásicas

Las áreas de trabajo clásicas son la mejor opción para los siguientes casos de uso:

  • Realizar el trabajo de desarrollo de IA o ML que requiere GPU
  • Uso de Databricks Runtime para Machine Learning o Apache Spark MLib
  • Migrar el código heredado de Spark existente que usa RDD de Spark
  • Uso de Scala o R como lenguaje de codificación principal
  • Transmisión de datos que requieren intervalos de desencadenador predeterminados o basados en tiempo
  • Conexión a las API de Databricks a través de una conexión PrivateLink
  • Conexión directa a sistemas locales o bases de datos privadas mediante Lakeflow Connect

Opciones de creación de áreas de trabajo

Hay varias maneras de implementar un área de trabajo de Azure Databricks. El método de implementación estándar se realiza a través de Azure Portal o Terraform.

Además, puede crear áreas de trabajo con las siguientes herramientas: