Compartir a través de


Conexión a los grupos

Nota:

Si la carga de trabajo admite el proceso sin servidor, Databricks recomienda usar proceso sin servidor en lugar de grupos para aprovechar el proceso siempre activado y escalable. Véase Conexión a la computación sin servidor.

Los grupos de Azure Databricks son un conjunto de instancias inactivas y listas para usar. Cuando se crean nodos de clúster mediante las instancias inactivas, se reducen los tiempos de inicio y escalado automático del clúster. Si el grupo no tiene instancias inactivas, el grupo se expande al asignar una nueva instancia del proveedor de instancias para responder a la solicitud del clúster.

Cuando un clúster libera una instancia, esta vuelve al grupo y queda disponible para que la use otro clúster. Solo los clústeres conectados a un grupo pueden usar las instancias inactivas de ese grupo.

Azure Databricks no cobra DBU por hora mientras las instancias están inactivas en el grupo. Tiene validez la facturación del proveedor de instancias. Consulte Precios.

Es posible administrar grupos mediante la interfaz de usuario o mediante una llamada a la API de grupos de instancia.

Creación de un grupo

Para crear grupos, es necesario tener permiso para ello. De forma predeterminada, solo los administradores del área de trabajo tienen permisos de creación de grupos. A los grupos se les puede asignar el derecho allow-instance-pool-create mediante la API de grupo.

Para crear un pool utilizando la interfaz de usuario:

  1. Haga clic en Icono Proceso Proceso en la barra lateral.
  2. Haga clic en la pestaña Pools.
  3. Haga clic en el botón Crear grupo.
  4. Especifique la configuración del pool.
  5. Haga clic en el botón Crear.

Adjuntar un cluster a un pool

Para adjuntar un clúster a un grupo mediante la interfaz de usuario de creación de clústeres, seleccione el grupo en el menú desplegable Tipo de controlador o Tipo de trabajo cuando configure el clúster. Los grupos disponibles se muestran en la parte superior de cada lista desplegable. Puede usar el mismo grupo o grupos diferentes para el nodo de controlador y los nodos de trabajo.

Si utiliza la API de clústeres, debe especificar driver_instance_pool_id para el nodo de controlador y instance_pool_id para los nodos de trabajo.

Para ver más procedimientos recomendados relacionados con grupos, consulte Procedimientos recomendados sobre grupos.

Permisos de grupo

Hay tres niveles de permisos para un grupo: NO PERMISSIONS, CAN ATTACH TO y CAN MANAGE. Para más información, consulte ACL de grupos.

Configurar permisos de grupo

En esta sección, se describe cómo administrar los permisos mediante la interfaz de usuario del área de trabajo. También puede usar API Permissions o el proveedor de Terraform de Databricks.

Debe tener el permiso CAN MANAGE en un grupo para configurar los permisos.

  1. En la barra lateral, haga clic en Proceso.

  2. Haga clic en la pestaña Pools.

  3. Seleccione el grupo que desea actualizar.

  4. Haga clic en el botón Permisos.

  5. En Configuración de permisos, haga clic en el menú desplegable Seleccionar usuario, grupo o entidad de servicio… y seleccione un usuario, grupo o entidad de servicio.

    Establecimiento de permisos de grupo

  6. Seleccione un permiso en el menú desplegable de permisos.

  7. Haga clic en Agregar y luego en Guardar.

Eliminación de un grupo

La eliminación de un grupo finaliza las instancias inactivas del grupo y quita su configuración. Para eliminar un grupo, pulse el icono Eliminar en las acciones de la página Grupos. Si elimina un grupo:

  • Los clústeres en ejecución asociados al grupo siguen ejecutándose, pero no pueden asignar instancias durante el cambio de tamaño o el escalado vertical.
  • Los clústeres finalizados asociados al grupo no se iniciarán.

Importante

No es posible deshacer esta acción.