¿Qué son los grupos de Azure Databricks?

Los grupos de Azure Databricks son un conjunto de instancias inactivas y listas para usar. Cuando se crean nodos de clúster mediante las instancias inactivas, se reducen los tiempos de inicio y escalado automático del clúster. Si el grupo no tiene instancias inactivas, el grupo se expande al asignar una nueva instancia del proveedor de instancias para responder a la solicitud del clúster.

Cuando un clúster libera una instancia, esta vuelve al grupo y queda disponible para que la use otro clúster. Solo los clústeres conectados a un grupo pueden usar las instancias inactivas de ese grupo.

Azure Databricks no cobra DBU por hora mientras las instancias están inactivas en el grupo. Tiene validez la facturación del proveedor de instancias. Consulte Precios.

Es posible administrar grupos mediante la interfaz de usuario o mediante una llamada a la API de grupos de instancia.

Creación de un grupo

Para crear grupos, es necesario tener permiso para ello. De forma predeterminada, solo los administradores del área de trabajo tienen permisos de creación de grupos. A los grupos se les puede asignar el derecho allow-instance-pool-create mediante la API de grupo.

Para crear un pool utilizando la interfaz de usuario:

  1. Haga clic en compute iconProceso en la barra lateral.
  2. Haga clic en la pestaña Pools.
  3. Haga clic en el botón Crear grupo.
  4. Especifique la configuración del pool.
  5. Haga clic en el botón Crear.

Adjuntar un cluster a un pool

Para adjuntar un clúster a un grupo mediante la interfaz de usuario de creación de clústeres, seleccione el grupo en el menú desplegable Tipo de controlador o Tipo de trabajo cuando configure el clúster. Los grupos disponibles se muestran en la parte superior de cada lista desplegable. Puede usar el mismo grupo o grupos diferentes para el nodo de controlador y los nodos de trabajo.

Si utiliza la API de clústeres, debe especificar driver_instance_pool_id para el nodo de controlador y instance_pool_id para los nodos de trabajo.

Para ver más procedimientos recomendados relacionados con grupos, consulte Procedimientos recomendados sobre grupos.

Permisos de grupo

Hay tres niveles de permisos para un grupo: NO PERMISSIONS, CAN ATTACH TO y CAN MANAGE. En la tabla se enumeran las capacidades de cada permiso.

Aptitud NO PERMISSIONS SE PUEDE ASOCIAR A PUEDE ADMINISTRAR
Asociar un clúster a un grupo x x
Eliminar un grupo x
Editar un grupo x
Modificar permisos x

Los administradores del área de trabajo tienen el permiso CAN MANAGE en todos los grupos de su área de trabajo. Los usuarios tienen automáticamente el permiso CAN MANAGE en los grupos que crean.

Configurar permisos de grupo

En esta sección, se describe cómo administrar los permisos mediante la interfaz de usuario del área de trabajo. También puede usar API Permissions o el proveedor de Terraform de Databricks.

Debe tener el permiso CAN MANAGE en un grupo para configurar los permisos.

  1. En la barra lateral, haga clic en Proceso.

  2. Haga clic en la pestaña Pools.

  3. Seleccione el grupo que desea actualizar.

  4. Haga clic en el botón Permisos.

  5. En Configuración de permisos, haga clic en el menú desplegable Seleccionar usuario, grupo o entidad de servicio… y seleccione un usuario, grupo o entidad de servicio.

    Set pool permissions

  6. Seleccione un permiso en el menú desplegable de permisos.

  7. Haga clic en Agregar y luego en Guardar.

Eliminación de un grupo

La eliminación de un grupo finaliza las instancias inactivas del grupo y quita su configuración. Para eliminar un grupo, pulse el icono Delete Icon en las acciones de la página Grupos. Si elimina un grupo:

  • Los clústeres en ejecución asociados al grupo siguen ejecutándose, pero no pueden asignar instancias durante el cambio de tamaño o el escalado vertical.
  • Los clústeres finalizados asociados al grupo no se iniciarán.

Importante

No es posible deshacer esta acción.