Compartir a través de


Proceso

El proceso de Azure Databricks hace referencia a la selección de recursos informáticos disponibles en Azure Databricks para ejecutar las cargas de trabajo de ingeniería de datos, ciencia de datos y análisis. Elija entre el proceso sin servidor para el escalado a petición, el proceso clásico para recursos personalizables o almacenes de SQL para el análisis optimizado.

Puede ver y administrar recursos de proceso en la sección Proceso del área de trabajo:

Proceso sin servidor

Proceso administrado automáticamente a petición que se escala en función de los requisitos de carga de trabajo.

Tema Description
Proceso sin servidor para cuadernos Ejecución interactiva de Python y SQL en cuadernos con escalado automático y sin administración de infraestructura.
Proceso sin servidor para trabajos Ejecute trabajos de Lakeflow sin configurar ni implementar la infraestructura. Aprovisiona y escala automáticamente los recursos de proceso.
Canalizaciones sin servidor Ejecute canalizaciones declarativas de Spark de Lakeflow sin configurar ni implementar la infraestructura. Aprovisiona y escala automáticamente los recursos de proceso.
Limitaciones de proceso sin servidor Descripción de las limitaciones y los requisitos de las cargas de trabajo sin servidor y las configuraciones admitidas.

Proceso clásico

Recursos de proceso aprovisionados que se crean, configuran y administran para las cargas de trabajo.

Tema Description
Introducción al proceso clásico Información general sobre quién puede acceder a los recursos de proceso clásicos y crearlos.
Configuración del proceso Cree y configure el proceso para el análisis de datos interactivo en cuadernos o flujos de trabajo automatizados con trabajos de Lakeflow.
Proceso estándar Proceso multiusuario con recursos compartidos para la colaboración rentable. Lakeguard proporciona aislamiento de usuario seguro.
Proceso dedicado Recurso de proceso asignado a un único usuario o grupo.
Grupos de instancias Instancias preconfiguradas que reducen el tiempo de inicio del proceso y proporcionan ahorros de costos para cargas de trabajo frecuentes.

Almacenes de SQL

Recursos de proceso optimizados para casos de uso específicos y funcionalidad avanzada. Los almacenes de SQL se pueden configurar como sin servidor o clásico.

Tema Description
Almacenes de SQL Proceso optimizado para consultas SQL , análisis y cargas de trabajo de inteligencia empresarial con opciones sin servidor o clásicas .
Tipos de SQL Warehouse Comprender las diferencias entre las opciones de SQL Warehouse sin servidor y clásicas para elegir el tipo adecuado para las cargas de trabajo.

Temas adicionales

Tema Description
¿Qué es Photon? Motor de consultas de alto rendimiento que acelera las cargas de trabajo de SQL y proporciona un procesamiento de datos más rápido.
¿Qué es Lakeguard? Marco de seguridad que proporciona gobernanza de datos y control de acceso para los recursos de proceso.

Para obtener información sobre cómo trabajar con proceso mediante la línea de comandos o las API, consulte ¿Qué es la CLI de Databricks? y la referencia de la API rest de Databricks.

Puertos reservados

Algunos puertos están reservados en el nodo de controlador para los servicios internos de Databricks. Para evitar conflictos, no enlace servicios a los puertos siguientes:

  • 1023
  • 6059
  • 6060
  • 6061
  • 6062: ocupado por ipywidgets de forma predeterminada. Si es necesario, puede cambiar el puerto. Consulte ipywidgets.
  • 7071
  • 7077
  • 10000
  • 15001
  • 15002
  • 36423
  • 38841
  • 39909
  • 40000
  • 40001
  • 41063