Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El proceso de Azure Databricks hace referencia a la selección de recursos informáticos disponibles en Azure Databricks para ejecutar las cargas de trabajo de ingeniería de datos, ciencia de datos y análisis. Elija entre el proceso sin servidor para el escalado a petición, el proceso clásico para recursos personalizables o almacenes de SQL para el análisis optimizado.
Puede ver y administrar recursos de proceso en la sección Proceso del área de trabajo:
Proceso sin servidor
Proceso administrado automáticamente a petición que se escala en función de los requisitos de carga de trabajo.
| Tema | Description |
|---|---|
| Proceso sin servidor para cuadernos | Ejecución interactiva de Python y SQL en cuadernos con escalado automático y sin administración de infraestructura. |
| Proceso sin servidor para trabajos | Ejecute trabajos de Lakeflow sin configurar ni implementar la infraestructura. Aprovisiona y escala automáticamente los recursos de proceso. |
| Canalizaciones sin servidor | Ejecute canalizaciones declarativas de Spark de Lakeflow sin configurar ni implementar la infraestructura. Aprovisiona y escala automáticamente los recursos de proceso. |
| Limitaciones de proceso sin servidor | Descripción de las limitaciones y los requisitos de las cargas de trabajo sin servidor y las configuraciones admitidas. |
Proceso clásico
Recursos de proceso aprovisionados que se crean, configuran y administran para las cargas de trabajo.
| Tema | Description |
|---|---|
| Introducción al proceso clásico | Información general sobre quién puede acceder a los recursos de proceso clásicos y crearlos. |
| Configuración del proceso | Cree y configure el proceso para el análisis de datos interactivo en cuadernos o flujos de trabajo automatizados con trabajos de Lakeflow. |
| Proceso estándar | Proceso multiusuario con recursos compartidos para la colaboración rentable. Lakeguard proporciona aislamiento de usuario seguro. |
| Proceso dedicado | Recurso de proceso asignado a un único usuario o grupo. |
| Grupos de instancias | Instancias preconfiguradas que reducen el tiempo de inicio del proceso y proporcionan ahorros de costos para cargas de trabajo frecuentes. |
Almacenes de SQL
Recursos de proceso optimizados para casos de uso específicos y funcionalidad avanzada. Los almacenes de SQL se pueden configurar como sin servidor o clásico.
| Tema | Description |
|---|---|
| Almacenes de SQL | Proceso optimizado para consultas SQL , análisis y cargas de trabajo de inteligencia empresarial con opciones sin servidor o clásicas . |
| Tipos de SQL Warehouse | Comprender las diferencias entre las opciones de SQL Warehouse sin servidor y clásicas para elegir el tipo adecuado para las cargas de trabajo. |
Temas adicionales
| Tema | Description |
|---|---|
| ¿Qué es Photon? | Motor de consultas de alto rendimiento que acelera las cargas de trabajo de SQL y proporciona un procesamiento de datos más rápido. |
| ¿Qué es Lakeguard? | Marco de seguridad que proporciona gobernanza de datos y control de acceso para los recursos de proceso. |
Para obtener información sobre cómo trabajar con proceso mediante la línea de comandos o las API, consulte ¿Qué es la CLI de Databricks? y la referencia de la API rest de Databricks.
Puertos reservados
Algunos puertos están reservados en el nodo de controlador para los servicios internos de Databricks. Para evitar conflictos, no enlace servicios a los puertos siguientes:
- 1023
- 6059
- 6060
- 6061
- 6062: ocupado por ipywidgets de forma predeterminada. Si es necesario, puede cambiar el puerto. Consulte ipywidgets.
- 7071
- 7077
- 10000
- 15001
- 15002
- 36423
- 38841
- 39909
- 40000
- 40001
- 41063