Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
En esta página se explica cómo conectarse y utilizar la computación sin servidor para notebooks, flujos de trabajo y pipelines declarativos de Spark Lakeflow en Azure Databricks.
¿Qué es el proceso sin servidor?
La computación sin servidor es un servicio administrado por Azure Databricks que permite a los usuarios conectarse rápidamente a recursos informáticos bajo demanda para documentos, flujos de trabajo y Canalizaciones Declarativas de Spark de Lakeflow.
Al elegir usar el proceso sin servidor, puede ejecutar cargas de trabajo sin aprovisionar ningún recurso de proceso en la cuenta en la nube. En su lugar, Databricks asigna y administra automáticamente los recursos de proceso necesarios. Esto acelera los tiempos de inicio y escalado, minimiza el tiempo de inactividad y reduce la necesidad de administrar los recursos de proceso.
Las cargas de trabajo sin servidor están protegidas por varias capas de seguridad y están diseñadas para estar listas para la empresa. Para más información, consulte Seguridad sin servidor de Databricks.
Nota:
El proceso sin servidor está disponible de forma predeterminada en la mayoría de las áreas de trabajo y no requiere la habilitación. Las áreas de trabajo que tienen habilitado el catálogo de Unity y que se encuentran en una región admitida tienen acceso automático a la computación sin servidor. Consulte Requisitos de proceso sin servidor para obtener la lista completa de requisitos.
Otras características de Azure Databricks, como almacenes sql sin servidor, funciones de servicio de modelos e inteligencia artificial, usan la infraestructura sin servidor de forma independiente y tienen sus propias rutas de configuración. En esta página solo se cubre la computación sin servidor para cuadernos, flujos de trabajo y canalizaciones declarativas de Lakeflow Spark.
Utiliza la computación sin servidor para tus cargas de trabajo
Use las páginas siguientes para obtener información sobre cómo configurar cargas de trabajo para usar el proceso sin servidor:
- Cuadernos sin servidor
- Trabajos sin servidor
- Canalizaciones declarativas sin servidor de Spark Lakeflow
- Entorno de ejecución de IA (versión preliminar)
- Guías para el entorno de ejecución de IA
Otras características que usan la infraestructura sin servidor
Muchas características de Azure Databricks se ejecutan en la infraestructura sin servidor; pero se configuran y administran por separado del cómputo sin servidor para cuadernos, trabajos y Lakeflow Spark Declarative Pipelines. Por ejemplo:
- Almacenes de SQL sin servidor
- Mosaico de aprendizaje de modelos de IA: previsión
- Supervisión de la calidad de los datos
- Optimización predictiva
Requisitos de proceso sin servidor
La computación sin servidor está disponible de forma predeterminada en la mayoría de los espacios de trabajo. No se requieren pasos de habilitación manuales.
Para acceder al cómputo sin servidor, el área de trabajo debe cumplir los siguientes requisitos:
- Debe tener habilitado el catálogo de Unity.
- Debe estar en una región admitida para la computación sin servidor. Consulte Disponibilidad sin servidor.
- No debe tener PCI-DSS habilitado en el perfil de seguridad de cumplimiento. Consulte PCI DSS v4.0.
Si el área de trabajo cumple estos requisitos, la informática sin servidor ya está disponible. Los espacios de trabajo heredados que no están habilitados para el catálogo de Unity no tienen acceso a la computación sin servidor. Consulte Actualizar un área de trabajo de Azure Databricks a Unity Catalog.
Limitaciones de proceso sin servidor
Para ver una lista de limitaciones, consulte Limitaciones de los procesos sin servidor.
Preguntas más frecuentes
- ¿Cómo se implementan las versiones?
- ¿Cómo puedo determinar qué versión sin servidor estoy ejecutando?
- ¿Cómo se calculan los costes de las versiones sin servidor?
- ¿Cómo se analiza el uso de DBU para una carga de trabajo específica?
- ¿Hay un retraso entre la ejecución de un trabajo o una consulta y el registro de los cargos en la tabla del sistema de facturación por uso?
- ¿Por qué veo registros de facturación para trabajos sin servidor aunque no he ejecutado cargas de trabajo sin servidor?
- ¿Admite el proceso sin servidor repositorios privados?
- ¿Cómo se instalan bibliotecas para mis tareas de trabajo?
- ¿Puedo conectarme a orígenes de datos personalizados?
- ¿Cómo funciona la red del planos de procesos sin servidor?
- ¿Puedo configurar la computación sin servidor para trabajos con paquetes de automatización declarativos?
- ¿Cómo ejecuto mi carga de trabajo sin servidor desde mi máquina de desarrollo local o desde mi aplicación de datos?
¿Cómo se implementan las versiones?
El proceso sin servidor es un productosin versión, lo que significa que Databricks actualiza automáticamente el entorno de ejecución de proceso sin servidor para admitir mejoras y actualizaciones en la plataforma. Todos los usuarios obtienen las mismas actualizaciones, que se han implementado durante un breve período de tiempo.
¿Cómo puedo determinar qué versión sin servidor estoy ejecutando?
Las cargas de trabajo sin servidor siempre se ejecutan en la versión en tiempo de ejecución más reciente. Vea notas de la versión para obtener la versión más reciente.
¿Cómo se calculan los costes de las versiones sin servidor?
Databricks recomienda ejecutar y comparar una carga de trabajo representativa o específica y, a continuación, analizar la tabla del sistema de facturación. Consulte Referencia de tabla del sistema de utilización facturable.
¿Cómo se analiza el uso de DBU para una carga de trabajo específica?
Para ver el coste de una carga de trabajo específica, consulte la tabla del sistema system.billing.usage. Consulte Supervisión del coste del proceso sin servidor para obtener consultas de ejemplo y descargar nuestro panel de observabilidad de costes.
¿Hay un retraso entre la ejecución de un trabajo o una consulta y la apariencia de los cargos en la tabla del sistema de uso facturable?
Sí, podría haber hasta un retraso de 24 horas entre cuando se ejecuta una carga de trabajo y su uso se refleja en la tabla del sistema de uso facturable.
¿Por qué veo registros de facturación para trabajos sin servidor aunque no he ejecutado cargas de trabajo sin servidor?
La supervisión de la calidad de los datos y la optimización predictiva se ejecutan en la infraestructura sin servidor y se facturan en la SKU de trabajos sin servidor. Estas funciones se gestionan de forma independiente del cálculo sin servidor para cuadernos, flujos de trabajo y las canalizaciones declarativas de Spark de Lakeflow.
¿Admite el proceso sin servidor repositorios privados?
Los repositorios pueden ser privados o requerir autenticación. Por motivos de seguridad, se requiere una dirección URL firmada previamente al acceder a repositorios autenticados.
¿Cómo se instalan bibliotecas para mis tareas de trabajo?
Databricks recomienda usar entornos para instalar y administrar bibliotecas para los trabajos. Consulte Configuración del entorno para tareas de trabajo.
¿Puedo conectarme a orígenes de datos personalizados?
No, solo se admiten los orígenes que usan Lakehouse Federation. Consulte Orígenes de datos compatibles.
¿Cómo funciona la red del planos de procesos sin servidor?
Los recursos de proceso sin servidor se ejecutan en el plano de proceso sin servidor, administrado por Azure Databricks. Para obtener más información sobre la red y la arquitectura, consulte Redes de planos de procesos sin servidor.
¿Puedo configurar computación sin servidor para los trabajos con paquetes declarativos de Automatización?
Sí, se pueden usar agrupaciones de automatización declarativa para configurar trabajos que usan proceso sin servidor. Consulte Trabajo que usa proceso sin servidor.
¿Cómo ejecuto mi carga de trabajo sin servidor desde mi máquina de desarrollo local o desde mi aplicación de datos?
Databricks Connect permite conectarse a Databricks desde la máquina local y ejecutar cargas de trabajo en sin servidor. Consulte ¿Qué es Databricks Connect?