Comparteix via


Introducción al proceso estándar

En esta página se proporciona información general sobre el proceso estándar.

¿Qué es el proceso estándar?

El proceso estándar se configura con el modo de acceso estándar. Cualquier usuario puede usar los recursos de proceso estándar para hacerlo.

Se recomienda el proceso estándar para la mayoría de las cargas de trabajo. El proceso estándar permite que cualquier número de usuarios asocie y ejecute simultáneamente cargas de trabajo en el mismo recurso de proceso, lo que proporciona ahorros de costos y administración simplificada de procesos. El proceso estándar ejecuta código de usuario de forma total sin acceso a recursos de nivel inferior.

Selección del modo de acceso

El modo de acceso se configura al crear un recurso de proceso de trabajo o de uso completo. La configuración del modo de acceso se encuentra en la sección Avanzadas de la interfaz de usuario de proceso y representada por data_security_mode en la API.

De forma predeterminada en la interfaz de usuario, el modo de acceso se establece en Automático, lo que significa que el modo de acceso se elige automáticamente en función del entorno de ejecución de Databricks seleccionado. El valor predeterminado automático es Estándar a menos que se seleccione un entorno de ejecución de aprendizaje automático o databricks runtimes inferior a 14.3, en cuyo caso se usa Dedicated .

Cuándo usar el proceso estándar

Se recomienda el proceso estándar para la mayoría de las cargas de trabajo, entre las que se incluyen:

  • Ingeniería general de datos y canalizaciones ETL: la mayoría de las cargas de trabajo de procesamiento de datos
  • Proyectos de ciencia de datos de colaboración: Teams que trabajan juntos en el análisis y el desarrollo de modelos
  • Exploración interactiva de datos: análisis ad hoc y desarrollo basado en cuadernos
  • Optimización de costos: si desea compartir recursos de proceso entre varios usuarios

Elija solo proceso dedicado para cargas de trabajo especializadas que requieran acceso a máquinas con privilegios, API de RDD, ML distribuido, GPU o R. Para obtener una lista de las limitaciones de proceso estándar, consulte Requisitos y limitaciones de proceso estándar.

Compatibilidad con lenguajes y entornos de ejecución

El proceso estándar tiene la siguiente compatibilidad con el lenguaje de programación:

  • Python: compatibilidad completa con todas las versiones de Databricks Runtime
  • SQL: compatibilidad completa con todas las versiones de Databricks Runtime
  • Scala: compatible con Databricks Runtime 13.3 LTS y versiones posteriores con el catálogo de Unity
  • R: No se admite en el proceso estándar

Lakeguard para el aislamiento de usuario

El proceso estándar usa Azure Databricks Lakeguard para proporcionar aislamiento de usuario seguro y gobernanza de datos. Lakeguard emplea técnicas avanzadas de aislamiento de código que separan el código de usuario de la infraestructura de Spark subyacente.

Para obtener más información, consulte ¿Cómo aplica Databricks el aislamiento de usuario?.