Terminal web

El terminal web de Azure Databricks proporciona una manera cómoda y muy interactiva de ejecutar comandos del shell y usar editores, como Vim o Emacs, en el nodo del controlador de Spark. Muchos usuarios de un clúster pueden usar el terminal web. Entre los usos de ejemplo del terminal web se incluyen la supervisión del uso de recursos y la instalación de paquetes de Linux.

El terminal web está deshabilitado de manera predeterminada para todos los usuarios del área de trabajo.

Al habilitar los Servicios del contenedor Docker, se deshabilita el terminal web.

Advertencia

Azure Databricks redirige mediante proxy el servicio del terminal web, desde el puerto 7681 en el controlador de Spark del clúster. Este proxy web está pensado para su uso exclusivo con el terminal web. Si el puerto está ocupado cuando se inicia el clúster o si hay un conflicto, es posible que el terminal web no funcione según lo previsto. Si se inician otros servicios web en el puerto 7681, los usuarios del clúster pueden estar expuestos a posibles vulnerabilidades de seguridad. Ni Databricks ni Microsoft son responsables de los problemas debidos a la instalación de software no compatible en un clúster.

Requisitos

Inicio del terminal web

Para iniciar el terminal web, realice una de las acciones siguientes:

  • En una página de detalles del clúster, haga clic en la pestaña Aplicaciones, y después haga clic en Iniciar terminal web.
  • En un cuaderno, haga clic en la lista desplegable del clúster adjunto, mantenga el puntero sobre el clúster conectado y, después, haga clic en Terminal.

Se abre una nueva pestaña con la UI del terminal web y el símbolo del sistema de Bash. Ahí puede ejecutar comandos como raíz dentro del contenedor del nodo del controlador del clúster.

Interfaz de usuario del terminal web

Cada usuario puede tener hasta 100 sesiones de terminal web activas (pestañas) abiertas. Las sesiones de terminal web inactivas pueden agotar su tiempo de espera, y la aplicación web del terminal web se volverá a conectar, lo que da lugar a un nuevo proceso de shell. Si desea mantener la sesión de Bash, Databricks recomienda usar tmux.

Limitaciones

  • Azure Databricks no admite la ejecución de trabajos de Spark desde el terminal web. Además, el terminal web de Azure Databricks no está disponible en los siguientes tipos de clúster:
    • Clústeres de trabajos
    • Clústeres iniciados con el conjunto de variables de entorno DISABLE_WEB_TERMINAL=true.
    • Clústeres iniciados con el modo de acceso establecido en Compartido.
    • Clústeres iniciados con la configuración de Spark spark.databricks.pyspark.enableProcessIsolation establecida en true.
  • Hay un límite máximo de 12 horas desde que se carga la página inicial, después de lo cual se finalizará cualquier conexión, incluso si está activa. Puede actualizar el terminal web para volver a conectarse. Databricks recomienda usar tmux para conservar la sesión del shell.
  • Al habilitar los Servicios del contenedor Docker, se deshabilita el terminal web.