Bibliotecas de áreas de trabajo (heredadas)

Importante

Esta documentación se ha retirado y es posible que no se actualice. Los productos, servicios o tecnologías mencionados en este contenido ya no se admiten. Consulte Bibliotecas del clúster.

Nota:

Las bibliotecas de áreas de trabajo han quedado en desuso y no debería usarse. Sin embargo, el almacenamiento de bibliotecas como archivos de área de trabajo es distinto de las bibliotecas de áreas de trabajo y sigue siendo totalmente compatible. Puede instalar bibliotecas almacenadas como archivos de área de trabajo directamente en tareas de proceso o trabajo.

Las bibliotecas de áreas de trabajo sirven como repositorio local desde el que se crean bibliotecas instaladas en clúster. Una biblioteca de área de trabajo podría ser un código personalizado creado por una organización, o bien una versión concreta de una biblioteca de código abierto en la que su organización haya establecido los estándares.

Debe instalar una biblioteca de áreas de trabajo en un clúster para poder usarla en un cuaderno o trabajo. Consulte Instalación de una biblioteca de áreas de trabajo en un clúster.

Las bibliotecas de áreas de trabajo de la carpeta Compartido están disponibles para todos los usuarios de un área de trabajo, mientras que las bibliotecas de áreas de trabajo de una carpeta de usuario solo están disponibles para ese usuario.

Importante

Las bibliotecas se pueden instalar desde DBFS cuando se usa Databricks Runtime 14.3 LTS y versiones anteriores. Sin embargo, cualquier usuario del área de trabajo puede modificar los archivos de biblioteca almacenados en DBFS. Para mejorar la seguridad de las bibliotecas en un área de trabajo de Azure Databricks, el almacenamiento de archivos de biblioteca en la raíz de DBFS está en desuso y está deshabilitado de manera predeterminada en Databricks Runtime 15.0 y versiones posteriores. Consulte El almacenamiento de bibliotecas en la raíz de DBFS está en desuso y deshabilitado de manera predeterminada.

En su lugar, Databricks recomienda cargar todas las bibliotecas, incluidas las bibliotecas de Python, los archivos JAR y los conectores de Spark, en archivos de área de trabajo o volúmenes de Unity Catalog, o mediante repositorios de paquetes de biblioteca. Si la carga de trabajo no admite estos patrones, también puede usar bibliotecas almacenadas en el almacenamiento de objetos en la nube.

¿Cómo difieren las bibliotecas del área de trabajo de las bibliotecas almacenadas con archivos del área de trabajo?

El término "bibliotecas del área de trabajo" hace referencia a cualquier biblioteca registrada en un área de trabajo. Las bibliotecas del área de trabajo aparecen junto con cuadernos y archivos del área de trabajo y siguen las reglas de ACL para su directorio contenedor.

El término "archivos del área de trabajo" hace referencia a cualquier archivo arbitrario almacenado en el área de trabajo. Puede almacenar paquetes .whl de Python como archivos de área de trabajo y, a continuación, registrarlos como bibliotecas de áreas de trabajo. Consulte ¿Qué son los archivos del área de trabajo?

Puede cargar bibliotecas como archivos del área de trabajo. Consulte Uso básico de los archivos del área de trabajo.

Aunque puede cargar muchos tipos de archivo en archivos del área de trabajo, solo se pueden instalar archivos .whl de Python mediante archivos del área de trabajo. Consulte Bibliotecas con ámbito de clúster.

En Databricks Runtime 13.3 LTS y versiones posteriores, puede usar %pip para instalar archivos wheel de Python almacenados como archivos del área de trabajo. Consulte Instalar un paquete almacenado como un archivo del área de trabajo con %pip.

Creación de una biblioteca de áreas de trabajo

  1. Haga clic con el botón derecho en la carpeta del área de trabajo en la que quiere almacenar la biblioteca.
  2. Seleccione Crear > Biblioteca. Aparece el cuadro de diálogo Crear biblioteca.
  3. Seleccione el origen de la biblioteca y siga el procedimiento adecuado:

Carga de un archivo Jar, egg de Python o wheel de Python

Nota:

La instalación de archivos egg de Python está en desuso y se quitará en una futura versión de Databricks Runtime.

Importante

Las bibliotecas se pueden instalar desde DBFS cuando se usa Databricks Runtime 14.3 LTS y versiones anteriores. Sin embargo, cualquier usuario del área de trabajo puede modificar los archivos de biblioteca almacenados en DBFS. Para mejorar la seguridad de las bibliotecas en un área de trabajo de Azure Databricks, el almacenamiento de archivos de biblioteca en la raíz de DBFS está en desuso y está deshabilitado de manera predeterminada en Databricks Runtime 15.0 y versiones posteriores. Consulte El almacenamiento de bibliotecas en la raíz de DBFS está en desuso y deshabilitado de manera predeterminada.

En su lugar, Databricks recomienda cargar todas las bibliotecas, incluidas las bibliotecas de Python, los archivos JAR y los conectores de Spark, en archivos de área de trabajo o volúmenes de Unity Catalog, o mediante repositorios de paquetes de biblioteca. Si la carga de trabajo no admite estos patrones, también puede usar bibliotecas almacenadas en el almacenamiento de objetos en la nube.

  1. En la lista del botón de origen de la biblioteca, seleccione Cargar.
  2. Seleccione Jar, Python Egg o Python Whl.
  3. Opcionalmente, escriba un nombre de biblioteca.
  4. Arrastre el archivo Jar, Egg o Whl al cuadro de colocación o haga clic en el cuadro de colocación y vaya a un archivo. El archivo se carga en dbfs:/FileStore/jars.
  5. Haga clic en Crear. Se muestra la pantalla de estado de la biblioteca.

Referencia a un archivo JAR, egg de Python o wheel de Python cargado

Puede crear una nueva biblioteca de áreas de trabajo haciendo referencia a archivos JAR, Python Egg o Python Wheel almacenados en la raíz de DBFS, en el almacenamiento de objetos o con archivos del área de trabajo. Después de este flujo de trabajo, se registra un puntero a una biblioteca sin cargar ni mover archivos.

Con Databricks Runtime 13.2 y versiones posteriores, también puede hacer referencia a un volumen en el catálogo de Unity. Esta función está en la versión preliminar pública.

Para el modo de acceso compartido, debe agregar archivos JAR a allowlist. Consulte Agregar a la lista de permitidos bibliotecas y scripts de inicialización en proceso compartido.

  1. Seleccione Ruta de acceso del archivo/ADLS en la lista del botón del origen de la biblioteca.
  2. Seleccione Jar, Python Egg o Python Whl.
  3. Opcionalmente, escriba un nombre de biblioteca.
  4. Especifique la ruta de acceso a la biblioteca, como en los ejemplos siguientes:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Haga clic en Crear. Se muestra la pantalla de estado de la biblioteca.

Para más información sobre cómo trabajar con bibliotecas en el almacenamiento de objetos, consulte Instalación de bibliotecas desde el almacenamiento de objetos.

Para obtener más información, consulte Trabajo con archivos en Azure Databricks.

Instalación de una biblioteca de áreas de trabajo en un clúster

Nota:

Azure Databricks procesa todas las bibliotecas de áreas de trabajo en el orden en que se hayan instalado en el clúster. Es posible que tenga que prestar atención al orden de instalación en el clúster si hay dependencias entre bibliotecas.

Importante

Las bibliotecas se pueden instalar desde DBFS cuando se usa Databricks Runtime 14.3 LTS y versiones anteriores. Sin embargo, cualquier usuario del área de trabajo puede modificar los archivos de biblioteca almacenados en DBFS. Para mejorar la seguridad de las bibliotecas en un área de trabajo de Azure Databricks, el almacenamiento de archivos de biblioteca en la raíz de DBFS está en desuso y está deshabilitado de manera predeterminada en Databricks Runtime 15.0 y versiones posteriores. Consulte El almacenamiento de bibliotecas en la raíz de DBFS está en desuso y deshabilitado de manera predeterminada.

En su lugar, Databricks recomienda cargar todas las bibliotecas, incluidas las bibliotecas de Python, los archivos JAR y los conectores de Spark, en archivos de área de trabajo o volúmenes de Unity Catalog, o mediante repositorios de paquetes de biblioteca. Si la carga de trabajo no admite estos patrones, también puede usar bibliotecas almacenadas en el almacenamiento de objetos en la nube.

En el modo de acceso de usuario único, se usa la identidad de la entidad asignada (un usuario o una entidad de servicio). En el modo de acceso compartido, las bibliotecas usan la identidad del usuario que instaló la biblioteca. El modo de acceso compartido sin aislamiento no admite volúmenes, pero usa la misma asignación de identidad que el modo de acceso compartido.

Para ver todas las opciones para instalar bibliotecas en clústeres, consulte Bibliotecas de clústeres.

Para instalar una biblioteca que ya existe en el área de trabajo, puede empezar desde la interfaz de usuario del clúster o la interfaz de usuario de la biblioteca:

Clúster

  1. Haga clic en icono de ProcesoCompute (Proceso) en la barra lateral.
  2. Haga clic en un nombre de clúster.
  3. Haga clic en la pestaña Bibliotecas.
  4. Haga clic en Instalar nueva.
  5. En la lista del botón del origen de la biblioteca, seleccione Biblioteca del área de trabajo.
  6. Seleccione una biblioteca de áreas de trabajo.
  7. Haga clic en Instalar.

Biblioteca

  1. Vaya a la carpeta que contiene la biblioteca.
  2. Haga clic en el nombre de la biblioteca.
  3. Active la casilla situada junto al clúster en el que quiere instalar la biblioteca y haga clic en Instalar. Solo los clústeres en ejecución aparecen en la lista.

Visualización de detalles de bibliotecas de áreas de trabajo

Nota:

Las carpetas del área de trabajo proporcionan comodidad para detectar bibliotecas de áreas de trabajo y administrar ACL.

  1. Vaya a la carpeta del área de trabajo que contiene la biblioteca.
  2. Haga clic en el nombre de la biblioteca.

La página de detalles de la biblioteca muestra los clústeres en ejecución y el estado de instalación de la biblioteca. Si la biblioteca está instalada, la página contiene un vínculo al host del paquete. Si la biblioteca se ha cargado, la página muestra un vínculo al archivo de paquete cargado.

Traslado de una biblioteca de áreas de trabajo

Nota:

Las carpetas del área de trabajo proporcionan comodidad para detectar bibliotecas de áreas de trabajo y administrar ACL. Mover una biblioteca de áreas de trabajo no mueve archivos, pero puede modificar qué usuarios tienen acceso a la biblioteca de áreas de trabajo.

  1. Vaya a la carpeta del área de trabajo que contiene la biblioteca.
  2. Haga clic con el botón derecho en el nombre de la biblioteca y seleccione Mover. Aparece un explorador de carpetas.
  3. Haga clic en la carpeta de destino.
  4. Haga clic en Mover.

Eliminación de una biblioteca de áreas de trabajo

Importante

Antes de eliminar una biblioteca de áreas de trabajo, debe desinstalarla de todos los clústeres.

Para eliminar una biblioteca de áreas de trabajo:

  1. Mueva la biblioteca a la carpeta Papelera.
  2. Elimine permanentemente la biblioteca en la carpeta Papelera o vacíe la carpeta.