Bibliotecas de áreas de trabajo (heredadas)

Importante

Esta documentación se ha retirado y es posible que no se actualice. Los productos, servicios o tecnologías mencionados en este contenido ya no se admiten. Consulte Bibliotecas con ámbito de cómputo.

Nota:

Las bibliotecas del espacio de trabajo han quedado en desuso y no deberían usarse. Sin embargo, el almacenamiento de bibliotecas como archivos de espacio de trabajo es distinto de las bibliotecas de espacio de trabajo y continúa siendo totalmente compatible. Puede instalar bibliotecas almacenadas como archivos de área de trabajo directamente en tareas de cálculo o de trabajo.

Las bibliotecas de áreas de trabajo sirven como repositorio local desde el que se crean bibliotecas instaladas en clúster. Una biblioteca de área de trabajo podría ser un código personalizado creado por una organización, o bien una versión concreta de una biblioteca de código abierto en la que su organización haya establecido los estándares.

Debe instalar una biblioteca de áreas de trabajo en un clúster para poder usarla en un cuaderno o trabajo. Consulte Instalación de una biblioteca de áreas de trabajo en un clúster.

Las bibliotecas de áreas de trabajo de la carpeta Compartido están disponibles para todos los usuarios de un área de trabajo, mientras que las bibliotecas de áreas de trabajo de una carpeta de usuario solo están disponibles para ese usuario.

Importante

Las bibliotecas se pueden instalar desde DBFS cuando se usa Databricks Runtime 14.3 LTS y versiones anteriores. Sin embargo, cualquier usuario del área de trabajo puede modificar los archivos de biblioteca almacenados en DBFS. Para mejorar la seguridad de las bibliotecas en un área de trabajo de Azure Databricks, el almacenamiento de archivos de biblioteca en la raíz de DBFS está en desuso y deshabilitado de forma predeterminada en Databricks Runtime 15.1 y versiones posteriores. Consulte El almacenamiento de bibliotecas en la raíz de DBFS está en desuso y deshabilitado de manera predeterminada.

En su lugar, Databricks recomienda cargar todas las bibliotecas, incluidas las bibliotecas de Python, archivos JAR y conectores de Spark, en archivos del área de trabajo o volúmenes del Catálogo de Unity, o mediante repositorios de paquetes de biblioteca. Si la carga de trabajo no admite estos patrones, también puede usar bibliotecas almacenadas en el almacenamiento de objetos en la nube.

¿Cómo difieren las bibliotecas del área de trabajo de las bibliotecas almacenadas con archivos del área de trabajo?

El término "bibliotecas del área de trabajo" hace referencia a cualquier biblioteca registrada en un área de trabajo. Las bibliotecas del área de trabajo aparecen junto con cuadernos y archivos del área de trabajo y siguen las reglas de ACL para su directorio contenedor.

El término "archivos del área de trabajo" hace referencia a cualquier archivo arbitrario almacenado en el área de trabajo. Puede almacenar paquetes .whl de Python como archivos de espacio de trabajo y, a continuación, registrarlos como bibliotecas del área de trabajo. Consulte ¿Qué son los archivos del área de trabajo?

Puede cargar bibliotecas como archivos del área de trabajo. Consulte Uso básico de los archivos del área de trabajo.

Aunque puede cargar muchos tipos de archivos en archivos del área de trabajo, solo se pueden instalar archivos .whl Python mediante archivos del área de trabajo. Consulte Bibliotecas con ámbito de cómputo.

En Databricks Runtime 13.3 LTS y versiones posteriores, puede usar %pip para instalar archivos wheel de Python que están almacenados como archivos en el espacio de trabajo. Consulte Instalar un paquete almacenado como archivo de espacio de trabajo con %pip.

Creación de una biblioteca de áreas de trabajo

Advertencia

Esta funcionalidad ya no está disponible. Consulte La creación e instalación de bibliotecas de áreas de trabajo ya no está disponible.

  1. Haga clic con el botón derecho en la carpeta del área de trabajo en la que quiere almacenar la biblioteca.
  2. Seleccione Crear > Biblioteca. Aparece el cuadro de diálogo Crear biblioteca.
  3. Seleccione el origen de la biblioteca y siga el procedimiento adecuado:

Cargar un archivo Jar, Python egg o Python wheel

Nota:

La instalación de archivos de huevo de Python es obsoleta y se eliminará en una versión futura de Databricks Runtime.

Importante

Las bibliotecas se pueden instalar desde DBFS cuando se usa Databricks Runtime 14.3 LTS y versiones anteriores. Sin embargo, cualquier usuario del área de trabajo puede modificar los archivos de biblioteca almacenados en DBFS. Para mejorar la seguridad de las bibliotecas en un área de trabajo de Azure Databricks, el almacenamiento de archivos de biblioteca en la raíz de DBFS está en desuso y deshabilitado de forma predeterminada en Databricks Runtime 15.1 y versiones posteriores. Consulte El almacenamiento de bibliotecas en la raíz de DBFS está en desuso y deshabilitado de manera predeterminada.

En su lugar, Databricks recomienda cargar todas las bibliotecas, incluidas las bibliotecas de Python, archivos JAR y conectores de Spark, en archivos del área de trabajo o volúmenes del Catálogo de Unity, o mediante repositorios de paquetes de biblioteca. Si la carga de trabajo no admite estos patrones, también puede usar bibliotecas almacenadas en el almacenamiento de objetos en la nube.

  1. En la lista de botones de la biblioteca de origen, seleccione Cargar.
  2. Seleccione Jar, Python Egg o Python Whl.
  3. Opcionalmente, escriba un nombre de biblioteca.
  4. Arrastre el archivo Jar, Egg o Whl al área de colocación o haga clic en el área de colocación y seleccione un archivo. El archivo se carga en dbfs:/FileStore/jars.
  5. Haga clic en Crear. Se muestra la pantalla de estado de la biblioteca.

Referencia un archivo JAR cargado, Python egg o Python wheel

Puede crear una biblioteca del área de trabajo haciendo referencia a archivos JAR, egg de Python o wheel de Python almacenados en la raíz de DBFS, en el almacenamiento de objetos o con archivos del área de trabajo. Después de este flujo de trabajo, se registra un puntero a una biblioteca sin cargar ni mover archivos.

Con Databricks Runtime 13.2 y versiones posteriores, también puede hacer referencia a un volumen en el catálogo de Unity. Esta función está en la versión preliminar pública.

Para el proceso con el modo de acceso estándar (anteriormente modo de acceso compartido), debe agregar los JARs al allowlist. Consulte Lista de permitidos de bibliotecas y scripts de inicialización en procesos con el modo de acceso estándar (anteriormente modo de acceso compartido).

  1. Seleccione Ruta de acceso del archivo/ADLS en la lista de botones de la fuente de la biblioteca.
  2. Seleccione Jar, Python Egg o Python Whl.
  3. Opcionalmente, escriba un nombre de biblioteca.
  4. Especifique la ruta de acceso a la biblioteca, como en los ejemplos siguientes:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Haga clic en Crear. Se muestra la pantalla de estado de la biblioteca.

Para más información sobre cómo trabajar con bibliotecas en el almacenamiento de objetos, consulte Instalación de bibliotecas desde el almacenamiento de objetos.

Para obtener más información sobre los archivos del área de trabajo, consulte Work with files on Azure Databricks (Trabajo con archivos en Azure Databricks.

Instalación de una biblioteca de áreas de trabajo en un clúster

Nota:

Azure Databricks procesa todas las bibliotecas del área de trabajo en el orden en que se instalaron en el clúster. Es posible que tenga que prestar atención al orden de instalación en el clúster si hay dependencias entre bibliotecas.

Importante

Las bibliotecas se pueden instalar desde DBFS cuando se usa Databricks Runtime 14.3 LTS y versiones anteriores. Sin embargo, cualquier usuario del área de trabajo puede modificar los archivos de biblioteca almacenados en DBFS. Para mejorar la seguridad de las bibliotecas en un área de trabajo de Azure Databricks, el almacenamiento de archivos de biblioteca en la raíz de DBFS está en desuso y deshabilitado de forma predeterminada en Databricks Runtime 15.1 y versiones posteriores. Consulte El almacenamiento de bibliotecas en la raíz de DBFS está en desuso y deshabilitado de manera predeterminada.

En su lugar, Databricks recomienda cargar todas las bibliotecas, incluidas las bibliotecas de Python, archivos JAR y conectores de Spark, en archivos del área de trabajo o volúmenes del Catálogo de Unity, o mediante repositorios de paquetes de biblioteca. Si la carga de trabajo no admite estos patrones, también puede usar bibliotecas almacenadas en el almacenamiento de objetos en la nube.

En el modo de acceso de usuario único, se usa la identidad del principal asignado (un usuario o un principal de servicio). En el modo de acceso estándar (anteriormente modo de acceso compartido), las bibliotecas usan la identidad del usuario que instaló la biblioteca. El modo de acceso compartido sin aislamiento no admite volúmenes, pero usa la misma asignación de identidad que el modo de acceso estándar.

Para ver todas las opciones para instalar bibliotecas en clústeres, consulte Bibliotecas a nivel de cálculo.

Para instalar una biblioteca que ya existe en el área de trabajo, puede empezar desde la interfaz de usuario del clúster o la interfaz de usuario de la biblioteca:

Clúster

  1. Haga clic en icono de CalcularCalcular en la barra lateral.
  2. Haga clic en un nombre de clúster.
  3. Haga clic en la pestaña Bibliotecas.
  4. Haga clic en Instalar nueva.
  5. En la lista de botones de origen de la biblioteca, seleccione Biblioteca del área de trabajo.
  6. Seleccione una biblioteca del espacio de trabajo.
  7. Haga clic en Instalar.

Biblioteca

  1. Vaya a la carpeta que contiene la biblioteca.
  2. Haga clic en el nombre de la biblioteca.
  3. Active la casilla situada junto al clúster en el que quiere instalar la biblioteca y haga clic en Instalar. Solo los clústeres en ejecución aparecen en la lista.

Ver detalles de bibliotecas del entorno de trabajo

Nota:

Las carpetas de workspace proporcionan facilidad para descubrir bibliotecas de workspace y gestionar listas de control de acceso (ACLs).

  1. Vaya a la carpeta del área de trabajo que contiene la biblioteca.
  2. Haga clic en el nombre de la biblioteca.

La página de detalles de la biblioteca muestra los clústeres en ejecución y el estado de instalación de la biblioteca. Si la biblioteca está instalada, la página contiene un vínculo al host del paquete. Si la biblioteca se ha cargado, la página muestra un vínculo al archivo de paquete cargado.

Traslado de una biblioteca de áreas de trabajo

Nota:

Las carpetas de workspace proporcionan facilidad para descubrir bibliotecas de workspace y gestionar listas de control de acceso (ACLs). Mover una biblioteca de áreas de trabajo no mueve archivos, pero puede modificar qué usuarios tienen acceso a la biblioteca de áreas de trabajo.

  1. Vaya a la carpeta del área de trabajo que contiene la biblioteca.
  2. Haga clic con el botón derecho en el nombre de la biblioteca y seleccione Mover. Aparece un explorador de carpetas.
  3. Haga clic en la carpeta de destino.
  4. Haga clic en Mover.

Eliminar una biblioteca del espacio de trabajo

Importante

Antes de eliminar una biblioteca del área de trabajo, debe desinstalarla de todos los clústeres.

Para eliminar una biblioteca de espacio de trabajo:

  1. Mueva la biblioteca a la carpeta Papelera.
  2. Elimine permanentemente la biblioteca en la carpeta Papelera o vacíe la carpeta.