Librerie dell'area di lavoro (legacy)

Importante

Questa documentazione è stata ritirata e potrebbe non essere aggiornata. I prodotti, i servizi o le tecnologie menzionati in questo contenuto non sono più supportati. Vedere Librerie cluster.

Nota

Le librerie dell'area di lavoro sono deprecate e non devono essere usate. Tuttavia, l'archiviazione delle librerie come file dell'area di lavoro è distinta dalle librerie dell'area di lavoro ed è ancora completamente supportata. È possibile installare le librerie archiviate come file dell'area di lavoro direttamente nelle attività di calcolo o di processo.

Le librerie dell'area di lavoro fungono da repository locale da cui si creano librerie installate nel cluster. Una libreria dell'area di lavoro può essere costituita da codice personalizzato creato dall'organizzazione oppure potrebbe essere una versione specifica di una libreria open source su cui l'organizzazione si è standardizzata.

È necessario installare una libreria dell'area di lavoro in un cluster prima di poterla usare in un notebook o in un processo. Vedere Installare una libreria dell'area di lavoro in un cluster.

Le librerie dell'area di lavoro nella cartella Condivisa sono disponibili per tutti gli utenti di un'area di lavoro, mentre le librerie dell'area di lavoro in una cartella utente sono disponibili solo per tale utente.

Importante

Le librerie possono essere installate da DBFS quando si usa Databricks Runtime 14.3 LTS e versioni successive. Tuttavia, qualsiasi utente dell'area di lavoro può modificare i file di libreria archiviati in DBFS. Per migliorare la sicurezza delle librerie in un'area di lavoro di Azure Databricks, l'archiviazione dei file di libreria nella radice DBFS è deprecata e disabilitata per impostazione predefinita in Databricks Runtime 15.0 e versioni successive. Per impostazione predefinita, vedere Archiviazione di librerie nella radice DBFS deprecata e disabilitata.

Databricks consiglia invece di caricare tutte le librerie, incluse le librerie Python, i file JAR e i connettori Spark, nei file dell'area di lavoro o nei volumi del catalogo Unity o usando i repository dei pacchetti di libreria. Se il carico di lavoro non supporta questi modelli, è anche possibile usare le librerie archiviate nell'archiviazione di oggetti cloud.

In che modo le librerie dell'area di lavoro differiscono dalle librerie archiviate con i file dell'area di lavoro?

Il termine "librerie dell'area di lavoro" si riferisce a qualsiasi libreria registrata in un'area di lavoro. Le librerie dell'area di lavoro vengono visualizzate insieme ai notebook e ai file dell'area di lavoro e seguono le regole ACL per la directory contenitore.

Il termine "file dell'area di lavoro" si riferisce a qualsiasi file arbitrario archiviato nell'area di lavoro. È possibile archiviare i pacchetti .whl Python come file dell'area di lavoro e quindi registrarli come librerie dell'area di lavoro. Vedere Che cosa sono i file dell'area di lavoro?.

È possibile caricare le librerie come file dell'area di lavoro. Vedere Utilizzo di base dei file dell'area di lavoro.

Anche se è possibile caricare molti tipi di file nei file dell'area di lavoro, è possibile installare solo i file Python con estensione whl usando i file dell'area di lavoro. Vedere Librerie con ambito cluster.

In Databricks Runtime 13.3 LTS e versioni successive è possibile usare %pip per installare i file delle ruote python archiviati come file dell'area di lavoro. Vedere Installare un pacchetto archiviato come file dell'area di lavoro con %pip.

Creare una libreria dell'area di lavoro

Avviso

Questa funzionalità non è più disponibile. Vedere Creazione e installazione delle librerie dell'area di lavoro non più disponibile.

  1. Fare clic con il pulsante destro del mouse sulla cartella dell'area di lavoro in cui archiviare la libreria.
  2. Selezionare Crea > libreria. Verrà visualizzata la finestra di dialogo Crea libreria.
  3. Selezionare l'origine libreria e seguire la procedura appropriata:

Caricare un file Jar, Python egg o Python wheel

Nota

L'installazione dei file egg Python è deprecata e verrà rimossa in una versione futura di Databricks Runtime.

Importante

Le librerie possono essere installate da DBFS quando si usa Databricks Runtime 14.3 LTS e versioni successive. Tuttavia, qualsiasi utente dell'area di lavoro può modificare i file di libreria archiviati in DBFS. Per migliorare la sicurezza delle librerie in un'area di lavoro di Azure Databricks, l'archiviazione dei file di libreria nella radice DBFS è deprecata e disabilitata per impostazione predefinita in Databricks Runtime 15.0 e versioni successive. Per impostazione predefinita, vedere Archiviazione di librerie nella radice DBFS deprecata e disabilitata.

Databricks consiglia invece di caricare tutte le librerie, incluse le librerie Python, i file JAR e i connettori Spark, nei file dell'area di lavoro o nei volumi del catalogo Unity o usando i repository dei pacchetti di libreria. Se il carico di lavoro non supporta questi modelli, è anche possibile usare le librerie archiviate nell'archiviazione di oggetti cloud.

  1. Nell'elenco del pulsante Origine libreria selezionare Carica.
  2. Selezionare Jar, Python Egg o Python Whl.
  3. Facoltativamente, immettere un nome di libreria.
  4. Trascinare il file Jar, Egg o Whl nella casella di rilascio oppure fare clic sulla casella di rilascio e passare a un file. Il file viene caricato in dbfs:/FileStore/jars.
  5. Fai clic su Crea. Viene visualizzata la schermata relativa allo stato della libreria.

Fare riferimento a un file JAR caricato, python egg o python wheel

È possibile creare una nuova libreria dell'area di lavoro facendo riferimento ai file JAR, Python egg o Python wheel archiviati nella radice DBFS, nell'archiviazione oggetti o con i file dell'area di lavoro. Dopo questo flusso di lavoro viene registrato un puntatore a una libreria senza caricare o spostare file.

Con Databricks Runtime 13.2 e versioni successive, è anche possibile fare riferimento a un volume in Unity Catalog. Questa funzionalità è disponibile in anteprima pubblica.

Per la modalità di accesso condiviso, è necessario aggiungere file JAR a allowlist. Vedere Allowlist libraries and init scripts on shared compute .See Allowlist libraries and init scripts on shared compute.See Allowlist libraries and init scripts on shared compute.

  1. Selezionare Percorso file/ADLS nell'elenco del pulsante Origine libreria.
  2. Selezionare Jar, Python Egg o Python Whl.
  3. Facoltativamente, immettere un nome di libreria.
  4. Specificare il percorso della libreria, ad esempio gli esempi seguenti:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Fai clic su Crea. Viene visualizzata la schermata relativa allo stato della libreria.

Per altre informazioni sull'uso delle librerie nell'archiviazione oggetti, vedere Installare librerie dall'archiviazione di oggetti.

Per altre informazioni sui file dell'area di lavoro, vedere Usare i file in Azure Databricks.

Installare una libreria dell'area di lavoro in un cluster

Nota

Azure Databricks elabora tutte le librerie dell'area di lavoro nell'ordine in cui sono state installate nel cluster. Potrebbe essere necessario prestare attenzione all'ordine di installazione nel cluster se sono presenti dipendenze tra le librerie.

Importante

Le librerie possono essere installate da DBFS quando si usa Databricks Runtime 14.3 LTS e versioni successive. Tuttavia, qualsiasi utente dell'area di lavoro può modificare i file di libreria archiviati in DBFS. Per migliorare la sicurezza delle librerie in un'area di lavoro di Azure Databricks, l'archiviazione dei file di libreria nella radice DBFS è deprecata e disabilitata per impostazione predefinita in Databricks Runtime 15.0 e versioni successive. Per impostazione predefinita, vedere Archiviazione di librerie nella radice DBFS deprecata e disabilitata.

Databricks consiglia invece di caricare tutte le librerie, incluse le librerie Python, i file JAR e i connettori Spark, nei file dell'area di lavoro o nei volumi del catalogo Unity o usando i repository dei pacchetti di libreria. Se il carico di lavoro non supporta questi modelli, è anche possibile usare le librerie archiviate nell'archiviazione di oggetti cloud.

In modalità accesso utente singolo viene usata l'identità dell'entità assegnata (un utente o un'entità servizio). In modalità di accesso condiviso, le librerie usano l'identità dell'utente che ha installato la libreria. La modalità di accesso condiviso senza isolamento non supporta i volumi, ma usa la stessa assegnazione di identità della modalità di accesso condiviso.

Per visualizzare tutte le opzioni per l'installazione di librerie nei cluster, vedere Librerie di cluster.

Per installare una libreria già esistente nell'area di lavoro, è possibile iniziare dall'interfaccia utente del cluster o dall'interfaccia utente della libreria:

Cluster

  1. Nella barra laterale fare clic su icona di calcoloCalcolo.
  2. Fare clic sul nome di un cluster.
  3. Fare clic sulla scheda Librerie .
  4. Fare clic su Installa nuovo.
  5. Nell'elenco del pulsante Origine libreria selezionare Raccolta aree di lavoro.
  6. Selezionare una libreria dell'area di lavoro.
  7. Fare clic su Installa.

Libreria

  1. Passare alla cartella contenente la libreria.
  2. Fare clic sul nome della libreria.
  3. Selezionare la casella di controllo accanto al cluster in cui si vuole installare la libreria e fare clic su Installa. Nell'elenco vengono visualizzati solo i cluster in esecuzione.

Visualizzare i dettagli della libreria dell'area di lavoro

Nota

Le cartelle dell'area di lavoro offrono praticità per l'individuazione delle librerie delle aree di lavoro e la gestione degli elenchi di controllo di accesso.

  1. Passare alla cartella dell'area di lavoro contenente la libreria.
  2. Fare clic sul nome della libreria.

La pagina dei dettagli della libreria mostra i cluster in esecuzione e lo stato di installazione della libreria. Se la libreria è installata, la pagina contiene un collegamento all'host del pacchetto. Se la libreria è stata caricata, nella pagina viene visualizzato un collegamento al file del pacchetto caricato.

Spostare una libreria dell'area di lavoro

Nota

Le cartelle dell'area di lavoro offrono praticità per l'individuazione delle librerie delle aree di lavoro e la gestione degli elenchi di controllo di accesso. Lo spostamento di una libreria dell'area di lavoro non sposta i file, ma può modificare gli utenti che hanno accesso alla libreria dell'area di lavoro.

  1. Passare alla cartella dell'area di lavoro contenente la libreria.
  2. Fare clic con il pulsante destro del mouse sul nome della libreria e scegliere Sposta. Viene visualizzato un browser di cartelle.
  3. Fare clic sulla cartella di destinazione.
  4. Fare clic su Sposta.

Eliminare una libreria dell'area di lavoro

Importante

Prima di eliminare una libreria dell'area di lavoro, è necessario disinstallarla da tutti i cluster.

Per eliminare una libreria dell'area di lavoro:

  1. Spostare la libreria nella cartella Cestino.
  2. Eliminare definitivamente la libreria nella cartella Cestino o svuotare la cartella Cestino.