Condividi tramite


Gestione delle librerie in Spark

Importante

Azure HDInsight su AKS è stato ritirato il 31 gennaio 2025. Scopri di più con questo annuncio.

È necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare la chiusura brusca dei carichi di lavoro.

Importante

Questa funzionalità è attualmente in anteprima. Le condizioni supplementari per l'utilizzo per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure in versione beta, in anteprima o altrimenti non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere informazioni sull'anteprima di Azure HDInsight su AKS. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguitici per altri aggiornamenti sulla Community di Azure HDInsight.

Lo scopo di Gestione librerie è rendere disponibile codice open source o personalizzato per notebook e processi in esecuzione nei cluster. È possibile caricare librerie Python dai repository PyPI. Questo articolo è incentrato sulla gestione delle librerie nell'interfaccia utente del cluster. Azure HDInsight su AKS include già molte librerie comuni nel cluster. Per vedere quali librerie sono incluse in HDI nel cluster AKS, esaminare la pagina di gestione delle librerie.

Installare le librerie

È possibile installare le librerie in due modalità:

  • Cluster installato
  • Ambito limitato al notebook

Cluster installato

Tutti i notebook in esecuzione in un cluster possono usare le librerie cluster. È possibile installare una libreria di cluster direttamente da un repository pubblico, ad esempio PyPi. Il caricamento dai repository Maven, il caricamento di librerie personalizzate dall'archiviazione cloud è nella roadmap.

schermata che mostra la pagina gestione librerie installata nel cluster.

Ambito del notebook

Librerie specifiche per notebook, disponibili per Python e Scala, che consentono di installare librerie e creare un ambiente specifico per una sessione del notebook. Queste librerie non influiscono su altri notebook in esecuzione nello stesso cluster. Le librerie specifiche dei notebook non persistono e devono essere reinstallate per ogni sessione.

Nota

Utilizzare librerie ad ambito notebook quando è necessario creare un ambiente personalizzato per un determinato notebook.

Modalità di installazione della libreria

pyPI: recuperare le librerie dal repository PyPI open source menzionando il nome e la versione della libreria nell'interfaccia utente di installazione.

Visualizzare le librerie installate

  1. Nella pagina Panoramica passare a Gestione librerie.

    Screenshot che mostra la pagina gestione librerie.

  2. Da Gestione cluster Spark fare clic su Gestione librerie.

  3. È possibile visualizzare l'elenco delle librerie installate da qui.

    Screenshot che mostra come visualizzare le librerie installate.

Aggiungere il widget della libreria

PyPI

  1. Nella scheda PyPI immettere il Nome pacchetto e la versione del pacchetto..

  2. Fare clic su Installa.

    Screenshot che mostra come installare PyPI.

Disinstallazione di librerie

Se si decide di non usare più le librerie, è possibile eliminare facilmente i pacchetti delle librerie tramite il pulsante di disinstallazione nella pagina di gestione delle librerie.

  1. Selezionare e fare clic sul nome della libreria

    Screenshot che mostra come selezionare la libreria.

  2. Fare clic su Disinstalla nel widget

    Screenshot che mostra come disinstallare la libreria.

    Nota

    • I pacchetti installati da Jupyter Notebook possono essere eliminati solo da Jupyter Notebook.
    • I pacchetti installati da Gestione librerie possono essere disinstallati solo da Gestione librerie.
    • Per aggiornare una libreria o un pacchetto, disinstallare la versione corrente della libreria e reinstallare la versione richiesta della libreria.
    • L'installazione di librerie da Jupyter Notebook è particolare per la sessione. Non è persistente.
    • L'installazione di pacchetti pesanti può richiedere del tempo a causa delle dimensioni e della complessità.