Condividi tramite


Gestione delle librerie in Spark

Importante

Questa funzionalità è attualmente disponibile solo in anteprima. Le condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure disponibili in versione beta, in anteprima o non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere Informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguire microsoft per altri aggiornamenti nella community di Azure HDInsight.

Lo scopo di Gestione librerie è rendere disponibile codice open source o personalizzato per notebook e processi in esecuzione nei cluster. È possibile caricare librerie Python dai repository PyPI. Questo articolo è incentrato sulla gestione delle librerie nell'interfaccia utente del cluster. Azure HDInsight nel servizio Azure Kubernetes include già molte librerie comuni nel cluster. Per vedere quali librerie sono incluse in HDI nel cluster del servizio Azure Kubernetes, esaminare la pagina di gestione delle librerie.

Installare le librerie

È possibile installare le librerie in due modalità:

  • Cluster installato
  • Ambito notebook

Cluster installato

Tutti i notebook in esecuzione in un cluster possono usare le librerie cluster. È possibile installare una libreria di cluster direttamente da un repository pubblico, ad esempio PyPi. Il caricamento dai repository Maven, il caricamento di librerie personalizzate dall'archiviazione cloud è nella roadmap.

Screenshot che mostra la pagina gestione librerie installata nel cluster.

Ambito notebook

Librerie con ambito notebook, disponibili per Python e Scala, che consentono di installare librerie e creare un ambiente con ambito una sessione del notebook. Queste librerie non influiscono su altri notebook in esecuzione nello stesso cluster. Le librerie con ambito notebook non vengono mantenute e devono essere reinstallate per ogni sessione.

Nota

Usare librerie con ambito notebook quando è necessario un ambiente personalizzato per un notebook specifico.

Modalità di installazione della libreria

PyPI: recuperare le librerie dal repository PyPI open source menzionando il nome e la versione della libreria nell'interfaccia utente di installazione.

Visualizzare le librerie installate

  1. Nella pagina Panoramica passare a Gestione librerie.

    Screenshot che mostra la pagina gestione librerie.

  2. Da Gestione cluster Spark fare clic su Gestione librerie.

  3. È possibile visualizzare l'elenco delle librerie installate da qui.

    Screenshot che mostra come visualizzare le librerie installate.

Aggiungere il widget della libreria

PyPI

  1. Nella scheda PyPI immettere il nome del pacchetto e la versione del pacchetto.

  2. Fare clic su Installa.

    Screenshot che mostra come installare PyPI.

Disinstallazione di librerie

Se si decide di non usare più le librerie, è possibile eliminare facilmente i pacchetti delle librerie tramite il pulsante di disinstallazione nella pagina di gestione delle librerie.

  1. Selezionare e fare clic sul nome della libreria

    Screenshot che mostra come selezionare la libreria.

  2. Fare clic su Disinstalla nel widget

    Screenshot che mostra come disinstallare la libreria.

    Nota

    • I pacchetti installati da Jupyter Notebook possono essere eliminati solo da Jupyter Notebook.
    • I pacchetti installati da Gestione librerie possono essere disinstallati solo da Gestione librerie.
    • Per aggiornare una libreria o un pacchetto, disinstallare la versione corrente della libreria e reinstallare la versione richiesta della libreria.
    • L'installazione di librerie da Jupyter Notebook è particolare per la sessione. Non è persistente.
    • L'installazione di pacchetti pesanti può richiedere del tempo a causa delle dimensioni e della complessità.