Gestire le librerie Python in Microsoft Fabric

Le librerie forniscono codice riutilizzabile che è possibile includere nei programmi o nei progetti. Ogni area di lavoro include un set di librerie preinstallato disponibile in fase di esecuzione spark e disponibile per essere usato immediatamente nel notebook o nella definizione del processo Spark. Si fa riferimento a queste librerie predefinite. Tuttavia, potrebbe essere necessario includere librerie aggiuntive per lo scenario di Machine Learning. Questo documento descrive come usare Microsoft Fabric per installare le librerie Python per i flussi di lavoro di data science.

Librerie Python in Microsoft Fabric

All'interno di Fabric sono disponibili 2 metodi per aggiungere altre librerie Python.

  • Libreria di feed: le librerie di feed fanno riferimento a quelle che risiedono in origini o repository pubblici. Attualmente sono supportate le librerie di feed Python da PyPI e Conda. È possibile specificare l'origine nei portali di gestione delle librerie.

  • Libreria personalizzata: le librerie personalizzate sono il codice creato dall'utente o dall'organizzazione. .whl e .jar possono essere gestiti tramite i portali di gestione delle librerie.

Per altre informazioni sui feed e sulle librerie personalizzate, vedere la documentazione relativa alla gestione delle librerie in Infrastruttura.

Installare le librerie dell'area di lavoro

Le librerie a livello di area di lavoro consentono ai data scientist di standardizzare i set di librerie e versioni in tutti gli utenti dell'area di lavoro. Le impostazioni della libreria dell'area di lavoro definiscono l'ambiente di lavoro per l'intera area di lavoro. Le librerie installate a livello di area di lavoro sono disponibili per tutti i notebook e le definizioni dei processi Spark in tale area di lavoro. Poiché queste librerie vengono rese disponibili tra le sessioni, è consigliabile usare le librerie dell'area di lavoro quando si vuole configurare un ambiente condiviso per tutte le sessioni in un'area di lavoro.

Importante

Solo l'amministratore dell'area di lavoro ha accesso per aggiornare le impostazioni a livello di area di lavoro.

È possibile usare le impostazioni dell'area di lavoro per installare sia il feed Python che le librerie personalizzate. Per altre informazioni, vedere Gestire le librerie in Fabric.

Usare le impostazioni dell'area di lavoro per gestire le librerie di feed

In alcuni casi, è possibile preinstallare determinate librerie di feed Python da PyPI o Conda in tutte le sessioni del notebook. A tale scopo, è possibile passare all'area di lavoro e gestire queste librerie tramite le impostazioni dell'area di lavoro Python.

Dall'impostazione Area di lavoro è possibile eseguire le operazioni seguenti:

  • Visualizzare e cercare la libreria dei feed: l'elenco delle librerie installate viene visualizzato quando si apre il pannello di gestione delle librerie. Da questa vista è possibile visualizzare il nome, la versione e le dipendenze correlate della libreria. È anche possibile cercare rapidamente una raccolta da questo elenco.
  • Aggiungere una nuova libreria di feed: è possibile aggiungere una nuova libreria di feed Python da PyPI o Conda. Dopo aver selezionato l'origine di installazione, è possibile selezionare il + pulsante e viene visualizzata una nuova riga. Per aggiungere una libreria, è necessario specificare il nome della libreria e, facoltativamente, specificare th eversion nella riga successiva. Per caricare contemporaneamente un elenco di raccolte, è possibile caricare un .yml file contenente le dipendenze necessarie.

Usare le impostazioni dell'area di lavoro per gestire librerie personalizzate

Usando l'impostazione Area di lavoro, è anche possibile rendere disponibili file Python .whl personalizzati per tutti i notebook nell'area di lavoro. Dopo aver salvato le modifiche, Fabric installerà le librerie personalizzate e le relative dipendenze.

Installazione in linea

Quando si sviluppa un modello di Machine Learning o si esegue l'analisi dei dati ad hoc, potrebbe essere necessario installare rapidamente una libreria per la sessione di Apache Spark. A tale scopo, è possibile usare le funzionalità di installazione in linea per iniziare rapidamente a usare nuove librerie.

Nota

L'installazione in linea influisce solo sulla sessione del notebook corrente. Ciò significa che una nuova sessione non includerà i pacchetti installati nelle sessioni precedenti.

È consigliabile inserire tutti i comandi nella riga che aggiungono, eliminano o aggiornano i pacchetti Python nella prima cella del notebook. La modifica dei pacchetti Python sarà effettiva dopo il riavvio dell'interprete Python. Le variabili definite prima di eseguire la cella di comando andranno perse.

Installare le librerie di feed Python in un notebook

Il %pip comando in Microsoft Fabric equivale al comando pip comunemente usato in molti flussi di lavoro di data science. La sezione seguente illustra alcuni esempi di come è possibile usare %pip i comandi per installare le librerie di feed direttamente nel notebook.

  1. Eseguire i comandi seguenti in una cella di codice del notebook per installare la libreria altair e vega_datasets:

    %conda install altair          # install latest version through conda command
    %conda install vega_datasets   # install latest version through conda command
    

    Il log nell'output della cella indica il risultato dell'installazione.

  2. Importare il pacchetto e il set di dati eseguendo i codici seguenti in un'altra cella del notebook:

    import altair as alt
    from vega_datasets import data
    

Nota

Quando si installano nuove librerie Python, il comando %conda install richiede in genere più tempo rispetto a %pip install perché controlla le dipendenze complete per rilevare i conflitti. È possibile usare l'installazione di %conda quando si desidera evitare potenziali problemi. Usare %pip install quando si è certi della libreria che si sta tentando di installare non presenta conflitti con le librerie preinstallate nell'ambiente di runtime.

Suggerimento

Tutti i comandi python disponibili nella riga e i relativi chiarimenti sono disponibili: %pip comandi e %conda comandi

Gestire librerie Python personalizzate tramite l'installazione in linea

In alcuni casi, potrebbe essere disponibile una libreria personalizzata che si vuole installare rapidamente per una sessione di notebook. A tale scopo, è possibile caricare la libreria Python personalizzata nella cartella del file Lakehouse collegata al notebook.

Per eseguire questa operazione:

  1. Passare a Lakehouse e selezionare ... nella cartella File .

  2. Caricare quindi la libreria o wheel Python jar personalizzata.

  3. Dopo aver caricato il file, è possibile usare il comando seguente per installare la libreria personalizzata nella sessione del notebook:

    # install the .whl through pip command
    %pip install /lakehouse/default/Files/wheel_file_name.whl             
    

Passaggi successivi