Administrer Python-biblioteker i Microsoft Fabric

Biblioteker indeholder genanvendelig kode, som du måske vil inkludere i dine programmer eller projekter. Hvert arbejdsområde leveres med et forudinstalleret sæt biblioteker, der er tilgængelige i Spark-kørselstiden, og som kan bruges med det samme i definitionen af notesbogen eller Spark-jobbet. Vi refererer til disse som indbyggede biblioteker. Du kan dog opleve, at du skal inkludere flere biblioteker til dit scenarie for maskinel indlæring. I dette dokument beskrives det, hvordan du kan bruge Microsoft Fabric til at installere Python-biblioteker til dine arbejdsprocesser for datavidenskab.

Python-biblioteker i Microsoft Fabric

I Fabric er der to metoder til at tilføje yderligere Python-biblioteker.

  • Feedbibliotek: Feedbiblioteker refererer til dem, der er bosat i offentlige kilder eller lagre. Vi understøtter i øjeblikket Python-feedbiblioteker fra PyPI og Conda. Man kan angive kilden i biblioteksadministrationsportaler.

  • Brugerdefineret bibliotek: Brugerdefinerede biblioteker er den kode, der er oprettet af dig eller din organisation. .whl og .jar kan administreres via biblioteksadministrationsportaler.

Du kan få mere at vide om feed og brugerdefinerede biblioteker ved at gå til dokumentationen administrer biblioteker i Fabric.

Installér arbejdsområdebiblioteker

Biblioteker på arbejdsområdeniveau gør det muligt for dataeksperter at standardisere sæt af biblioteker og versioner på tværs af alle brugere i deres arbejdsområde. Indstillinger for arbejdsområdebibliotek definerer arbejdsmiljøet for hele arbejdsområdet. De biblioteker, der er installeret på arbejdsområdeniveau, er tilgængelige for alle notesbøger og Spark-jobdefinitioner under det pågældende arbejdsområde. Da disse biblioteker gøres tilgængelige på tværs af sessioner, er det bedst at bruge arbejdsområdebiblioteker, når du vil konfigurere et delt miljø for alle sessioner i et arbejdsområde.

Vigtigt

Det er kun administratoren af arbejdsområdet, der har adgang til at opdatere indstillingerne på arbejdsområdeniveau.

Du kan bruge indstillingerne for arbejdsområdet til at installere både Python-feed og brugerdefinerede biblioteker. Du kan få mere at vide ved at besøge Administrer biblioteker i Fabric.

Brug indstillinger for arbejdsområde til at administrere feedbiblioteker

I nogle tilfælde kan det være en god idé at forudinstallere visse Python-feedbiblioteker fra PyPI eller Conda på tværs af alle dine notesbogsessioner. Det gør du ved at navigere til dit arbejdsområde og administrere disse biblioteker via indstillingerne for Python-arbejdsområdet.

Fra indstillingen Arbejdsområde kan du gøre følgende:

  • Visnings- og søgefeedbibliotek: Listen over installerede biblioteker vises, når du åbner panelet til administration af biblioteket. I denne visning kan du se bibliotekets navn, version og relaterede afhængigheder. Du kan også søge for hurtigt at finde et bibliotek fra denne liste.
  • Tilføj nyt feedbibliotek: Du kan tilføje et nyt Python-feedbibliotek fra PyPI eller Conda. Når installationskilden er valgt, kan du vælge knappen + , og der vises en ny linje. Hvis du vil tilføje et bibliotek, skal du angive navnet på biblioteket og eventuelt angive eversionen i den næste linje. Hvis du vil overføre en liste over biblioteker på samme tid, kan du uploade en .yml fil, der indeholder de påkrævede afhængigheder.

Brug indstillinger for arbejdsområde til at administrere brugerdefinerede biblioteker

Ved hjælp af indstillingen Arbejdsområde kan du også gøre brugerdefinerede Python-filer .whl tilgængelige for alle notesbøger i dit arbejdsområde. Når ændringerne er gemt, installerer Fabric dine brugerdefinerede biblioteker og deres relaterede afhængigheder.

Indbygget installation

Når du udvikler en model til maskinel indlæring eller udfører ad hoc-dataanalyser, skal du muligvis hurtigt installere et bibliotek til din Apache Spark-session. Det gør du ved at bruge de indbyggede installationsfunktioner til hurtigt at komme i gang med nye biblioteker.

Bemærk

Indbygget installation påvirker kun den aktuelle notesbogsession. Det betyder, at en ny session ikke omfatter de pakker, der er installeret i tidligere sessioner.

Vi anbefaler, at du placerer alle de kommandoer på linjen, der tilføjer, sletter eller opdaterer Python-pakkerne i den første celle i notesbogen. Ændringen af Python-pakker træder i kraft, når du har genstartet Python-fortolkeren. De variabler, der er defineret, før kommandocellen køres, går tabt.

Installér Python-feedbiblioteker i en notesbog

Kommandoen %pip i Microsoft Fabric svarer til den almindeligt anvendte pip-kommando i mange arbejdsprocesser for datavidenskab. I følgende afsnit vises eksempler på, hvordan du kan bruge %pip kommandoer til at installere feedbiblioteker direkte i notesbogen.

  1. Kør følgende kommandoer i en kodecelle i notesbogen for at installere altair-biblioteket og vega_datasets:

    %conda install altair          # install latest version through conda command
    %conda install vega_datasets   # install latest version through conda command
    

    Logfilen i celleoutputtet angiver resultatet af installationen.

  2. Importér pakken og datasættet ved at køre følgende koder i en anden notesbogcelle:

    import altair as alt
    from vega_datasets import data
    

Bemærk

Når du installerer nye Python-biblioteker, tager kommandoen %conda install normalt mere tid end installationen af %pip , da den kontrollerer de fulde afhængigheder for at registrere konflikter. Du kan bruge %conda-installation , når du vil undgå potentielle problemer. Brug %pip-installation , når du er sikker på, at det bibliotek, du forsøger at installere, ikke har nogen konflikt med de forudinstallerede biblioteker i kørselsmiljøet.

Tip

Alle tilgængelige Python-in-line-kommandoer og dens afklaringer kan findes: %pip-kommandoer og %conda-kommandoer

Administrer brugerdefinerede Python-biblioteker via indbygget installation

I nogle tilfælde har du muligvis et brugerdefineret bibliotek, som du hurtigt vil installere til en notesbogsession. Det gør du ved at overføre dit brugerdefinerede Python-bibliotek til mappen Lakehouse-fil , der er vedhæftet en notesbog.

Hvis du vil dette, skal du gøre som følger:

  1. Naviger til Lakehouse, og vælg ... i mappen Filer .

  2. Upload derefter din brugerdefinerede Python eller wheel dit brugerdefinerede Python-bibliotekjar.

  3. Når du har uploadet filen, kan du bruge følgende kommando til at installere det brugerdefinerede bibliotek i notesbogsessionen:

    # install the .whl through pip command
    %pip install /lakehouse/default/Files/wheel_file_name.whl             
    

Næste trin