Administrere Python-biblioteker i Microsoft Fabric

Biblioteker inneholder kode som kan brukes på nytt, som du kanskje vil inkludere i programmene eller prosjektene. Hvert arbeidsområde leveres med et forhåndsinstallert sett med biblioteker som er tilgjengelige i Spark-kjøretiden og kan brukes umiddelbart i notatblokken eller spark-jobbdefinisjonen. Vi refererer til disse som innebygde biblioteker. Det kan imidlertid hende at du må inkludere flere biblioteker for maskinlæringsscenarioet. Dette dokumentet beskriver hvordan du kan bruke Microsoft Fabric til å installere Python-biblioteker for datavitenskapsarbeidsflyter.

Python-biblioteker i Microsoft Fabric

I Fabric finnes det to metoder for å legge til flere Python-biblioteker.

  • Feedbibliotek: Feedbiblioteker refererer til de som er bosatt i offentlige kilder eller repositorier. Vi støtter for øyeblikket Python-feedbiblioteker fra PyPI og Conda, og én kan angi kilden i biblioteksbehandlingsportaler.

  • Egendefinert bibliotek: Egendefinerte biblioteker er koden som er bygd av deg eller organisasjonen. .whl og .jar kan administreres gjennom bibliotekbehandlingsportaler.

Du kan lære mer om feeder og egendefinerte biblioteker ved å gå til behandle bibliotekene i Fabric-dokumentasjonen.

Installer arbeidsområdebiblioteker

Biblioteker på arbeidsområdenivå gjør det mulig for dataforskere å standardisere settene med biblioteker og versjoner på tvers av alle brukere i arbeidsområdet. Innstillinger for arbeidsområdebibliotek definerer arbeidsmiljøet for hele arbeidsområdet. Bibliotekene som er installert på et arbeidsområdenivå, er tilgjengelige for alle notatblokker og Spark-jobbdefinisjoner under arbeidsområdet. Siden disse bibliotekene gjøres tilgjengelige på tvers av økter, er det best å bruke arbeidsområdebiblioteker når du vil konfigurere et delt miljø for alle økter i et arbeidsområde.

Viktig

Bare arbeidsområdeadministrator har tilgang til å oppdatere innstillingene for arbeidsområdenivå.

Du kan bruke innstillingene for arbeidsområdet til å installere både Python-feed og egendefinerte biblioteker. Hvis du vil ha mer informasjon, kan du gå til behandle biblioteker i Fabric.

Bruke innstillinger for arbeidsområde til å behandle feedbiblioteker

I noen tilfeller vil du kanskje forhåndsinstallere enkelte Python-feedbiblioteker fra PyPI eller Conda på tvers av alle notatblokkøktene. Hvis du vil gjøre dette, kan du navigere til arbeidsområdet og administrere disse bibliotekene gjennom innstillingene for Python-arbeidsområdet.

Fra arbeidsområdeinnstillingen kan du gjøre følgende:

  • Vis og søk i feedbibliotek: Den installerte biblioteklisten vises når du åpner bibliotekbehandlingspanelet. Fra denne visningen kan du se biblioteknavnet, versjonen og relaterte avhengigheter. Du kan også søke for raskt å finne et bibliotek fra denne listen.
  • Legg til nytt feedbibliotek: Du kan legge til et nytt Python-feedbibliotek fra PyPI eller Conda. Når installasjonskilden er valgt, kan du velge + knappen og en ny linje vises. Hvis du vil legge til et bibliotek, må du angi biblioteknavnet og eventuelt angi th eversion i neste linje. Hvis du vil laste opp en liste over biblioteker samtidig, kan du laste opp en .yml fil som inneholder de nødvendige avhengighetene.

Bruke innstillinger for arbeidsområde til å administrere egendefinerte biblioteker

Ved hjelp av innstillingen for arbeidsområde kan du også gjøre egendefinerte Python-filer .whl tilgjengelige for alle notatblokker i arbeidsområdet. Når endringene er lagret, installerer Fabric de egendefinerte bibliotekene og deres relaterte avhengigheter.

Innebygd installasjon

Når du utvikler en maskinlæringsmodell eller utfører ad hoc-dataanalyse, må du kanskje raskt installere et bibliotek for Apache Spark-økten. Hvis du vil gjøre dette, kan du bruke de innebygde installasjonsfunksjonene til raskt å komme i gang med nye biblioteker.

Obs!

Innebygd installasjon påvirker bare gjeldende notatblokkøkt. Dette betyr at en ny økt ikke inkluderer pakkene som ble installert i tidligere økter.

Vi anbefaler at du plasserer alle innebygde kommandoer som legger til, sletter eller oppdaterer Python-pakkene i den første cellen i notatblokken. Endringen av Python-pakker vil være effektiv når du starter Python-tolken på nytt. Variablene som er definert før du kjører kommandocellen, vil gå tapt.

Installere Python-feedbiblioteker i en notatblokk

Kommandoen %pip i Microsoft Fabric tilsvarer den ofte brukte pip-kommandoen i mange datavitenskapsarbeidsflyter. Den følgende delen viser eksempler på hvordan du kan bruke %pip kommandoer til å installere feedbiblioteker direkte i notatblokken.

  1. Kjør følgende kommandoer i en notatblokkkodecelle for å installere altair-biblioteket og vega_datasets:

    %conda install altair          # install latest version through conda command
    %conda install vega_datasets   # install latest version through conda command
    

    Loggen i celleutdataene angir resultatet av installasjonen.

  2. Importer pakken og datasettet ved å kjøre følgende koder i en annen notatblokkcelle:

    import altair as alt
    from vega_datasets import data
    

Obs!

Når du installerer nye Python-biblioteker, tar installeringskommandoen %conda vanligvis mer tid enn %pip-installasjon , siden den kontrollerer de fullstendige avhengighetene for å oppdage konflikter. Du vil kanskje bruke %conda-installasjon når du vil unngå potensielle problemer. Bruk %pip-installasjon når du er sikker på at biblioteket du prøver å installere, ikke er i konflikt med de forhåndsinstallerte bibliotekene i kjøretidsmiljøet.

Tips

Du finner alle tilgjengelige Python-innebygde kommandoer og klargjøringer: %pip-kommandoer og %conda-kommandoer

Behandle egendefinerte Python-biblioteker gjennom innebygd installasjon

I noen tilfeller kan det hende du har et egendefinert bibliotek som du raskt vil installere for en notatblokkøkt. Hvis du vil gjøre dette, kan du laste opp det egendefinerte Python-biblioteket til den notatblokkvedlagte Lakehouse-filmappen .

Slik gjør du det:

  1. Gå til Lakehouse og velg ... i Fil-mappen .

  2. Last deretter opp det egendefinerte Python jar - eller wheel biblioteket.

  3. Når du har lastet opp filen, kan du bruke følgende kommando til å installere det egendefinerte biblioteket i notatblokkøkten:

    # install the .whl through pip command
    %pip install /lakehouse/default/Files/wheel_file_name.whl             
    

Neste trinn