Administrere Python-biblioteker i Microsoft Fabric
Biblioteker inneholder kode som kan brukes på nytt, som du kanskje vil inkludere i programmene eller prosjektene. Hvert arbeidsområde leveres med et forhåndsinstallert sett med biblioteker som er tilgjengelige i Spark-kjøretiden og kan brukes umiddelbart i notatblokken eller spark-jobbdefinisjonen. Vi refererer til disse som innebygde biblioteker. Det kan imidlertid hende at du må inkludere flere biblioteker for maskinlæringsscenarioet. Dette dokumentet beskriver hvordan du kan bruke Microsoft Fabric til å installere Python-biblioteker for datavitenskapsarbeidsflyter.
Python-biblioteker i Microsoft Fabric
I Fabric finnes det to metoder for å legge til flere Python-biblioteker.
Feedbibliotek: Feedbiblioteker refererer til de som er bosatt i offentlige kilder eller repositorier. Vi støtter for øyeblikket Python-feedbiblioteker fra PyPI og Conda, og én kan angi kilden i biblioteksbehandlingsportaler.
Egendefinert bibliotek: Egendefinerte biblioteker er koden som er bygd av deg eller organisasjonen. .whl og .jar kan administreres gjennom bibliotekbehandlingsportaler.
Du kan lære mer om feeder og egendefinerte biblioteker ved å gå til behandle bibliotekene i Fabric-dokumentasjonen.
Installer arbeidsområdebiblioteker
Biblioteker på arbeidsområdenivå gjør det mulig for dataforskere å standardisere settene med biblioteker og versjoner på tvers av alle brukere i arbeidsområdet. Innstillinger for arbeidsområdebibliotek definerer arbeidsmiljøet for hele arbeidsområdet. Bibliotekene som er installert på et arbeidsområdenivå, er tilgjengelige for alle notatblokker og Spark-jobbdefinisjoner under arbeidsområdet. Siden disse bibliotekene gjøres tilgjengelige på tvers av økter, er det best å bruke arbeidsområdebiblioteker når du vil konfigurere et delt miljø for alle økter i et arbeidsområde.
Viktig
Bare arbeidsområdeadministrator har tilgang til å oppdatere innstillingene for arbeidsområdenivå.
Du kan bruke innstillingene for arbeidsområdet til å installere både Python-feed og egendefinerte biblioteker. Hvis du vil ha mer informasjon, kan du gå til behandle biblioteker i Fabric.
Bruke innstillinger for arbeidsområde til å behandle feedbiblioteker
I noen tilfeller vil du kanskje forhåndsinstallere enkelte Python-feedbiblioteker fra PyPI eller Conda på tvers av alle notatblokkøktene. Hvis du vil gjøre dette, kan du navigere til arbeidsområdet og administrere disse bibliotekene gjennom innstillingene for Python-arbeidsområdet.
Fra arbeidsområdeinnstillingen kan du gjøre følgende:
- Vis og søk i feedbibliotek: Den installerte biblioteklisten vises når du åpner bibliotekbehandlingspanelet. Fra denne visningen kan du se biblioteknavnet, versjonen og relaterte avhengigheter. Du kan også søke for raskt å finne et bibliotek fra denne listen.
- Legg til nytt feedbibliotek: Du kan legge til et nytt Python-feedbibliotek fra PyPI eller Conda. Når installasjonskilden er valgt, kan du velge + knappen og en ny linje vises. Hvis du vil legge til et bibliotek, må du angi biblioteknavnet og eventuelt angi th eversion i neste linje. Hvis du vil laste opp en liste over biblioteker samtidig, kan du laste opp en
.yml
fil som inneholder de nødvendige avhengighetene.
Bruke innstillinger for arbeidsområde til å administrere egendefinerte biblioteker
Ved hjelp av innstillingen for arbeidsområde kan du også gjøre egendefinerte Python-filer .whl
tilgjengelige for alle notatblokker i arbeidsområdet. Når endringene er lagret, installerer Fabric de egendefinerte bibliotekene og deres relaterte avhengigheter.
Innebygd installasjon
Når du utvikler en maskinlæringsmodell eller utfører ad hoc-dataanalyse, må du kanskje raskt installere et bibliotek for Apache Spark-økten. Hvis du vil gjøre dette, kan du bruke de innebygde installasjonsfunksjonene til raskt å komme i gang med nye biblioteker.
Obs!
Innebygd installasjon påvirker bare gjeldende notatblokkøkt. Dette betyr at en ny økt ikke inkluderer pakkene som ble installert i tidligere økter.
Vi anbefaler at du plasserer alle innebygde kommandoer som legger til, sletter eller oppdaterer Python-pakkene i den første cellen i notatblokken. Endringen av Python-pakker vil være effektiv når du starter Python-tolken på nytt. Variablene som er definert før du kjører kommandocellen, vil gå tapt.
Installere Python-feedbiblioteker i en notatblokk
Kommandoen %pip
i Microsoft Fabric tilsvarer den ofte brukte pip-kommandoen i mange datavitenskapsarbeidsflyter. Den følgende delen viser eksempler på hvordan du kan bruke %pip
kommandoer til å installere feedbiblioteker direkte i notatblokken.
Kjør følgende kommandoer i en notatblokkkodecelle for å installere altair-biblioteket og vega_datasets:
%conda install altair # install latest version through conda command %conda install vega_datasets # install latest version through conda command
Loggen i celleutdataene angir resultatet av installasjonen.
Importer pakken og datasettet ved å kjøre følgende koder i en annen notatblokkcelle:
import altair as alt from vega_datasets import data
Obs!
Når du installerer nye Python-biblioteker, tar installeringskommandoen %conda vanligvis mer tid enn %pip-installasjon , siden den kontrollerer de fullstendige avhengighetene for å oppdage konflikter. Du vil kanskje bruke %conda-installasjon når du vil unngå potensielle problemer. Bruk %pip-installasjon når du er sikker på at biblioteket du prøver å installere, ikke er i konflikt med de forhåndsinstallerte bibliotekene i kjøretidsmiljøet.
Tips
Du finner alle tilgjengelige Python-innebygde kommandoer og klargjøringer: %pip-kommandoer og %conda-kommandoer
Behandle egendefinerte Python-biblioteker gjennom innebygd installasjon
I noen tilfeller kan det hende du har et egendefinert bibliotek som du raskt vil installere for en notatblokkøkt. Hvis du vil gjøre dette, kan du laste opp det egendefinerte Python-biblioteket til den notatblokkvedlagte Lakehouse-filmappen .
Slik gjør du det:
Gå til Lakehouse og velg ... i Fil-mappen .
Last deretter opp det egendefinerte Python
jar
- ellerwheel
biblioteket.Når du har lastet opp filen, kan du bruke følgende kommando til å installere det egendefinerte biblioteket i notatblokkøkten:
# install the .whl through pip command %pip install /lakehouse/default/Files/wheel_file_name.whl
Neste trinn
- Behandle innstillinger for arbeidsområde: Administrasjonsinnstillinger for Apache Spark-arbeidsområde
- Behandle biblioteker i Fabric: Behandle biblioteker i Fabric-dokumentasjon