Dela via


Arbetsytebibliotek (äldre)

Viktigt!

Den här dokumentationen har dragits tillbaka och kanske inte uppdateras. De produkter, tjänster eller tekniker som nämns i det här innehållet stöds inte längre. Se Klusterbibliotek.

Kommentar

Arbetsytebibliotek har blivit inaktuella och bör inte användas. Att lagra bibliotek som arbetsytefiler skiljer sig dock från arbetsytebibliotek och stöds fortfarande fullt ut. Du kan installera bibliotek som lagras som arbetsytefiler direkt till beräknings- eller jobbuppgifter.

Arbetsytebibliotek fungerar som en lokal lagringsplats som du skapar klusterinstallerade bibliotek från. Ett arbetsytebibliotek kan vara egen kod som din organisation har skapat eller en viss version av ett bibliotek med öppen källkod som organisationen använder.

Du måste installera ett arbetsytebibliotek i ett kluster innan det kan användas i en notebook-fil eller ett jobb. Se Installera ett arbetsytebibliotek på ett kluster.

Arbetsytebibliotek i den delade mappen är tillgängliga för alla användare på en arbetsyta, medan arbetsytebibliotek i en användarmapp endast är tillgängliga för den användaren.

Viktigt!

Bibliotek kan installeras från DBFS när du använder Databricks Runtime 14.3 LTS och nedan. Alla arbetsyteanvändare kan dock ändra biblioteksfiler som lagras i DBFS. För att förbättra säkerheten för bibliotek på en Azure Databricks-arbetsyta är lagring av biblioteksfiler i DBFS-roten inaktuell och inaktiverad som standard i Databricks Runtime 15.1 och senare. Se Lagra bibliotek i DBFS-roten är inaktuell och inaktiverad som standard.

I stället rekommenderar Databricks att du laddar upp alla bibliotek, inklusive Python-bibliotek, JAR-filer och Spark-anslutningsappar, till arbetsytefiler eller Unity Catalog-volymer eller använder bibliotekspaketdatabaser. Om din arbetsbelastning inte stöder dessa mönster kan du även använda bibliotek som lagras i molnobjektlagring.

Hur skiljer sig arbetsytebibliotek från bibliotek som lagras med arbetsytefiler?

Termen "arbetsytebibliotek" refererar till alla bibliotek som är registrerade på en arbetsyta. Arbetsytebibliotek visas tillsammans med notebook-filer och arbetsytefiler och följer ACL-regler för deras innehållande katalog.

Termen "arbetsytefiler" refererar till valfri godtycklig fil som lagras på arbetsytan. Du kan lagra Python.whl-paket som arbetsytefiler och sedan registrera dem som arbetsytebibliotek. Se Vad är arbetsytefiler?.

Du kan ladda upp bibliotek som arbetsytefiler. Se Grundläggande användning av arbetsytefiler.

Du kan ladda upp många filtyper till arbetsytefiler, men endast Python.whl-filer kan installeras med hjälp av arbetsytefiler. Se Bibliotek med klusteromfattning.

I Databricks Runtime 13.3 LTS och senare kan du använda %pip för att installera Python-hjulfiler som lagras som arbetsytefiler. Se Installera ett paket som lagras som en arbetsytefil med %pip.

Skapa ett arbetsytebibliotek

Varning

Den här funktionen är inte längre tillgänglig. Se Skapa och installera arbetsytebibliotek är inte längre tillgängligt.

  1. Högerklicka på arbetsytans mapp där du vill lagra biblioteket.
  2. Välj Skapa > bibliotek. Dialogrutan Skapa bibliotek visas.
  3. Välj bibliotekskälla och följ lämplig procedur:

Ladda upp en Jar-, Python-ägg- eller Python-hjulfil

Kommentar

Installationen av Python-äggfiler är inaktuell och tas bort i en framtida Version av Databricks Runtime.

Viktigt!

Bibliotek kan installeras från DBFS när du använder Databricks Runtime 14.3 LTS och nedan. Alla arbetsyteanvändare kan dock ändra biblioteksfiler som lagras i DBFS. För att förbättra säkerheten för bibliotek på en Azure Databricks-arbetsyta är lagring av biblioteksfiler i DBFS-roten inaktuell och inaktiverad som standard i Databricks Runtime 15.1 och senare. Se Lagra bibliotek i DBFS-roten är inaktuell och inaktiverad som standard.

I stället rekommenderar Databricks att du laddar upp alla bibliotek, inklusive Python-bibliotek, JAR-filer och Spark-anslutningsappar, till arbetsytefiler eller Unity Catalog-volymer eller använder bibliotekspaketdatabaser. Om din arbetsbelastning inte stöder dessa mönster kan du även använda bibliotek som lagras i molnobjektlagring.

  1. Välj Ladda upp i listan Bibliotekskälla.
  2. Välj Jar, Python Egg eller Python Whl.
  3. Du kan också ange ett biblioteksnamn.
  4. Dra jar-, ägg- eller Whl-filen till listrutan eller klicka på listrutan och navigera till en fil. Filen laddas upp till dbfs:/FileStore/jars.
  5. Klicka på Skapa. Skärmen biblioteksstatus visas.

Referera till en uppladdad JAR-, Python-ägg- eller Python-hjulfil

Du kan skapa ett nytt arbetsytebibliotek genom att referera till JAR-, Python-ägg- eller Python-hjulfiler som lagras i DBFS-roten, på objektlagring eller med arbetsytefiler. När du följer det här arbetsflödet registreras en pekare till ett bibliotek utan att ladda upp eller flytta filer.

Med Databricks Runtime 13.2 och senare kan du även referera till en volym i Unity Catalog. Den här funktionen finns i offentlig förhandsversion.

För läget för delad åtkomst måste du lägga till JAR:er i allowlist. Se Tillåtlista bibliotek och init-skript för delad beräkning.

  1. Välj Filsökväg/ADLS i knapplistan Bibliotekskälla.
  2. Välj Jar, Python Egg eller Python Whl.
  3. Du kan också ange ett biblioteksnamn.
  4. Ange sökvägen till biblioteket, till exempel följande exempel:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Klicka på Skapa. Skärmen biblioteksstatus visas.

Mer information om hur du arbetar med bibliotek i objektlagring finns i Installera bibliotek från objektlagring.

Mer information om arbetsytefiler finns i Arbeta med filer på Azure Databricks.

Installera ett arbetsytebibliotek på ett kluster

Kommentar

Azure Databricks bearbetar alla arbetsytebibliotek i den ordning de installerades i klustret. Du kan behöva vara uppmärksam på installationsordningen på klustret om det finns beroenden mellan bibliotek.

Viktigt!

Bibliotek kan installeras från DBFS när du använder Databricks Runtime 14.3 LTS och nedan. Alla arbetsyteanvändare kan dock ändra biblioteksfiler som lagras i DBFS. För att förbättra säkerheten för bibliotek på en Azure Databricks-arbetsyta är lagring av biblioteksfiler i DBFS-roten inaktuell och inaktiverad som standard i Databricks Runtime 15.1 och senare. Se Lagra bibliotek i DBFS-roten är inaktuell och inaktiverad som standard.

I stället rekommenderar Databricks att du laddar upp alla bibliotek, inklusive Python-bibliotek, JAR-filer och Spark-anslutningsappar, till arbetsytefiler eller Unity Catalog-volymer eller använder bibliotekspaketdatabaser. Om din arbetsbelastning inte stöder dessa mönster kan du även använda bibliotek som lagras i molnobjektlagring.

I åtkomstläge för en användare används identiteten för det tilldelade huvudnamnet (en användare eller tjänstens huvudnamn). I läget för delad åtkomst använder bibliotek identiteten för den användare som installerade biblioteket. Läget för delad åtkomst utan isolering stöder inte volymer, men använder samma identitetstilldelning som läget för delad åtkomst.

Om du vill se alla alternativ för att installera bibliotek i kluster läser du Klusterbibliotek.

Om du vill installera ett bibliotek som redan finns på arbetsytan kan du börja från klustrets användargränssnitt eller biblioteksgränssnittet:

Kluster

  1. Klicka på beräkningsikon Beräkning i sidopanelen.
  2. Klicka på ett klusternamn.
  3. Klicka på fliken Bibliotek .
  4. Klicka på Installera ny.
  5. Välj Arbetsytebibliotek i listan Bibliotekskälla.
  6. Välj ett arbetsytebibliotek.
  7. Klicka på Installera.

Bibliotek

  1. Gå till mappen som innehåller biblioteket.
  2. Klicka på biblioteksnamnet.
  3. Markera kryssrutan bredvid klustret som du vill installera biblioteket på och klicka på Installera. Endast kluster som körs visas i listan.

Visa information om arbetsytebibliotek

Kommentar

Arbetsytemappar gör det bekvämt att identifiera arbetsytebibliotek och hantera ACL:er.

  1. Gå till arbetsytans mapp som innehåller biblioteket.
  2. Klicka på biblioteksnamnet.

På sidan biblioteksinformation visas de kluster som körs och bibliotekets installationsstatus . Om biblioteket är installerat innehåller sidan en länk till paketvärden. Om biblioteket har laddats upp visar sidan en länk till den uppladdade paketfilen.

Flytta ett arbetsytebibliotek

Kommentar

Arbetsytemappar gör det bekvämt att identifiera arbetsytebibliotek och hantera ACL:er. Att flytta ett arbetsytebibliotek flyttar inte filer, men kan ändra vilka användare som har åtkomst till arbetsytebiblioteket.

  1. Gå till arbetsytans mapp som innehåller biblioteket.
  2. Högerklicka på biblioteksnamnet och välj Flytta. En mappwebbläsare visas.
  3. Klicka på målmappen.
  4. Klicka på Flytta.

Ta bort ett arbetsytebibliotek

Viktigt!

Innan du tar bort ett arbetsytebibliotek bör du avinstallera det från alla kluster.

Så här tar du bort ett arbetsytebibliotek:

  1. Flytta biblioteket till papperskorgen.
  2. Ta antingen bort biblioteket permanent i papperskorgen eller töm papperskorgen.