Not
Åtkomst till denna sida kräver auktorisation. Du kan prova att logga in eller byta katalog.
Åtkomst till denna sida kräver auktorisation. Du kan prova att byta katalog.
Viktigt!
Den här funktionen finns som allmänt tillgänglig förhandsversion.
Den här sidan beskriver hur du skapar och hanterar serverlösa basmiljöer på en arbetsyta.
Permissions
- Endast arbetsyteadministratörer kan skapa och hantera en arbetsytas basmiljöer.
- Alla arbetsyteanvändare har åtkomst till en arbetsytas basmiljöer.
- Alla arbetsyteanvändare kan skapa anpassade serverlösa miljöspecifikationer.
Så här fungerar basmiljöer i Azure Databricks
I Azure Databricks är en basmiljö en delbar YAML-specifikation som definierar en serverlös miljöversion och en uppsättning ytterligare Python-beroenden för serverlösa notebook-filer. Arbetsyteadministratörer skapar och hanterar basmiljöer så att användarna snabbt kan börja från en konsekvent, cachelagrad miljö och eventuellt lägga till sina egna bibliotek.
Använda arbetsytebasmiljöer
Användare kan välja en basmiljö för arbetsytan i listrutan Basmiljö på panelen Miljö . Basmiljöer för arbetsytor visas i listrutan tillsammans med andra alternativ som Standard, AI och Custom.
När du väljer en basmiljö för arbetsytan, laddas den förkonfigurerade och cachelagrade miljön in snabbt, vilket minskar starttiden för anteckningsböcker och jobb. För jobb förbättrar användning av arbetsytebasmiljöer prestanda eftersom beroendena redan har cachelagrats.
Använda arbetsytebasmiljöer
Användare kan välja en arbetsytebasmiljö för en notebook-fil med hjälp av inställningen Basmiljö i anteckningsbokens miljöpanel.
När en grundmiljö för arbetsytan väljs laddas den fördefinierade cachelagrade miljön snabbt, vilket minskar starttiden för notebooks och jobb. För notebook-uppgifter i jobb förbättrar användning av arbetsytebasmiljöer prestanda eftersom beroendena redan är cachelagrade.
Anvisningar om hur du konfigurerar basmiljöer i en notebook-fil finns i Välj en basmiljö.
Skapa och exportera en miljöspecifikation
Det enklaste sättet att skapa en giltig YAML-specifikation är att skapa miljön i panelen Miljö och sedan använda knappen Exportera miljö för att ladda ned YAML-filen.
- Öppna en notebook-fil och anslut till serverlös beräkning.
- Klicka på i anteckningsbokens sidopanel.Environment icon.
- Under Basmiljö väljer du Standard eller Använder Mer för att välja en specifik miljöversion. Databricks rekommenderar att du använder den senaste serverlösa miljöversionen som stöds av din arbetsyta.
- I fältet Beroenden lägger du till de beroenden som du vill att basmiljön ska ha. Klicka på Lägg till beroende när du har angett varje beroende. Mer information om hur du lägger till beroenden finns i Lägga till beroenden i notebook-filen.
- Klicka på Använd längst ned på miljöpanelen för att se till att specifikationen är giltig.
- Klicka på menyikonen
Klicka sedan på Exportera miljö längst ned i miljöpanelen.
- Ge YAML-filen ett namn och lägg till i en arbetsytemapp eller Unity Catalog-volym.
Exempel på miljöspecifikation
Följande exempel på YAML baseras på miljöspecifikationen för MLflow-projekt. Den definierar en basmiljö med några biblioteksberoenden:
environment_version: '4'
dependencies:
- --index-url https://pypi.org/simple
- -r "/Workspace/Shared/requirements.txt"
- my-library==6.1
- /Workspace/Shared/Path/To/simplejson-3.19.3-py3-none-any.whl
- git+https://github.com/databricks/databricks-cli
Lägga till en basmiljö i din arbetsyta
Så här lägger du till miljöspecifikationen som en basmiljö på arbetsytan:
- Gå till Inställningar på arbetsytan.
- Under Arbetsyteadministratör väljer du Beräkning.
- Bredvid Basmiljöer för serverlös beräkning klickar du på Hantera.
- Klicka på Skapa ny miljö.
- Ge basmiljön ett namn. Det här är det namn som användarna ser i listrutan Basmiljö .
- Välj YAML-filen för miljöspecifikation med filväljaren. Du kan bläddra bland arbetsytefiler eller Unity Catalog-volymer.
- Klicka på Skapa.
Basmiljön börjar byggas. Kontrollera kolumnen Status i listan över basmiljöer. Den ändras till Redo att användas när den är klar.
Skapa för serverlös GPU-beräkning
Viktigt!
Den här funktionen finns i Beta. Arbetsyteadministratörer kan styra åtkomsten till den här funktionen från sidan Förhandsversioner . Se Hantera förhandsversioner av Azure Databricks.
När du skapar en basmiljö kan du aktivera kryssrutan Skapa för serverlös GPU Compute för att aktivera miljön för GPU-arbetsbelastningar. Detta skapar en GPU-kompatibel version av basmiljön som visas på fliken GPU .
Hanteringssidan för basmiljöer har två flikar:
- CPU: Visar en lista över basmiljöer för serverlös beräkning (icke-GPU-arbetsbelastningar).
- GPU: Visar en lista över basmiljöer för serverlös GPU-beräkning. Den här fliken visar även AI-miljörader som motsvarar AI-basmiljöer. Mer information finns i AI-miljön.
Standard Latest avser den senaste stabila standardversion av basmiljön som tillhandahålls av Databricks.
Anmärkning
Användningsposter som är associerade med att skapa och uppdatera basmiljöer har kolumnen inställd på billing_origin_productBASE_ENVIRONMENTS. Dessutom fylls det specifika basmiljö-ID:t i usage_metadata.base_environment_id kolumnen.
Ange arbetsytans standardbasmiljö
Som standard använder inte serverlösa notebook-filer på en arbetsyta någon basmiljö. Arbetsyteadministratörer kan välja en basmiljö som ska tillämpas på alla nya notebook-filer som standard.
- Gå till Inställningar på arbetsytan.
- Under Arbetsyteadministratör väljer du Beräkning.
- Bredvid Basmiljöer för serverlös beräkning klickar du på Hantera.
- Klicka på stjärnikonen bredvid basmiljön för att ange den som standard.
Alla nya serverlösa notebook-filer är nu standard för den valda basmiljön.
Uppdatera en basmiljö
Du kanske vill redigera basmiljöfilen för att uppdatera versionsnummer eller lägga till eller ta bort beroenden.
I listan över basmiljöer klickar du på YAML-filsökvägen för den basmiljö som du vill uppdatera. Då öppnas filen på en ny flik. Du kan granska eller uppdatera filinnehållet där. Ändringar sparas automatiskt.
När du har uppdaterat YAML-specifikationen måste du uppdatera basmiljön så att notebook-filer och jobb hämtar den senaste konfigurationen.
- Bredvid den basmiljö som du vill uppdatera klickar du på menyikonen för kebabmenyn. Välj sedan
Kebab menu icon.Uppdatera
- Klicka på Bekräfta.
Nya sessioner använder nu den uppdaterade basmiljön. Befintliga notebook-sessioner måste startas om för att hämta uppdateringarna.
Begränsningar
Basmiljöer har följande begränsningar:
- Anpassade basmiljöer stöds endast för serverlösa python-, Python-hjul- och notebook-aktivitetstyper. Andra aktivitetstyper stöds inte.
- Arbetsytebasmiljöer stöds inte i jobb. Det enda undantaget är anteckningsboksuppgifter, som endast kan använda arbetsytans basmiljöer när miljön konfigureras direkt i anteckningsbokens miljöinställningar.
- Lakeflow Spark deklarativa pipelines stöder inte grundmiljöer.
- Endast relevanta beroenden installeras vid körning.
- Serverlös miljö version 1 stöds inte. Använd version 2 eller senare.
- Basmiljöer är tillgängliga för alla arbetsyteanvändare.
- Arbetsytor är begränsade till 10 basmiljöer.