Vad är arbetsytefiler?

Med arbetsytefiler kan du arbeta med filer som inte är notebook-filer i Databricks Repos. Arbetsytefiler kan vara valfri filtyp. Vanliga exempel är:

  • .py filer som används i anpassade moduler.
  • .md filer, till exempel README.md.
  • .csv eller andra små datafiler.
  • .txt Filer.
  • Loggfiler.

Arbetsytefiler är aktiverade som standard i Databricks Repos för Databricks Runtime 11.0 och senare. Se Konfigurera stöd för arbetsytefiler.

I Databricks Runtime 8.4 och senare kan du synkronisera, importera och läsa filer som inte är notebook-filer i en Azure Databricks-lagringsplats. Du kan också visa och redigera filer i Azure Databricks-användargränssnittet.

I Databricks Runtime 11.2 och senare kan du programmatiskt skriva eller ta bort arbetsytefiler i en Azure Databricks-lagringsplats.

Även om Databricks-notebook-filer har olika funktioner och stöd är grundläggande filmanipulering i användargränssnittet för lagringsplatser nästan identiska för arbetsytefiler och notebook-filer. Se Grundläggande användning av arbetsytefiler och Hantera notebook-filer.

Konfigurera stöd för arbetsytefiler

Om du vill arbeta med filer som inte är notebook-filer i Databricks Repos måste du köra Databricks Runtime 8.4 eller senare. Du måste köra Databricks Runtime 11.2 eller senare för att programmässigt skapa eller ta bort arbetsytefiler.

Om stöd för Fil i lagringsplatser inte är aktiverat ser du fortfarande filer som inte är notebook-filer på en Databricks-lagringsplats, men du kan inte arbeta med dem.

En administratör kan konfigurera den här funktionen på följande sätt:

  1. Gå till Admin-konsolen.
  2. Klicka på fliken Inställningar för arbetsyta .
  3. I avsnittet Repos (Lagringsplatser ) väljer du ett alternativ i listrutan Filer i lagringsplatser .

För att säkerställa att alla konfigurationer har tillämpats måste du uppdatera webbläsaren och starta om beräkningsklustret.

Anteckning

När du aktiverar filer i lagringsplatser för första gången kan du behöva öppna Git-dialogrutan och utföra en pull-åtgärd för att synkronisera filer som inte är notebook-filer på lagringsplatsen. Om det finns några sammanslagningskonflikter visas en dialogruta som ger dig möjlighet att antingen ignorera dina motstridiga ändringar eller skicka ändringarna till en ny gren.

Bekräfta att filer i lagringsplatser är aktiverat

Du kan använda kommandot %sh pwd i en notebook-fil i en lagringsplats för att kontrollera om Filer i lagringsplatser är aktiverat.

  • Om Filer i lagringsplatser inte är aktiverat är /databricks/driversvaret .
  • Om Filer i lagringsplatser är aktiverat är /Workspace/Repos/<path to notebook directory> svaret .

Komma åt filer i lagringsplatser från ett kluster som använder Azure Databricks Container Services

Du kan använda filer i lagringsplatser som standard med Azure Databricks Container Services (DCS) i kluster som kör Databricks Runtime 11.3 och senare.

Du kan komma åt filer i lagringsplatser i ett kluster med DCS i Databricks Runtime version 10.4 LTS och 9.1 LTS genom att konfigurera dockerfile. Se följande dockerfiles för önskad Databricks Runtime-version:

Se Anpassa containrar med Databricks Container Services