Guide för datastyrning

Den här guiden visar hur du hanterar data och dataåtkomst i Azure Databricks. Information om Azure Databricks-säkerhet finns i säkerhetsguiden. Azure Databricks tillhandahåller centraliserad styrning för data och AI med Unity Catalog och Delta Sharing.

Centralisera åtkomstkontroll med hjälp av Unity Catalog

Unity Catalog är en detaljerad styrningslösning för data och AI på Databricks-plattformen. Det förenklar säkerheten och styrningen av dina data genom att tillhandahålla en central plats för att administrera och granska dataåtkomst.

Metodtips för att införa Unity Catalog finns i Bästa praxis för Unity Catalog.

Spåra data härstamning med Hjälp av Unity Catalog

Du kan använda Unity Catalog för att samla in körningsdata härstamning mellan frågor på valfritt språk som körs i ett Azure Databricks-kluster eller SQL-lager. Ursprunget avbildas ned till kolumnnivån och innehåller notebook-filer, arbetsflöden och instrumentpaneler som är relaterade till frågan. Mer information finns i Avbilda och visa data härstamning med Unity Catalog.

Identifiera data med Hjälp av Catalog Explorer

Databricks Catalog Explorer tillhandahåller ett användargränssnitt för att utforska och hantera data, scheman (databaser), tabeller och behörigheter, dataägare, externa platser och autentiseringsuppgifter. Du kan använda fliken Insikter i Katalogutforskaren för att visa de vanligaste frågorna och användarna i en tabell som är registrerad i Unity Catalog.

Dela data med deltadelning

Deltadelning är ett öppet protokoll som utvecklats av Databricks för säker datadelning med andra organisationer eller med andra team i din organisation, oavsett vilka beräkningsplattformar de använder.

Konfigurera granskningsloggning

Databricks ger åtkomst till granskningsloggar för aktiviteter som utförs av Databricks-användare, så att ditt företag kan övervaka detaljerade Databricks-användningsmönster.

Med Unity Catalog kan du enkelt komma åt och fråga efter ditt kontos driftdata, inklusive granskningsloggar, fakturerbar användning och ursprung med hjälp av systemtabeller (offentlig förhandsversion).

Konfigurera identitet

Alla bra datastyrningsberättelser börjar med en stark identitetsgrund. Information om hur du bäst konfigurerar identiteter i Azure Databricks finns i Metodtips för identiteter.

Äldre datastyrningslösningar

  • Tabellåtkomstkontroll är en äldre datastyrningsmodell som gör att du programmatiskt kan bevilja och återkalla åtkomst till objekt som hanteras av arbetsytans inbyggda Hive-metaarkiv. Databricks rekommenderar att du använder Unity Catalog i stället för tabellåtkomstkontroll. Unity Catalog förenklar säkerheten och styrningen av dina data genom att tillhandahålla en central plats för att administrera och granska dataåtkomst över flera arbetsytor i ditt konto.

  • Genomströmning av autentiseringsuppgifter för Azure Data Lake Storage (äldre) är också en äldre datastyrningsfunktion som gör att du kan autentisera automatiskt till Azure Storage från Azure Databricks-kluster med samma Microsoft Entra-ID (tidigare Azure Active Directory) identitet som du använder för att logga in på Azure Databricks. Databricks rekommenderar att du använder Unity Catalog i stället.