Vad är Azure Data Catalog?

Viktigt!

Azure Data Catalog dras tillbaka den 15 maj 2024.

Det går inte längre att skapa nya Azure Data Catalog-konton.

För datakatalogfunktioner använder du Microsoft Purview-tjänsten , som erbjuder enhetlig datastyrning för hela din dataegendom.

Om du redan använder Azure Data Catalog måste du skapa en migreringsplan för din organisation för att flytta till Microsoft Purview senast den 15 maj 2024.

Azure Data Catalog är en fullständigt hanterad molntjänst som låter användarna identifiera de datakällor de behöver och förstå de datakällor de hittar. På samma gång hjälper Data Catalog organisationer att få ut mer av sina befintliga investeringar.

Med Data Catalog kan alla användare (analytiker, dataforskare eller utvecklare) identifiera, förstå och använda datakällor i sitt datalandskap. Data Catalog innehåller en crowdsourcing-modell med metadata och anteckningar, så att alla kan bidra till att göra data identifierbara och användbara. Det är en enda central plats för alla en organisations användare att bidra med sina kunskaper och skapa en community och en kultur av data.

Det är svårt för datakonsumenterna att hitta rätt

Traditionellt har man identifierat företagets datakällor genom en organisk process baserad på gruppens kunskaper. För företag som vill få ut mesta möjliga av sina informationstillgångar innebär den här metoden många utmaningar:

  • Användarna kanske inte vet att en datakälla finns om de inte kommer i kontakt med den som en del av en annan process. Det finns ingen central plats där datakällor registreras.
  • Såvida inte användarna känner till platsen för en datakälla kan de inte ansluta till data med hjälp av ett klientprogram. Dataförbrukningsupplevelser gör att användarna måste känner till anslutningssträngen eller sökvägen.
  • Om användarna inte känner till platsen för en datakällas dokumentation kan de inte förstå den avsedda användningen av data. Datakällor och dokumentation kan finnas på olika platser och förbrukas via olika upplevelser.
  • Om användare har frågor om en informationsresurs måste de hitta experten eller teamet som ansvarar för data och prata med dem offline. Det finns ingen explicit koppling mellan data och experterna som har perspektiv på dess användning.
  • Om inte användarna förstår processen för att begära åtkomst till datakällan hjälper identifiering av datakällan och dess dokumentation fortfarande inte dem att komma åt data.

Det är svårt för dataproducenterna att hitta rätt

Datakonsumenterna står inför vissa svårigheter, medan användarna som ansvarar för att producera och upprätthålla informationstillgångar står inför andra svårigheter:

  • Det är ofta en onödig ansträngning att kommentera datakällor med beskrivande metadata. Klientprogram ignorerar vanligtvis beskrivningar som lagrats i datakällan.
  • Det är ofta en onödig ansträngning att skapa dokumentation för datakällor. Att hålla dokumentationen synkroniserad med datakällor är ett ständigt ansvar. Användare kan sakna förtroende för dokumentation som uppfattas som inaktuell.
  • Det är komplicerat och tidskrävande att skapa och upprätthålla dokumentationen för en datakälla. Det är ofta ännu svårare att göra dokumentationen lättillgänglig för alla som använder datakällan.
  • Det är en ständig utmaning att begränsa tillgången till datakällan och samtidigt se till att datakonsumenterna vet hur de begär tillgång.

I kombination utgör dessa svårigheter ett stort hinder för företag som vill uppmuntra och främja användning och förståelse av företagsdata.

Azure Data Catalog kan hjälpa dig

Data Catalog är utformad för att åtgärda dessa problem och hjälpa företagen att få ut så mycket som möjligt av sina befintliga informationstillgångar. Data Catalog underlättar genom att göra det enkelt för användare som behöver data att identifiera och förstå datakällorna.

Data Catalog är en molnbaserad tjänst där du kan registrera datakällor. Dina data blir kvar där du har dem, men en kopia av deras metadata läggs till i Data Catalog tillsammans med en referens till platsen där datakällan finns. Dessa metadata indexeras också för att det ska bli enkelt att identifiera alla datakällor och för att användare som identifierar dem ska förstå dem.

När en datakälla har registrerats kan dess metadata sedan utökas. Metadata kan läggas till antingen av användaren som registrerade den eller av andra användare i företaget. Alla användare kan kommentera en datakälla genom att ange beskrivningar, taggar eller andra metadata, till exempel dokumentation och processer för att begära åtkomst till datakällan. Dessa beskrivande metadata kompletterar strukturella metadata (till exempel kolumnnamn och datatyper) som registrerats från datakällan.

Huvudsyftet med registrering av källorna är att identifiera och förstå datakällor och deras användningsområden. Företagsanvändare behöver data för business intelligence, programutveckling, datavetenskap eller andra uppgifter där rätt data krävs. De kan använda sökfunktionen i Data Catalog för att snabbt hitta data som motsvarar deras behov, förstå datakällan för att utvärdera dess lämplighet och använda data genom att öppna datakällan i önskat verktyg.

På samma gång kan användarna bidra till katalogen genom att tagga, dokumentera och kommentera datakällor som redan har registrerats. De kan också registrera nya datakällor som kan sedan identifieras, förstås och användas av kataloganvändare.

Funktioner i Data Catalog

Mer information om Data Catalog

Här finns mer information om funktionerna i Data Catalog:

Nästa steg