Registrera datakällor i Azure Data Catalog

Viktigt!

Azure Data Catalog dras tillbaka den 15 maj 2024.

Det går inte längre att skapa nya Azure Data Catalog-konton.

För datakatalogfunktioner använder du Microsoft Purview-tjänsten , som erbjuder enhetlig datastyrning för hela din dataegendom.

Om du redan använder Azure Data Catalog måste du skapa en migreringsplan för din organisation för att flytta till Microsoft Purview senast den 15 maj 2024.

Introduktion

Azure Data Catalog är en fullständigt hanterad molntjänst som fungerar som ett system för registrering och identifiering för företagsdatakällor. Med andra ord hjälper Data Catalog människor att identifiera, förstå och använda datakällor, och det hjälper organisationer att få mer värde från sina befintliga data. Det första steget för att göra en datakälla identifierbar via Data Catalog är att registrera datakällan.

Registrera datakällor

Registrering är processen för att extrahera metadata från datakällan och kopiera dessa data till datakatalogtjänsten. Informationen ligger kvar där den är och är under kontroll av det aktuella systemets administratörer och principer.

Följ dessa steg för att registrera en datakälla:

  1. I Azure Data Catalog-portalen startar du datakällans registreringsverktyg för datakatalogen.
  2. Logga in med ditt arbets- eller skolkonto med samma Microsoft Entra-autentiseringsuppgifter som du använder för att logga in på portalen.
  3. Välj den datakälla som du vill registrera.

När du har registrerat datakällan spårar katalogen dess plats och indexerar dess metadata. Användare kan söka, bläddra och identifiera datakällan och sedan använda dess plats för att ansluta till den med hjälp av det program eller verktyg som de väljer.

Datakällor som stöds

En lista över datakällor som stöds för närvarande finns i DSR för datakatalog.

Strukturella metadata

När du registrerar en datakälla extraherar registreringsverktyget information om strukturen för de objekt du väljer. Den här informationen kallas för strukturella metadata.

För alla objekt innehåller dessa strukturella metadata objektets plats, så att användare som identifierar data kan använda den informationen för att ansluta till objektet i de klientverktyg som de väljer. Andra strukturella metadata inkluderar objektnamn och typ samt attribut/kolumnnamn och datatyp.

Beskrivande metadata

Förutom de grundläggande strukturella metadata som extraheras från datakällan extraherar datakällans registreringsverktyg beskrivande metadata. För SQL Server Analysis Services och SQL Server Reporting Services hämtas dessa metadata från de beskrivningsegenskaper som exponeras av dessa tjänster. För SQL Server extraheras värden som tillhandahålls med hjälp av den ms_description utökade egenskapen. För Oracle Database extraherar datakällans registreringsverktyg kolumnen COMMENTS från ALL_TAB_COMMENTS-vyn.

Utöver de beskrivande metadata som extraheras från datakällan kan användarna ange beskrivande metadata med hjälp av datakällans registreringsverktyg. Användare kan lägga till taggar och de kan identifiera experter för de objekt som registreras. Alla dessa beskrivande metadata kopieras till datakatalogtjänsten tillsammans med strukturella metadata.

Inkludera förhandsversioner

Som standard extraheras endast metadata från datakällor och kopieras till datakatalogtjänsten, men det blir ofta enklare att förstå en datakälla när du kan visa ett exempel på de data som den innehåller.

Du kan ta med en förhandsversion av ögonblicksbilden av data i varje tabell och visa som är registrerad med hjälp av datakatalogens registreringsverktyg för datakällor. Om du väljer att inkludera förhandsversioner under registreringen innehåller registreringsverktyget upp till 20 poster från varje tabell och vy. Den här ögonblicksbilden kopieras sedan till katalogen tillsammans med strukturella och beskrivande metadata.

Kommentar

Breda tabeller med ett stort antal kolumner kan ha färre än 20 poster som ingår i förhandsversionen.

Inkludera dataprofiler

Precis som med förhandsversioner kan ge värdefull kontext för användare som söker efter datakällor i Data Catalog, inklusive en dataprofil, kan det göra det lättare att förstå identifierade datakällor.

Med hjälp av datakatalogens registreringsverktyg för datakällor kan du inkludera en dataprofil för varje tabell och vy som är registrerad. Om du väljer att inkludera en dataprofil under registreringen innehåller registreringsverktyget sammanställd statistik om data i varje tabell och vy, inklusive:

  • Antalet rader och storleken på data i objektet.
  • Datum för den senaste uppdateringen av data och objektschemat.
  • Antalet null-poster och distinkta värden för kolumner.
  • Värdena för minsta, högsta, genomsnittliga och standardavvikelser för kolumner.

Den här statistiken kopieras sedan till katalogen tillsammans med strukturella och beskrivande metadata.

Kommentar

Text- och datumkolumner innehåller inte genomsnittlig eller standardavvikelsestatistik i sin dataprofil.

Uppdatera registreringar

Om du registrerar en datakälla kan den identifieras i datakatalogen när du använder metadata och valfri förhandsversion som extraherats under registreringen. Om datakällan behöver uppdateras i katalogen (till exempel om schemat för ett objekt har ändrats, tabeller som ursprungligen exkluderats ska inkluderas eller om du vill uppdatera de data som ingår i förhandsversionerna) kan du köra registreringsverktyget för datakällan igen.

Omregistrering av en redan registrerad datakälla utför en sammanslagningsåtgärd "upsert": befintliga objekt uppdateras och nya objekt skapas. Metadata som tillhandahålls av användare via datakatalogportalen behålls.

Sammanfattning

Eftersom den kopierar strukturella och beskrivande metadata från en datakälla till katalogtjänsten, gör registreringen av datakällan i datakatalogen data lättare att identifiera och förstå. När du har registrerat datakällan kan du kommentera, hantera och identifiera den med hjälp av datakatalogportalen.