Registrera datakällor i Azure Data Catalog

Viktigt

Det går inte längre att skapa nya Azure Data Catalog-konton.

För datakatalogfunktioner använder du Microsoft Purview-tjänsten , som erbjuder enhetlig datastyrning för hela din dataegendom.

Om du redan använder Azure Data Catalog måste du skapa en migreringsplan för din organisation som ska flyttas till Microsoft Purview i augusti 2025.

Introduktion

Azure Data Catalog är en fullständigt hanterad molntjänst som fungerar som ett system för registrering och identifiering för företagsdatakällor. Med andra ord hjälper Data Catalog människor att identifiera, förstå och använda datakällor, och det hjälper organisationer att få mer värde från sina befintliga data. Det första steget för att göra en datakälla identifierbar via Data Catalog är att registrera datakällan.

Registrera datakällor

Registrering är en process för att extrahera metadata från datakällan och kopiera dessa data till Data Catalog-tjänsten. Informationen ligger kvar där den är och är under kontroll av det aktuella systemets administratörer och principer.

Så här registrerar du en datakälla:

  1. I Azure Data Catalog-portalen startar du registreringsverktyget för Data Catalog datakälla.
  2. Logga in med ditt arbets- eller skolkonto med samma Azure Active Directory-autentiseringsuppgifter som du använder för att logga in på portalen.
  3. Välj den datakälla som du vill registrera.

Mer stegvis information finns i självstudien Komma igång med Azure Data Catalog.

När du har registrerat datakällan spårar katalogen dess plats och indexerar dess metadata. Användare kan söka, bläddra och identifiera datakällan och sedan använda dess plats för att ansluta till den med hjälp av det program eller verktyg som de väljer.

Datakällor som stöds

En lista över datakällor som stöds för närvarande finns i Data Catalog DSR.

Strukturella metadata

När du registrerar en datakälla extraherar registreringsverktyget information om strukturen för de objekt som du väljer. Den här informationen kallas strukturella metadata.

För alla objekt innehåller dessa strukturella metadata objektets plats, så att användare som identifierar data kan använda den informationen för att ansluta till objektet i de klientverktyg som de väljer. Andra strukturella metadata omfattar objektnamn och typ samt attribut/kolumnnamn och datatyp.

Beskrivande metadata

Förutom de grundläggande strukturella metadata som extraheras från datakällan extraherar registreringsverktyget för datakällor beskrivande metadata. För SQL Server Analysis Services och SQL Server Reporting Services hämtas dessa metadata från de Beskrivningsegenskaper som exponeras av dessa tjänster. För SQL Server extraheras värden som tillhandahålls med hjälp av ms_description utökade egenskapen. För Oracle Database extraherar registreringsverktyget för datakällan kolumnen COMMENTS från ALL_TAB_COMMENTS-vyn.

Förutom de beskrivande metadata som extraheras från datakällan kan användarna ange beskrivande metadata med hjälp av registreringsverktyget för datakällor. Användare kan lägga till taggar och de kan identifiera experter för de objekt som registreras. Alla dessa beskrivande metadata kopieras till Data Catalog-tjänsten tillsammans med strukturella metadata.

Inkludera förhandsgranskningar

Som standard extraheras endast metadata från datakällor och kopieras till Data Catalog-tjänsten, men det blir ofta enklare att förstå en datakälla när du kan visa ett exempel på de data som den innehåller.

Du kan inkludera en förhandsgranskning av ögonblicksbilder av data i varje tabell och vy som är registrerad med hjälp av registreringsverktyget för Data Catalog datakälla. Om du väljer att inkludera förhandsversioner under registreringen innehåller registreringsverktyget upp till 20 poster från varje tabell och vy. Den här ögonblicksbilden kopieras sedan till katalogen tillsammans med strukturella och beskrivande metadata.

Anteckning

Breda tabeller med ett stort antal kolumner kan ha färre än 20 poster som ingår i förhandsversionen.

Inkludera dataprofiler

På samma sätt som med förhandsversioner kan ge värdefull kontext för användare som söker efter datakällor i Data Catalog, inklusive en dataprofil, kan det göra det lättare att förstå identifierade datakällor.

Med hjälp av registreringsverktyget för Data Catalog datakälla kan du inkludera en dataprofil för varje tabell och vy som är registrerad. Om du väljer att inkludera en dataprofil under registreringen innehåller registreringsverktyget sammanställd statistik om data i varje tabell och vy, inklusive:

  • Antalet rader och storleken på data i objektet.
  • Datum för den senaste uppdateringen av data och objektschemat.
  • Antalet null-poster och distinkta värden för kolumner.
  • Värdena för minsta, högsta, medelvärde och standardavvikelse för kolumner.

Den här statistiken kopieras sedan till katalogen tillsammans med strukturella och beskrivande metadata.

Anteckning

Text- och datumkolumner innehåller inte statistik över medelvärden eller standardavvikelser i sin dataprofil.

Uppdatera registreringar

När du registrerar en datakälla kan den identifieras i Data Catalog när du använder metadata och valfri förhandsversion som extraherades under registreringen. Om datakällan behöver uppdateras i katalogen (till exempel om schemat för ett objekt har ändrats, tabeller som ursprungligen exkluderats ska inkluderas eller om du vill uppdatera de data som ingår i förhandsversionerna) kan registreringsverktyget för datakällor köras igen.

Omregistrering av en redan registrerad datakälla utför en "upsert"-kopplingsåtgärd: befintliga objekt uppdateras och nya objekt skapas. Metadata som tillhandahålls av användare via Data Catalog-portalen behålls.

Sammanfattning

Eftersom den kopierar strukturella och beskrivande metadata från en datakälla till katalogtjänsten blir det enklare att identifiera och förstå att registrera datakällan i Data Catalog. När du har registrerat datakällan kan du kommentera, hantera och identifiera den med hjälp av Data Catalog-portalen.

Nästa steg

Mer information om hur du registrerar datakällor finns i självstudien Komma igång med Azure Data Catalog.