Oktatóanyag: Adategységek regisztrálása az Azure Data Catalogban
Fontos
Az Azure Data Catalog 2024. május 15-én megszűnt.
Az adatkatalógus funkcióihoz használja a Microsoft Purview szolgáltatást, amely egységes adatszabályozást biztosít a teljes adattulajdonhoz.
Ebben az oktatóanyagban a regisztrációs eszközzel regisztrálja az adatbázis-minta adategységeit a katalógusban. A regisztráció az a folyamat, amelynek során az adatforrásból és a benne található adategységekből kinyert fő szerkezeti metaadatok (például nevek, típusok és helyek) hozzáadódnak a katalógushoz. Az adatforrás és az adategységek az eredeti helyükön maradnak, de a metaadatok használatával a katalógus könnyebben feltárhatóvá és értelmezhetővé teszi őket.
Ebben az oktatóanyagban az alábbiakkal fog megismerkedni:
- Adategységek regisztrálása
- Adategységek keresése
- Adategységek ellátása dekorációkkal
- Csatlakozás adategységekhez
- Adategységek felügyelete
- Adategységek törlése
Előfeltételek
- Microsoft Azure-előfizetés .
- Saját Microsoft Entra-bérlőre van szüksége.
- Azure-adatkatalógus
A Data Catalog beállításához Egy Azure-előfizetés tulajdonosának vagy társtulajdonosának kell lennie.
Adategységek regisztrálása
Adatforrás regisztrálása
Ebben a példában adategységeket (táblákat) regisztrálunk egy adatbázis-mintából az Azure SQL Database-hez, de bármilyen támogatott adatforrást használhat, ha a szerepköréhez jól ismert és releváns adatokkal szeretne dolgozni. A támogatott adatforrások listáját a következő témakörben találja: Támogatott adatforrások.
Az oktatóanyagban használt adatbázisnév az RLSTest.
Most már regisztrálhat adategységeket az adatbázis-mintából az Azure Data Catalog használatával.
Nyissa meg az Azure Data Catalog kezdőlapját , és válassza az Adatok közzététele lehetőséget.
Válassza az Alkalmazás indítása lehetőséget a regisztrációs eszköz letöltéséhez, telepítéséhez és futtatásához a számítógépen.
Az üdvözlőlapon válassza a Bejelentkezés lehetőséget, és adja meg a hitelesítő adatait.
A Microsoft Azure Data Catalog lapon válassza az SQL Server és a Tovább lehetőséget.
Adja meg az adatbázis-minta SQL Server kapcsolati tulajdonságait az Azure SQL Database-ben, és válassza a CONNECT lehetőséget.
Regisztrálja az adategység metaadatait. Ebben a példában termékobjektumokat regisztrál a mintanévtérből:
A Kiszolgálóhierarchia fában bontsa ki az adatbázismintát, és válassza a SalesLT lehetőséget.
A Ctrl+select billentyűkombinációval válassza ki a Product, a ProductCategory, a ProductDescription és a ProductModel lehetőséget.
Jelölje ki az áthelyezett nyíl (>). Ez a művelet az összes kiválasztott objektumot áthelyezi az Objects to be registered (Regisztrálandó objektumok) listára.
Ha szeretne pillanatképes előnézetet is hozzáadni az adatokról, jelölje be az Előnézet belefoglalása jelölőnégyzetet. A pillanatkép legfeljebb 20 rekordot tartalmaz minden táblából, és a rendszer a katalógusba másolja.
Ha szeretné, hogy az adatprofil objektumstatisztikáit (például: minimális, maximális és átlagos értékek az oszlopban, sorok száma) bemutató pillanatképet is tartalmazza a katalógus, válassza az Adatprofil belefoglalása lehetőséget.
A Címkék hozzáadása mezőben adja meg az értékesítést, a terméket és az Azure SQL-t. Ez a művelet hozzáadja az adategységekhez a keresési címkéket. A címkék nagy segítséget nyújtanak abban, hogy a felhasználók megtaláljanak egy bizonyos regisztrált adatforrást.
Adja meg az adatokhoz kapcsolódó szakértő nevét (kihagyható).
Válassza a REGISTER (REGISZTRÁCIÓ) lehetőséget. Az Azure Data Catalog regisztrálja a kiválasztott objektumokat. Ebben a gyakorlatban a rendszer regisztrálja az adatbázis-minta kiválasztott objektumait. A regisztrációs eszköz kinyeri a metaadatokat az adategységből, majd az Azure Data Catalogba másolja az adatokat. Az adatok ott maradnak, ahol jelenleg is maradnak. Az adatok továbbra is a forrásrendszer rendszergazdáinak és szabályzatainak felügyelete alatt maradnak.
A regisztrált adatforrás-objektumok megtekintéséhez válassza a Portál megtekintése lehetőséget. Az Azure Data Catalog portálon ellenőrizze, hogy mind a négy tábla és az adatbázis látható-e a rács nézetben (ellenőrizze, hogy a keresősáv nem látható-e).
Ebben a gyakorlatban az Azure SQL Database adatbázismintájából regisztrált objektumokat, hogy könnyen felfedezhesse őket a szervezet felhasználói.
A következő gyakorlatból elsajátíthatja, hogyan találhatja meg a regisztrált adategységeket.
Adategységek felderítése
Az Azure Data Catalog felderítési funkciója elsődlegesen két mechanizmust használ: keresés és szűrés.
A keresés nem csupán magától értetődő, de rendkívül hatékony is. Alapértelmezés szerint a keresőkifejezéseket a rendszer összeveti a katalógusban szereplő összes tulajdonsággal, még a felhasználók által beírt dekorációkkal is.
A szűrés a keresést hivatott kiegészíteni. Különböző jellemzőket (például szakértők, adatforrástípusok, objektumtípusok és címkék) adhat meg, és megtekintheti az azokkal egyező adategységeket, illetve az egyezést mutató adategységekre szűkítheti a találatokat.
A keresés és a szűrés kombinációjával gyorsan navigálhat az Azure Data Catalogban regisztrált adatforrások között.
Ebben a gyakorlatban az Azure Data Catalog-portál segítségével fogja felderíteni az előző gyakorlat során regisztrált adategységeket. A keresési szintaxissal kapcsolatban lásd: Data Catalog Search syntax reference (A Data Catalog keresési szintaxisának leírása).
Az alábbiakban különböző példákat hozunk a katalógusban szereplő adategységek felderítésére.
Adategységek felderítése az alapszintű kereséssel
Az alapszintű kereséssel egy vagy több keresőkifejezést megadva végezhet keresést a katalógusban. Megjelenik az összes olyan adategység, amelynek tulajdonságai egyeznek egy vagy több megadott kifejezéssel.
Válassza a Kezdőlap lehetőséget az Azure Data Catalog portálon. Ha bezárta a webböngészőt, nyissa meg az Azure Data Catalog kezdőlapját.
A keresőmezőbe írja be a
product
kifejezést, majd nyomja le az ENTER billentyűt.Győződjön meg arról, hogy mind a négy tábla és az adatbázis megjelenik az eredmények között. A rácsnézet és a listanézet között az eszköztár gombjaival válthat, ahogyan az alábbi képen is látható. Figyelje meg, hogy a kereséshez használt kulcsszót a rendszer kijelöli a találatok között. Ez azért van, mert a Kiemelés funkció BE értékre van állítva. Megadhatja az eredmények száma oldalanként beállítás értékét is.
A Keresések panel bal oldalon, a Tulajdonságok panel jobb oldalon található. A Keresések panelen módosíthatja a keresési feltételeket, valamint szűrheti a találatokat. A Tulajdonságok panelen láthatja a rácsban vagy a listában kiválasztott objektum tulajdonságait.
Válassza a Termék lehetőséget a keresési eredmények között. válassza az Előnézet, Az oszlopok, az Adatprofil és a Dokumentáció fület, vagy a nyílra kattintva bontsa ki az alsó panelt.
A Preview (Előnézet) lapon a Product táblában szereplő adatok előnézete látható.
Válassza az Oszlopok lapot az adategység oszlopainak részleteinek (például név és adattípus) megkereséséhez.
Az Adatprofil lapon megtekintheti az adatok profilozását (például sorok számát, az adatok méretét vagy egy oszlop minimális értékét).
Adategységek felderítése tulajdonságértékekben való kereséssel
A tulajdonságértékekben való keresés segítségével megkeresheti azokat az adategységeket, amelyeknél a keresőkifejezés és a megadott tulajdonság között egyezés található.
A Szűrők menü Objektumtípus szűrőjének Tábla beállításánál törölje az oda korábban esetleg beírt értéket.
A keresőmezőbe írja be a
tags:product
kifejezést, majd nyomja le az ENTER billentyűt. Az adatkatalógusban való kereséshez használható összes tulajdonság megtekintéséhez lásd: Data Catalog Search syntax reference (A Data Catalog keresési szintaxisának leírása).Ellenőrizze, hogy megjelenik-e a táblák és az adatbázis az eredmények között.
A keresés mentése
Az Aktuális keresés szakaszban a Keresés panelen adja meg a keresés nevét, és válassza a Mentés lehetőséget.
Ellenőrizze, hogy a mentett keresés megjelent-e a Mentett keresések menüben.
Válasszon a mentett kereséseken elvégezhető műveletek közül (Átnevezés, Törlés, Mentés alapértelmezettként).
Csoportosítás zárójelekkel
Zárójelek segítségével csoportosítva különböző logikai egységekre bonthatja a lekérdezés részeit, ami különösen a logikai operátorokkal együtt alkalmazva lehet hasznos.
A keresőmezőbe írja be a
name:product AND (tags:product AND objectType:table)
kifejezést, majd nyomja le az ENTER billentyűt.Ellenőrizze, hogy a találatok között csak a Product tábla jelent-e meg.
Összehasonlító operátorok
Az összehasonlító operátorok segítségével a szám és adat adattípusú tulajdonságok esetében a nem egyenlő összehasonlítások is használhatók.
A keresőmezőbe írja be a
lastRegisteredTime:>"06/09/2016"
kifejezést.Az Objektumtípus szűrő Tábla beállításánál törölje az oda korábban esetleg beírt értéket.
Nyomja le az ENTER billentyűt.
Ellenőrizze, hogy megjelenik-e a Product, a ProductCategory és a ProductDescription tábla, valamint a keresési eredményekben regisztrált SQL-adatbázis.
Az adategységek felderítéséről további információt az Adategységek felderítése című témakörben talál. A keresési szintaxissal kapcsolatos további információkért lásd a Data Catalog Search szintaxisának hivatkozását.
Adategységek ellátása dekorációkkal
Ebben a gyakorlatban az Azure Data Catalog portál használatával jegyzetekkel (például leírásokkal, címkékkel vagy szakértőkkel) fűzhet megjegyzéseket a katalógus meglévő adategységeihez. A széljegyzetek kiegészítik az adatforrásból a regisztráció során kinyert szerkezeti metaadatokat. A széljegyzetekkel az adategységek könnyebben felderíthetők és megérthetők.
Ebben a gyakorlatban egyetlen adategységet (ProductPhoto) fogunk dekorációkkal ellátni. Hozzáadunk egy rövid nevet és egy leírást a ProductPhoto adategységhez.
Nyissa meg az Azure Data Catalog kezdőlapját , és keressen rá
tags:product
a regisztrált adategységek megkereséséhez.Válassza a ProductModel lehetőséget a keresési eredmények között.
A Rövid név mezőbe írja be: Product images, a Leírás mezőbe pedig a következőt: Product photos for marketing materials.
A Description (Leírás) mező segít másoknak megismerni és értelmezni, hogy miért és hogyan használják a kiválasztott adategységet. Lehetősége van további címkék hozzáadására és oszlopok megtekintésére is. Az adatforrások kereséséhez és szűréséhez használja a katalógushoz hozzáadott leíró metaadatokat.
Ezen a lapon a következő lépéseket is elvégezheti:
Szakértőket adhat az adategységekhez. válassza a Hozzáadás lehetőséget a Szakértők területen.
Címkéket adhat hozzá az adatkészlet szintjén. válassza a Hozzáadás lehetőséget a Címkék területen. A címke lehet felhasználói vagy szószedetcímke. A Data Catalog Standard kiadása tartalmaz egy üzleti szószedetet is, amelynek segítségével a katalógus-rendszergazdák megalkothatják a központi üzleti elnevezési rendszert. A katalógus felhasználói ezután a szószedet kifejezéseivel jelölhetik meg az adategységeket. További információk: How to set up the Business Glossary for Governed Tagging (Az irányított címkézéshez használt üzleti szószedet összeállítása)
Címkéket adhat hozzá az oszlopok szintjén. válassza a Jegyzetelni kívánt oszlop Címkék területén a Hozzáadás lehetőséget.
Leírást adhat hozzá az oszlopok szintjén. Töltse ki az oszlop Leírás mezőjét. Megtekintheti az adatforrásból kinyert leírási metaadatokat.
Adjon hozzá Hozzáférés kérése típusú információkat, amelyekből a felhasználók megtudhatják, hogyan kérhetnek hozzáférést az adategységhez.
Válassza a Dokumentáció lapfület, és adja meg az adategységhez tartozó dokumentációt. Az Azure Data Catalog dokumentációs funkciójával az adatkatalógus egyben tartalomtárként is használható, amely bemutatja az adategységek közötti összefüggéseket is.
Ugyanazt a dekorációt egyszerre több adategységhez is hozzáadhatja. Kiválaszthatja például a korábban regisztrált összes adategységet, és megadhat hozzájuk egy szakértőt.
Az Azure Data Catalog közösségi kiszervezést alkalmazó megközelítést használ a dekorációknál. Bármely adatkatalógus-felhasználó hozzáadhat címkéket (felhasználót vagy szószedetet), leírásokat és egyéb metaadatokat. Ezzel a felhasználók perspektívát adnak az adategységre és annak használatára, és megosztják ezt a perspektívát más felhasználókkal.
Az adategységek dekorációkkal való ellátásával kapcsolatban az adategységek dekorálását bemutató cikkben olvashat részletesen.
Csatlakozás adategységekhez
Ebben a gyakorlatban a kapcsolatadatok segítségével az adategységeket egy integrált ügyféleszközben (Excel) és egy nem integrált eszközben (SQL Server Management Studio) is meg fogja nyitni.
Feljegyzés
Nem szabad elfelejteni, hogy az Azure Data Catalog nem ad hozzáférést magához az adatforráshoz, csupán megkönnyíti a felderítését és a megértését. Amikor Ön csatlakozik egy adatforráshoz, a választott ügyfélalkalmazás a windowsos hitelesítési adatokat fogja használni, illetve ha szükséges, felszólítja Önt a hitelesítési adatok megadására. Ha korábban még nem kapott hozzáférést az adatforráshoz, akkor a csatlakozáshoz hozzáférést kell kapnia.
Csatlakozás adategységhez az Excelből
A találatok közül válassza ki a Product elemet. válassza a Megnyitás az eszköztáron lehetőséget, és válassza az Excel lehetőséget.
Válassza a Megnyitás lehetőséget a letöltési előugró ablakban. Ez a felület a böngészőtől függően változhat.
A Microsoft Excel biztonsági értesítés ablakában válassza az Engedélyezés lehetőséget.
Tartsa meg az alapértelmezett értékeket az Adatok importálása párbeszédpanelen, és válassza az OK gombot.
Tekintse meg az adatforrást az Excelben.
Az SQL Server Management Studio
Ebben a gyakorlatban az Azure Data Catalog segítségével felderített adategységekhez fog csatlakozni. Az Azure Data Catalog-portál segítségével közvetlenül, a Open in (Megnyitás a következőben) menüben elérhető integrált ügyfélalkalmazásokkal végezheti el a csatlakozást. Ezenfelül tetszőleges alkalmazáshoz csatlakozhat az adategység metaadataiban szereplő csatlakozási helyadatok segítségével. Az SQL Server Management Studio használatával például csatlakozhat az Azure SQL Database-hez az oktatóanyagban regisztrált adategységek adatainak eléréséhez.
Nyissa meg az SQL Server Management Studiót.
A Kapcsolódás kiszolgálóhoz párbeszédpanelen írja be a kiszolgáló nevét az Azure Data Catalog portál Tulajdonságok paneljéről.
Adja meg az adategység eléréséhez szükséges megfelelő hitelesítési és bejelentkezési adatokat. Ha nincs hozzáférése, használja a Hozzáférés kérése mezőben szereplő adatokat, és kérjen hozzáférést.
Válassza a Kapcsolati sztringek megtekintése lehetőséget a ADO.NET, ODBC- és OLEDB-kapcsolati sztring megtekintéséhez és másolásához a vágólapra az alkalmazásban való használatra.
Adategységek felügyelete
Ebben a lépésben bemutatjuk, hogyan állítható be az adategységek biztonsága. Az adatkatalógus nem biztosít hozzáférést a felhasználóknak az adatokhoz. Az adatok elérését az adatforrás tulajdonosa szabályozza.
A Data Catalog szolgáltatás arra szolgál, hogy adatforrásokat derítsen fel, és megtekintse a katalógusban regisztrált forrásokhoz tartozó metaadatokat. Lehetnek azonban olyan helyzetek, amikor az adatforrásoknak csak bizonyos felhasználók vagy adott csoportok tagjai számára kell láthatónak lenniük. Ezekben a forgatókönyvekben a Data Catalog használatával veheti át a regisztrált adategységek tulajdonjogát, és szabályozhatja a tulajdonában lévő eszközök láthatóságát.
Feljegyzés
Az ebben a gyakorlatban leírt felügyeleti funkciók kizárólag az Azure Data Catalog Standard kiadásában érhetők el, az ingyenes kiadásban nem. Az Azure Data Catalog lehetőséget nyújt az adategységek saját tulajdonba vételére, társtulajdonosok hozzáadására, valamint az adategységek láthatóságának beállítására.
Adategységek birtokbavétele és láthatóságának korlátozása
Nyissa meg az Azure Data Catalog honlapját. A Search (Keresés) mezőbe írja be a
tags:cycles
kifejezést, majd nyomja le az ENTER billentyűt.Jelöljön ki egy elemet az eredménylistában, és válassza a Tulajdonos felvétele lehetőséget az eszköztáron.
A Tulajdonságok panel Kezelés szakaszában válassza a Tulajdonjog átvétele lehetőséget.
A láthatóság korlátozásához válassza a Tulajdonosok &ezek a felhasználók lehetőséget a Láthatóság szakaszban, és válassza a Hozzáadás lehetőséget. A szövegmezőbe írja be a kívánt e-mail-címet, majd nyomja le az ENTER billentyűt.
Adategységek eltávolítása
Ebben a gyakorlatban az Azure Data Catalog-portál használatával el fogja távolítani az előnézeti adatokat a regisztrált adategységekből, valamint adategységeket fog törölni a katalógusból.
Az Azure Data Catalogban az adategységek egyesével és csoportosan is törölhetők.
Nyissa meg az Azure Data Catalog honlapját.
A Keresőmezőbe írja be
tags:cycles
és válassza az ENTER billentyűt.Jelöljön ki egy elemet az eredménylistában, és válassza a Törlés lehetőséget az eszköztáron az alábbi képen látható módon:
Ha a listanézetet használja, a jelölőnégyzet az elem bal oldalán található, ahogy az alábbi képen látható:
Ahogy az az alábbi képen is látható, egyszerre több adategységet is kiválaszthat:
Feljegyzés
A katalógus alapértelmezett viselkedése szerint bármely felhasználó regisztrálhat bármilyen adatforrást, és bármely felhasználó törölhet bármilyen regisztrált adatforrást. Az Azure Data Catalog Standard kiadásának felügyeleti lehetőségei további lehetőségeket nyújtanak, amelyekkel az adategységek saját tulajdonba vehetők, és korlátozható az adategységeket felderíteni és törölni jogosult felhasználók köre.
Az erőforrások eltávolítása
Kövesse az Adategységek eltávolítása lépéseket az oktatóanyag követése során használt összes eszköz eltávolításához.
Összegzés
Ebben az oktatóanyagban bemutattuk az Azure Data Catalog alapvető funkcióit, például a regisztrálást, a dekorálást, a felderítést és a vállalati adategységek felügyeletét. Most, hogy teljesítette az oktatóprogramot, ideje megkezdeni a használatot. Regisztrálja az adatforrásokat, amelyeket a csapatával használ, és hívja fel a munkatársai figyelmét is a katalógus használatára.