Adatforrások jegyzetelése az Azure Data Catalogban
Fontos
Az Azure Data Catalog 2024. május 15-én megszűnt.
Az adatkatalógus funkcióihoz használja a Microsoft Purview szolgáltatást, amely egységes adatszabályozást biztosít a teljes adattulajdonhoz.
Bevezetés
A Microsoft Azure Data Catalog egy teljes körűen felügyelt felhőszolgáltatás, amely regisztrációs és felderítési rendszerként szolgál a vállalati adatforrásokhoz. Más szóval a Data Catalog arról szól, hogy segítsen a felhasználóknak az adatforrások felderítésében, megértésében és felhasználásában, valamint abban, hogy a szervezetek több értéket szerezzenek a meglévő adataikból. Amikor egy adatforrás regisztrálva van a Data Catalogban, a szolgáltatás átmásolja és indexeli a metaadatait, de a történet nem ér véget ott. A Data Catalog lehetővé teszi a felhasználók számára, hogy saját leíró metaadatokat – például leírásokat és címkéket – adjanak meg az adatforrásból kinyert metaadatok kiegészítéséhez, és hogy az adatforrás érthetőbb legyen több felhasználó számára.
Széljegyzet és crowdsourcing
Mindenkinek van véleménye. És ez jó dolog. A Data Catalog felismeri, hogy a különböző felhasználók különböző perspektívákkal rendelkeznek a vállalati adatforrásokkal kapcsolatban, és hogy ezek a perspektívák értékesek lehetnek. Vegyük például a következő esetet:
- A rendszergazda ismeri az adatforrást üzemeltető kiszolgálók vagy szolgáltatások szolgáltatásiszint-szerződését.
- Az adatbázis-rendszergazda ismeri az egyes adatbázisok biztonsági mentési ütemezését és az engedélyezett ETL-feldolgozási ablakokat.
- A rendszer tulajdonosa tudja, hogy a felhasználók hogyan kérhetnek hozzáférést az adatforráshoz.
- Az adatgondnok tudja, hogy az adatforrás eszközei és attribútumai hogyan képezhetők le a vállalati adatmodellre.
- Az elemző tudja, hogyan használják az adatokat az általuk támogatott üzleti folyamatok kontextusában.
Ezek a perspektívák értékesek, és a Data Catalog a metaadatok crowdsourcing megközelítését használja, amely lehetővé teszi az egyes adatok rögzítését és használatát a regisztrált adatforrások teljes képének biztosításához. Minden felhasználó hozzáadhat és szerkeszthet saját széljegyzeteket az Adatkatalógus portálon, miközben megtekintheti a többi felhasználó által biztosított széljegyzeteket.
Különböző típusú széljegyzetek
A Data Catalog a következő típusú széljegyzeteket támogatja:
Jegyzet | Jegyzetek |
---|---|
Rövid név | A rövid nevek az adategység szintjén is megadhatóak, hogy az adategységek könnyebben érthetők legyenek. A felhasználóbarát nevek akkor hasznosak, ha az alapul szolgáló objektumnév titkosítással, rövidítéssel vagy más módon nem értelmezhető a felhasználók számára. |
Leírás | A leírások az adategység és az attribútum/ oszlop szintjén adhatók meg. A leírások szabad formátumú rövid szöveges széljegyzetek, amelyek a felhasználónak az adategységre vagy annak használatára vonatkozó perspektíváját írják le. |
Címkék (felhasználói címkék) | A címkéket az adategység és az attribútum/oszlop szintjén lehet megadni. A felhasználói címkék felhasználó által definiált címkék, amelyek adategységek vagy attribútumok kategorizálására használhatók. |
Címkék (szószedetcímkék) | A címkéket az adategység és az attribútum/oszlop szintjén lehet megadni. A szószedetcímkék olyan központilag definiált szószedeti kifejezések, amelyek az adategységek vagy attribútumok kategorizálására használhatók egy általános üzleti osztályozás használatával. További információk: How to set up the Business Glossary for Governed Tagging (Az irányított címkézéshez használt üzleti szószedet összeállítása) |
Szakértők | Szakértőket az adategység szintjén lehet nyújtani. A szakértők azonosítják az adatokkal kapcsolatos szakértői nézőpontokkal rendelkező felhasználókat vagy csoportokat, és kapcsolatfelvételi pontokként szolgálhatnak azok számára, akik felfedezik a regisztrált adatforrásokat, és olyan kérdésekkel rendelkeznek, amelyekre a meglévő széljegyzetek nem válaszolnak. |
Hozzáférés kérése | A kérések hozzáférési információi az adategység szintjén adhatók meg. Ez az információ azoknak a felhasználóknak szól, akik olyan adatforrást fedeznek fel, amelyhez még nincs hozzáférésük. A felhasználók megadhatja annak a felhasználónak vagy csoportnak az e-mail-címét, aki hozzáférést ad a felhasználóknak, vagy megadhatja annak a folyamatnak vagy eszköznek az URL-címét, amelyhez a felhasználóknak hozzáférést kell szereznie, vagy beírhatják magát a folyamatot szövegként. |
Dokumentáció | A dokumentáció az adategység szintjén nyújtható. Az eszközdokumentáció olyan részletes szöveges információk, amelyek hivatkozásokat és képeket tartalmazhatnak, és amelyek leírásokon és címkéken keresztül nem közvetített információkat biztosítanak. |
Több objektum jegyzetelése
A felhasználók több adategységet is kijelölhetnek az Adatkatalógus portálon, és egyetlen műveletben jegyzetelhetik az összes kijelölt objektumot. A széljegyzetek az összes kijelölt objektumra érvényesek lesznek, így könnyen kiválasztható, és egységes leírást és címkéket és szakértőket adhat meg a kapcsolódó adategységekhez.
Feljegyzés
Az adategységek adatkatalógusbeli adatforrás-regisztrációs eszköz használatával történő regisztrálásakor címkéket és szakértőket is megadhat.
Több tábla és nézet kijelölésekor csak az összes kijelölt adategység közös oszlopai jelennek meg az Adatkatalógus portálon. Ez lehetővé teszi, hogy a felhasználók címkéket és leírásokat adjanak meg minden olyan oszlophoz, amelynek a neve megegyezik az összes kijelölt objektum nevével.
Széljegyzetek és felderítés
Ahogy a regisztráció során az adatforrásból kinyert metaadatok bekerülnek az adatkatalógus keresési indexéhez, a felhasználó által megadott metaadatok is indexelve lesznek. Ez azt jelenti, hogy nemcsak a széljegyzetek megkönnyítik a felhasználók számára a felderített adatok megértését, hanem a széljegyzetek is megkönnyítik a felhasználók számára a jegyzetekkel ellátott adategységek felderítését a számukra érthető kifejezések használatával.
Összegzés
Az adatforrás adatkatalógusban való regisztrálása lehetővé teszi az adatok felderítését azáltal, hogy szerkezeti és leíró metaadatokat másol az adatforrásból a Katalógus szolgáltatásba. Miután regisztrálták az adatforrást, a felhasználók széljegyzeteket adhatnak meg, hogy könnyebben felfedezhessék és megérthessék az adatkatalógus portálján.