Megosztás a következőn keresztül:


Mi az az Azure Data Catalog?

Fontos

Az Azure Data Catalog 2024. május 15-én megszűnt.

Az adatkatalógus funkcióihoz használja a Microsoft Purview szolgáltatást, amely egységes adatszabályozást biztosít a teljes adattulajdonhoz.

Az Azure Data Catalog egy teljes körűen felügyelt felhőszolgáltatás, amellyel a felhasználók felfedezhetik a szükséges adatforrásokat, és megérthetik az általuk talált adatforrásokat. Eközben a Data Catalog a vállalatoknak is segít még több értéket kinyerni a meglévő befektetésekből.

A Data Catalog használatával bármely felhasználó (elemző, adatelemző vagy fejlesztő) felderítheti, megértheti és felhasználhatja az adatforrásokat az adatkörzetében. A Data Catalog tartalmaz egy metaadatok és széljegyzetek crowdsourcing modelljét, így mindenki hozzájárulhat az adatok felderíthetővé és használhatóvá tételéhez. Ez egy központi hely a szervezet összes felhasználója számára, hogy hozzájáruljon tudásához, és felépítse az adatok közösségét és kultúráját.

Az adatok felfedezésének kihívásai az adatfelhasználók számára

A vállalati adatforrások felfedezése hosszú ideje egy organikus, kollektív tudáson alapú folyamat. Azoknak a vállalatoknak, amelyek a legnagyobb értéket szeretnék kinyerni az információs eszközeikből, ez a megközelítés számos kihívást jelent:

  • Előfordulhat, hogy a felhasználók nem tudják, hogy létezik adatforrás, hacsak nem kerülnek kapcsolatba vele egy másik folyamat részeként. Nincs központi hely, ahol az adatforrások regisztrálva vannak.
  • Hacsak a felhasználók nem ismerik az adatforrás helyét, nem tudnak csatlakozni az adatokhoz egy ügyfélalkalmazás használatával. A hagyományos adatfelhasználási folyamatok során a felhasználóknak tudniuk kell a megfelelő kapcsolati sztringet, vagy az elérési utat.
  • Hacsak a felhasználók nem ismerik az adatforrás dokumentációjának helyét, nem értik az adatok rendeltetését. Előfordulhat, hogy az adatforrások és a dokumentáció különböző helyeken élnek, és különböző szolgáltatásokon keresztül használhatók fel.
  • Ha a felhasználóknak kérdése van egy adott információval kapcsolatban, személyesen kell megkeresniük az adatokért felelős szakembert vagy csapatot. Nincs explicit kapcsolat az adatok és a szakértők között, akiknek van elképzelésük a felhasználásukról.
  • Ha a felhasználók nem értik az adatforráshoz való hozzáférés kérésének folyamatát, az adatforrás és dokumentációjának felderítése még mindig nem segít nekik az adatok elérésében.

Az adatok felfedezésének kihívásai az adatalkotók számára

Miközben az adatfelhasználók mindezekkel az említett kihívásokkal néznek szembe, az információs adategységek létrehozásáért és fenntartásáért felelős felhasználóknak szintén megvannak a saját kihívásaik:

  • Az adatforrások felcímkézése tájékoztató jellegű metaadatokkal gyakran hiábavalónak bizonyul. Az ügyfélalkalmazások általában figyelmen kívül hagyják az adatforrásban tárolt tájékoztatókat.
  • Adatforrásokhoz dokumentációt készíteni gyakran hiábavalónak bizonyul. A dokumentációnak az adatforrásokkal való szinkronban tartása folyamatos felelősség. Előfordulhat, hogy a felhasználók nem bíznak az elavultnak ítélt dokumentációban.
  • Az adatforrásokhoz tartozó dokumentációk létrehozása és fenntartása összetett és időigényes feladat. A dokumentációkat az adatforrás minden felhasználója számára elérhetővé tenni pedig gyakran még inkább az.
  • Állandó kihívás az adatforrásokhoz való hozzáférés korlátozása, és annak biztosítása, hogy az adatfelhasználók ismerjék a hozzáférések kérelmezésének menetét.

Az ilyen kihívások együttesen jelentős korlátokat állítanak a vállalatok elé, akik szorgalmazni kívánják a vállalati adatok felhasználását és értelmezését.

Az Azure Data Catalog segíthet

A Data Catalog szolgáltatást arra tervezték, hogy megoldja ezeket a problémákat, és segítsen a vállalatoknak a lehető leghatékonyabban kihasználni a meglévő információs eszközeiket. A Data Catalog az adatforrásokat könnyen felfedezhetővé és értelmezhetővé teszi azon felhasználók számára, akik a bennük foglalt adatokat kezelik.

A Data Catalog egy felhőalapú szolgáltatást biztosít, amelybe az adatforrásokat regisztrálni lehet. Az adatok az eredeti helyükön maradnak, de a metaadatok másolatai bekerülnek a Data Catalog katalógusába, az adatforrások helyére mutató hivatkozásokkal együtt. A metaadatok indexelésének köszönhetően az adatforrások egy egyszerű keresés által felfedezhetővé és könnyen értelmezhetővé válnak a felhasználók számára.

Az adatforrás regisztrálása után a metaadatai bővíthetők. A metaadatokat a regisztrált felhasználó vagy a vállalat más felhasználói adhatják hozzá. Bármely felhasználó megjegyzésekkel láthatja el az adatforrásokat, amelyekben leírásokat, címkéket és egyéb metaadatokat, például dokumentációkat és hozzáférés-kérelmezési eljárásokat adhat meg. Ezek a leíró metaadatok kiegészítik az adatforrásból regisztrált szerkezeti metaadatokat (például oszlopneveket és adattípusokat).

Az adatforrások regisztrálásának elsődleges célja, hogy a források felfedezhetők, értelmezhetők és felhasználhatók legyenek. A vállalati felhasználóknak adatokra lehet szükségük az üzleti intelligencia, az alkalmazásfejlesztés, az adattudomány és minden más olyan tevékenység terén, ahol fontos a megfelelő adatok használata. Ők a Data Catalog segítségével könnyedén megtalálhatják a szükségleteiknek megfelelő adatokat, értelmezhetik, hogy mennyire felelnek meg felhasználási szempontjaiknak, és fel is használhatják őket úgy, hogy az adatforrást a választott eszközzel nyitják meg.

Ezzel egy időben a regisztrált adatforrások címkézésével, dokumentáció, illetve jegyzetek készítésével a felhasználók közre is tudnak működni a katalógus készítésében. További adatforrásokat is regisztrálni tudnak, amelyeket a katalógus felhasználói közössége szabadon felfedezhet, értelmezhet és felhasználhat.

A Data Catalog képességei

További információ a Data Catalog szolgáltatásról

A Data Catalog képességeinek bővebb megismeréséhez lásd a következő témaköröket:

Következő lépések