Kurz: Registrace datových prostředků ve službě Azure Data Catalog

Důležité

Azure Data Catalog se 15. května 2024 vyřadí z důchodu.

Nové účty Azure Data Catalog už nejde vytvořit.

Pro funkce katalogu dat použijte službu Microsoft Purview , která nabízí jednotné zásady správného řízení dat pro celá data.

Pokud už používáte Azure Data Catalog, budete muset vytvořit plán migrace pro vaši organizaci, aby se do 15. května 2024 přesunula do Microsoft Purview .

V tomto kurzu použijete registrační nástroj k registraci datových prostředků z ukázky databáze v katalogu. Registrace je proces extrahování klíčových strukturálních metadat – například názvy, typy a umístění – ze zdroje dat a assetů v tomto zdroji a zkopírování těchto metadat do katalogu. Zdroj dat a datové assety zůstanou tam, kde jsou, ale jejich metadata použije katalog k tomu, aby byly tyto objekty snadněji zjistitelné a srozumitelnější.

V tomto kurzu se naučíte:

  • Registrace datových prostředků
  • Vyhledávání datových prostředků
  • Přidání poznámek k datovým prostředkům
  • Připojení k datovým prostředkům
  • Správa datových prostředků
  • Odstranění datových prostředků

Požadavky

Pokud chcete nastavit Službu Data Catalog, musíte být vlastníkem nebo spoluvlastníkem předplatného Azure.

Registrace datových prostředků

Registrace zdroje dat

V tomto příkladu zaregistrujeme datové prostředky (tabulky) z ukázky databáze pro Azure SQL Database, ale pokud dáváte přednost práci s daty, která jsou známá a relevantní pro vaši roli, můžete použít libovolný podporovaný zdroj dat. Seznam podporovaných zdrojů dat najdete v tématu: Podporované zdroje dat.

Název databáze, který používáme v tomto kurzu, je RLSTest.

Datové prostředky teď můžete zaregistrovat z ukázky databáze pomocí služby Azure Data Catalog.

  1. Přejděte na domovskou stránku služby Azure Data Catalog a vyberte Publikovat data.

    Katalog dat je otevřen s vybraným tlačítkem Publikovat data.

  2. Vyberte Spustit aplikaci , abyste si stáhli, nainstalovali a spustili registrační nástroj na vašem počítači.

    Na stránce Publikovat data je vybráno tlačítko Spustit aplikaci.

  3. Na úvodní stránce vyberte Přihlásit se a zadejte svoje přihlašovací údaje.

    Na úvodní stránce je vybráno tlačítko Přihlásit se.

  4. Na stránce Microsoft Azure Data Catalog vyberte SQL Server a Další.

    Na stránce Microsoft Azure Data Catalog je vybráno tlačítko SQL Serveru. Pak je vybráno tlačítko další.

  5. Zadejte vlastnosti připojení SQL Serveru pro ukázku databáze ve službě Azure SQL Database a vyberte PŘIPOJIT.

    Na stránce vlastností připojení K Q L Serveru jsou textová pole zvýrazněná pro tyto atributy: název serveru, uživatelské jméno, heslo a databáze. Pak je vybráno tlačítko Připojení.

  6. Zaregistrujte metadata datového assetu. V tomto příkladu zaregistrujete objekty Product z ukázkového oboru názvů:

    1. Ve stromu Hierarchie serverů rozbalte ukázku databáze a vyberte SalesLT.

    2. Vyberte Product, ProductCategory, ProductDescription a ProductModel pomocí ctrl+select.

    3. Vyberte šipku vybranou pro přesunutí (>). Tím se přesunou všechny vybrané objekty do seznamu Objekty k registraci.

      V hierarchii serveru je vybrána možnost Sales L T. V seznamu Dostupné objekty jsou zvýrazněny všechny objekty popisu produktu, kategorie produktu, popisu produktu, modelu produktu a vytváření objektů popisů modelu. Pak je vybraná > možnost přesunout.

    4. Vyberte možnostZahrnout náhled, pokud chcete zahrnout snímek náhledu dat. Snímek obsahuje až 20 záznamů z každé tabulky a zkopíruje se do katalogu.

    5. Vyberte možnost Zahrnout profil dat, pokud chcete zahrnout snímek statistik objektu pro profil dat (např.: minimální, maximální a průměrné hodnoty sloupce, počet řádků).

    6. Do pole Přidat značky zadejte prodej, produkt, Azure SQL. Tím se přidají vyhledávací značky pro tyto datové assety. Značky jsou skvělý způsob, jak pomoci uživatelům najít registrovaný zdroj dat.

    7. Zadejte jméno experta na tyto data (volitelné).

      V seznamu zaregistrovaných objektů jsou uvedené tyto názvy: produkt, kategorie produktu, popis produktu, produktový model a popis produktu. Pak jsou vybrány možnosti Zahrnout náhled a Zahrnout datový profil. Pak se do pole značky přidají tři značky: prodej, produkt a Azure SQL.

    8. Vyberte ZAREGISTROVAT. Azure Data Catalog zaregistruje vaše vybrané objekty. V tomto cvičení se zaregistrují vybrané objekty z ukázky databáze. Registrační nástroj vyextrahuje metadata z datového assetu a zkopíruje je do služby Azure Data Catalog. Data zůstávají tam, kde aktuálně zůstávají. Data zůstávají pod kontrolou správců a zásad systému původu.

      V okně Microsoft Azure Data Catalog se všechny nově registrované objekty zobrazí v seznamu Objekty, které se mají zaregistrovat. V horní části okna se zobrazí oznámení o dokončení procesu registrace vybraných objektů. Pak je vybráno tlačítko Zobrazit portál.

    9. Pokud chcete zobrazit zaregistrované objekty zdroje dat, vyberte Zobrazit portál. Na portálu Azure Data Catalog ověřte, že se v zobrazení mřížky zobrazují všechny čtyři tabulky a databáze (ověřte, že je panel hledání jasný).

      V okně Microsoft Azure Data Catalog jsou v zobrazení mřížky nové dlaždice pro každý zaregistrovaný objekt.

V tomto cvičení jste zaregistrovali objekty z ukázky databáze pro Azure SQL Database, aby je uživatelé ve vaší organizaci mohli snadno zjistit.

V dalším cvičení se dozvíte, jak zjistit registrované datové assety.

Zjišťování datových prostředků

Funkce zjišťování ve službě Azure Data Catalog používá dva primární mechanismy: vyhledávání a filtrování.

Vyhledávání je koncipováno tak, aby bylo jak intuitivní, tak výkonné. Ve výchozím nastavení se vyhledává shoda hledaných výrazů s libovolnou vlastností v katalogu včetně poznámek přidaných uživatelem.

Filtrování je koncipováno jako doplněk k vyhledávání. Můžete vybrat konkrétní charakteristiky, jako jsou experti, typ zdroje dat, typ objektu a značky, abyste zobrazili datové assety odpovídající těmto charakteristikám, a tak omezit výsledky vyhledávání.

Pomocí kombinace vyhledávání a filtrování můžete rychle procházet zdroje dat zaregistrované ve službě Azure Data Catalog.

V tomto cvičení použijete portál služby Azure Data Catalog ke zjištění datových assetů, které jste zaregistrovali v předchozím cvičení. Podrobnosti o syntaxi vyhledávání naleznete v článku Referenční příručka syntaxe vyhledávání ve službě Data Catalog.

Následuje několik příkladů, jak zjistit datové assety v katalogu.

Základní vyhledávání vám pomůže prohledat katalog pomocí jednoho nebo více hledaných výrazů. Ve výsledcích se zobrazí veškeré assety, které odpovídají jakékoli vlastnosti jednoho nebo více zadaných výrazů.

  1. Na portálu Azure Data Catalog vyberte Domovskou stránku . Pokud jste zavřeli webový prohlížeč, přejděte na domovskou stránku služby Azure Data Catalog.

  2. Do vyhledávacího pole zadejte product a stiskněte klávesu ENTER.

    Na portálu Azure Data Catalog je vybrané tlačítko Domů. Pak se do vyhledávacího pole

  3. Ověřte, že se ve výsledcích zobrazí všechny čtyři tabulky a databáze. Mezi zobrazením mřížky a zobrazením seznamu můžete přepínat výběrem tlačítek na panelu nástrojů, jak je znázorněno na následujícím obrázku. Všimněte si, že hledané klíčové slovo je ve výsledcích vyhledávání zvýrazněno, protože možnost Zvýraznit je ZAPNUTO. Ve výsledcích vyhledávání můžete také upřesnit počet výsledků na stránku.

    Na panelu hledání se stále zadává

    Panel Vyhledávání se nachází na levé straně a panel Vlastnosti na pravé. Na panelu Vyhledávání lze změnit kritéria vyhledávání a filtrovat výsledky. Na panelu Vlastnosti se zobrazují vlastnosti vybraného objektu v mřížce nebo seznamu.

  4. Ve výsledcích hledání vyberte Produkt . vyberte kartu Náhled, Sloupce, Profil dat a Dokumentace nebo vyberte šipku, která rozbalí dolní podokno.

    V horní části výsledků hledání je vybráno tlačítko Náhled.

    Na kartě Náhled uvidíte náhled dat v tabulce Produkt.

  5. Výběrem karty Sloupce vyhledejte podrobnosti o sloupcích (například název a datový typ) datového assetu.

  6. Výběrem karty Profil dat zobrazíte profilaci dat (například počet řádků, velikost dat nebo minimální hodnota ve sloupci) datového assetu.

Zjištění datových assetů pomocí zkoumání vlastností

Funkce zkoumání vlastností vám pomůže zjistit datové assety v případě, že se hledaný výraz shoduje se zadanou vlastností.

  1. Ve části Filtry pod položkou Typ objektu vymažte filtr Tabulka.

  2. Do vyhledávacího pole zadejte tags:product a stiskněte klávesu ENTER. Všechny vlastnosti, které lze využít při vyhledávání v katalogu dat, naleznete v článku Referenční příručka syntaxe vyhledávání ve službě Data Catalog.

  3. Ověřte, že se ve výsledcích zobrazují tabulky a databáze.

    Do vyhledávacího panelu se zadává 'Tags : product' (Značky: product) a filtr Typu objektu zobrazuje tabulku, která je vybrána.

  1. V podokně Hledání v části Aktuální hledání zadejte název hledání a vyberte Uložit.

    V podokně hledání bylo jako název hledání zadáno hledání značky produktu. Pak je vybráno tlačítko Uložit.

  2. Zkontrolujte, jestli se uložené vyhledávání zobrazuje v sekci Uložená vyhledávání.

  3. Vyberte jednu z akcí, které lze s uloženým vyhledáváním provést (Přejmenovat, Odstranit, Uložit jako výchozí).

Seskupování pomocí závorek

Závorky lze použít k seskupení částí dotazu za účelem logické izolace, zejména ve spojení s logickými operátory.

  1. Do vyhledávacího pole zadejte name:product AND (tags:product AND objectType:table) a stiskněte klávesu ENTER.

  2. Zkontrolujte, jestli se vám ve výsledcích vyhledávání zobrazuje pouze tabulka Product.

    Do vyhledávacího řádku

Operátory porovnání

S pomocí operátorů porovnání lze použít porovnávání jiné než rovnost pro vlastnosti, které mají typ dat číslo nebo datum.

  1. Do vyhledávacího pole zadejte lastRegisteredTime:>"06/09/2016".

  2. Pod položkou Typ objektu vymažte filtr Tabulka.

  3. Stiskněte ENTER.

  4. Ověřte, že se zobrazí tabulky Product, ProductCategory a ProductDescription a databáze SQL, kterou jste zaregistrovali ve výsledcích hledání.

    Na panelu hledání byl naposledy zaregistrován čas : > 06/09/2016 byl zadán. Vrátily se tabulky Product(Produkt), Product Category (Kategorie produktu), Product Description (Popis produktu). Byla vrácena také databáze S Q L.

Podrobné informace o zjišťování datových prostředků najdete v tématu Zjišťování datových prostředků. Další informace o syntaxi vyhledávání naleznete v tématu Referenční informace o syntaxi vyhledávání katalogu Data Catalog.

Přidání poznámek k datovým prostředkům

V tomto cvičení použijete portál Azure Data Catalog k přidání poznámek (přidání informací, jako jsou popisy, značky nebo odborníci) existujících datových prostředků v katalogu. Poznámky doplňují strukturální metadata extrahovaná ze zdroje dat během registrace. Poznámka usnadňuje zjišťování a pochopení datových prostředků.

V tomto cvičení přidáte poznámky k jednomu datovému assetu (ProductPhoto). Doplníte k datovému assetu ProductPhoto popisný název a popis.

  1. Přejděte na domovskou stránku služby Azure Data Catalog a vyhledejte tags:product datové prostředky, které jste zaregistrovali.

  2. Ve výsledcích hledání vyberte ProductModel .

  3. Zadejte Obrázky produktu pro Popisný název a jako Popis zadejte Fotografie produktu pro marketingové materiály.

    V podokně Vlastnosti se zobrazí název, popisný název a popis vybraného prostředku. Informace je možné upravit.

    Popis pomáhá ostatním zjistit datový asset a porozumět tomu, proč a jak vybraný datový asset používat. Můžete také přidat další značky a zobrazit sloupce. Zdroje dat můžete prohledávat a filtrovat pomocí popisných metadat, která jste přidali do katalogu.

Na této stránce můžete také provést následující kroky:

  • Přidání expertů k datovým assetům. vyberte Přidat do oblasti Experti .

  • Přidání značek na úrovni datové sady. vyberte Přidat v oblasti Značky . Značka může být značka uživatele nebo značka glosáře. Data Catalog Standard Edition zahrnuje obchodní glosář, který pomáhá správcům katalogu definovat centrální obchodní taxonomii. Uživatelé katalogu mohou poté opatřit poznámkami datové prostředky pomocí termínů v glosáři. Další informace najdete v článku Jak nastavit obchodní glosář řízeným přidáváním značek

  • Přidání značek na úrovni sloupce. vyberte Přidat v části Značky pro sloupec, který chcete přidat poznámky.

  • Přidání popisu na úrovni sloupce. Zadejte Popis pro sloupec. Můžete také zobrazit metadata popisu extrahovaná ze zdroje dat.

  • Přidejte informace pro Žádost o přístup, které uživatelům dají návod, jak požádat o přístup k datovým assetům.

  • Vyberte kartu Dokumentace a dodejte dokumentaci pro datový asset. Funkce dokumentace ve službě Azure Data Catalog vám umožňuje použít katalog dat jako úložiště obsahu. Můžete tak mít po ruce podrobné popisy a návody k registrovaným datovým assetům.

Můžete také přidat poznámku k více datovým assetům. Můžete například vybrat všechny datové assety, které jste zaregistrovali, a zadat k nim jednoho experta.

Je zaškrtnuté políčko v záhlaví tabulky výsledků. Při výběru tohoto zaškrtávacího políčka v řádku nadpisu byly vybrány všechny vrácené prostředky. Úpravy okna Vlastnosti ovlivní všechny vybrané prostředky.

Azure Data Catalog podporuje crowdsourcingový přístup k přidávání poznámek. Každý uživatel katalogu Data Catalog může přidávat značky (uživatele nebo glosář), popisy a další metadata. Uživatelé tak přidají perspektivu k datovému prostředku a jeho použití a sdílejí tuto perspektivu s ostatními uživateli.

Podrobné informace o přidávání poznámek k datovým assetům najdete v článku Jak přidat poznámky k datovým assetům.

Připojení k datovým prostředkům

V tomto cvičení otevřete datové assety v integrovaném klientském nástroji (Excel) i neintegrovaném nástroji (SQL Server Management Studio) s použitím informací o připojení.

Poznámka:

Je důležité pamatovat, že Azure Data Catalog vám nedává přístup k samotnému zdroji dat – pouze vám usnadňuje tento zdroj dat zjistit a porozumět jeho funkci. Když se připojíte ke zdroji dat, klientská aplikace, kterou si vyberte, použije podle potřeby vaše přihlašovací údaje systému Windows nebo vás vyzve k zadání přihlašovacích údajů. Pokud vám nebyl dříve udělen přístup k tomuto zdroji dat, bude vám muset být udělen, abyste se mohli připojit.

Připojení k datovému assetu z Excelu

  1. Ve výsledcích vyhledávání vyberte možnost Product. na panelu nástrojů vyberte Otevřít v aplikaci Excel.

    Produkt je vybrán z tabulky vrácených výsledků. Je vybráno tlačítko Otevřít v a Excel je vybrán z rozevírací nabídky.

  2. V automaticky otevíraných oknech pro stahování vyberte Otevřít . Toto prostředí se může lišit v závislosti na prohlížeči.

  3. V okně Upozornění zabezpečení aplikace Microsoft Excel vyberte Povolit.

    V automaticky otevíraných oznámení zabezpečení aplikace Microsoft Excel je vybráno tlačítko Povolit.

  4. V dialogovém okně Importovat data ponechte výchozí hodnoty a vyberte OK.

    V dialogovém okně Importovat data je vybraná možnost O K.

  5. Zobrazení zdroje dat v Excelu.

    Všechna data se zobrazují v excelové tabulce.

SQL Server Management Studio

V tomto cvičení jste se připojili k datovým assetům zjištěným pomocí služby Azure Data Catalog. Portál služby Azure Data Catalog vám umožňuje připojit se přímo pomocí klientských aplikací integrovaných do jeho nabídky Otevřít v aplikaci. Také se ale můžete připojit pomocí jakékoli aplikace, kterou si vyberete, pomocí informací o umístění připojení zahrnutých v metadatech assetu. K přístupu k datům v datových prostředcích registrovaných v tomto kurzu můžete například použít SQL Server Management Studio pro připojení ke službě Azure SQL Database.

  1. Otevřete SQL Server Management Studio.

  2. V dialogovém okně Připojit k serveru zadejte název serveru z podokna Vlastnosti na portálu Azure Data Catalog.

  3. Použijte příslušné ověření a přihlašovací údaje pro přístup k datovému assetu. Pokud nemáte přístup, použijte informace uvedené v poli Žádost o přístup a vyžádejte si jej.

    V dialogovém okně Informace o Připojení ionu je zvýrazněno pole Požádat o přístup.

Vyberte Zobrazit Připojení ion Řetězce pro zobrazení a kopírování ADO.NET, ODBC a OLEDB připojovací řetězec do schránky pro použití ve vaší aplikaci.

Správa datových prostředků

V tomto kroku se dozvíte, jak nastavit zabezpečení datových assetů. Služba Data Catalog neposkytuje uživatelům přístup k samotným datům. O udělení přístupu k datům rozhoduje vlastník zdroje dat.

Služba Data Catalog vám umožní zjistit zdroje dat a zobrazit metadata související se zdroji zaregistrovanými v katalogu. Můžou ale nastat situace, kdy by zdroje dat měly být viditelné jenom konkrétním uživatelům nebo členům konkrétních skupin. V těchto scénářích můžete pomocí katalogu Data Catalog převzít vlastnictví registrovaných datových prostředků a řídit viditelnost aktiv, které vlastníte.

Poznámka:

Možnosti správy popsané v tomto cvičení jsou k dispozici pouze v Azure Data Catalog Standard Edition, nikoli v bezplatné Free Edition. Ve službě Azure Data Catalog může převzít vlastnictví datových prostředků, přidat spoluvlastníky k datovým prostředkům a nastavit viditelnost datových prostředků.

Převzetí vlastnictví datových assetů a omezení viditelnosti

  1. Přejděte na domovskou stránku služby Azure Data Catalog. Do textového pole Vyhledávání zadejte tags:cycles a stiskněte klávesu ENTER.

  2. Vyberte položku v seznamu výsledků a na panelu nástrojů vyberte Převzít vlastnictví .

  3. V části Správa na panelu Vlastnosti vyberte Převzít vlastnictví.

    Položka Produkt je vybrána v seznamu výsledků a na kartě Vlastnosti v části Správa je zvýrazněno tlačítko Převzít vlastnictví.

  4. Pokud chcete omezit viditelnost, zvolte v části Viditelnost vlastníky a tyto uživatelea vyberte Přidat. Do textového pole zadejte e-mailové adresy uživatelů a stiskněte ENTER.

    Na kartě Vlastnosti je v části Správa vybráno tlačítko Přidat v části Vlastníci. Pak je v části Viditelnost vybráno tlačítko Vlastníci a Tito uživatelé. Pak je vybráno tlačítko Přidat v části Viditelnost.

Odebrání datových prostředků

V tomto cvičení použijete portál služby Azure Data Catalog k odebrání náhledu dat z registrovaných datových assetů a k odstranění datových assetů z katalogu.

Ve službě Azure Data Catalog je možné odstranit jednotlivý asset nebo více assetů.

  1. Přejděte na domovskou stránku služby Azure Data Catalog.

  2. Do textového pole Hledat zadejte tags:cycles a vyberte ENTER.

  3. Vyberte položku v seznamu výsledků a na panelu nástrojů vyberte Odstranit , jak je znázorněno na následujícím obrázku:

    Dlaždice Produkt je vybrána ze seznamu výsledků hledání a tlačítko Odstranit je vybráno na horním panelu nástrojů.

    Pokud používáte zobrazení seznamu, je zaškrtávací políčko vlevo od položky, jak je znázorněno na následujícím obrázku:

    V zobrazení seznamu je pole výběru vlevo od položky výsledků hledání. Produkt je vybraný a na horním panelu nástrojů je vybráno tlačítko odstranit.

    Můžete také vybrat a odstranit více datových assetů, jak ukazuje následující obrázek:

    Azure Data Catalog – odstranění více datových assetůV zobrazení seznamu bylo vybráno více prostředků a tlačítko odstranit je vybráno na horním panelu nástrojů.

Poznámka:

Výchozí chování katalogu je umožnit každému uživateli zaregistrovat libovolný zdroj dat a umožnit každému uživateli odstranit libovolný zaregistrovaný datový prostředek. Možnosti správy zahrnuté do Azure Data Catalog Standard Edition poskytují další možnosti pro převzetí vlastnictví assetů, omezení, kdo může assety zjistit, a omezení, kdo může assety odstranit.

Vyčištění prostředků

Postupujte podle kroků pro odebrání datových prostředků a vyčistěte všechny prostředky, které jste použili při sledování tohoto kurzu.

Shrnutí

V tomto kurzu jste prozkoumali základní možnosti služby Azure Data Catalog včetně registrace, přidávání poznámek, zjišťování a správy datových assetů organizace. Nyní, když jste dokončili kurz, je čas začít. Začít můžete ještě dnes registrací zdrojů dat, na která spoléháte vy a váš tým, a pozváním kolegů k používání katalogu.

Další kroky