Jak dodawać adnotacje do źródeł danych w usłudze Azure Data Catalog

Ważne

Usługa Azure Data Catalog jest wycofywana 15 maja 2024 r.

Nie można już tworzyć nowych kont usługi Azure Data Catalog.

W przypadku funkcji wykazu danych użyj usługi Microsoft Purview , która oferuje ujednolicony nadzór nad danymi dla całego majątku danych.

Jeśli już używasz usługi Azure Data Catalog, musisz utworzyć plan migracji dla organizacji, aby przejść do usługi Microsoft Purview do 15 maja 2024 r.

Wprowadzenie

Usługa Microsoft Azure Data Catalog to w pełni zarządzana usługa w chmurze, która służy jako system rejestracji i systemu odnajdywania dla źródeł danych przedsiębiorstwa. Innymi słowy, usługa Data Catalog polega na pomaganiu osobom w odkrywaniu, interpretowaniu i używaniu źródeł danych oraz ułatwianiu organizacjom uzyskiwania większej wartości z istniejących danych. Gdy źródło danych jest zarejestrowane w usłudze Data Catalog, jego metadane są kopiowane i indeksowane przez usługę, ale historia się tam nie kończy. Usługa Data Catalog umożliwia użytkownikom udostępnianie własnych metadanych opisowych , takich jak opisy i tagi, w celu uzupełnienia metadanych wyodrębnionych ze źródła danych oraz zwiększenia zrozumienia źródła danych dla większej liczby osób.

Adnotacja i crowdsourcing

Każdy ma opinię. I to jest dobra rzecz. Usługa Data Catalog rozpoznaje, że różni użytkownicy mają różne perspektywy źródeł danych przedsiębiorstwa i że każda z tych perspektyw może być cenna. Rozważmy następujący scenariusz:

  • Administrator systemu zna umowę dotyczącą poziomu usług dla serwerów lub usług hostujących źródło danych.
  • Administrator bazy danych zna harmonogram tworzenia kopii zapasowych dla każdej bazy danych oraz dozwolone okna przetwarzania ETL.
  • Właściciel systemu zna proces żądania dostępu do źródła danych przez użytkowników.
  • Steward danych wie, jak zasoby i atrybuty w źródle danych są mapowania na model danych przedsiębiorstwa.
  • Analityk wie, jak dane są używane w kontekście procesów biznesowych, które obsługują.

Każda z tych perspektyw jest cenna, a usługa Data Catalog korzysta z podejścia crowdsourcingowego do metadanych, które umożliwiają przechwytywanie każdego z nich i używanie ich do zapewnienia pełnego obrazu zarejestrowanych źródeł danych. Każdy użytkownik może dodawać i edytować własne adnotacje w portalu usługi Data Catalog, jednocześnie mogąc wyświetlać adnotacje udostępniane przez innych użytkowników.

Różne typy adnotacji

Usługa Data Catalog obsługuje następujące typy adnotacji:

Annotation Uwagi
Przyjazna nazwa Przyjazne nazwy można podać na poziomie zasobu danych, aby ułatwić zrozumienie zasobów danych. Przyjazne nazwy są najbardziej przydatne, gdy nazwa obiektu bazowego jest tajemniczą, skróconą lub w inny sposób zrozumiałą dla użytkowników.
opis Opisy można dostarczyć na poziomach zasobu danych i atrybutu/kolumny. Opisy to krótkie adnotacje tekstowe, które opisują perspektywę użytkownika na zasobie danych lub jego użyciu.
Tagi (tagi użytkownika) Tagi można dostarczać na poziomach zasobów i atrybutów/kolumn danych. Tagi użytkowników to etykiety zdefiniowane przez użytkownika, których można użyć do kategoryzowania zasobów lub atrybutów danych.
Tagi (tagi słownika) Tagi można dostarczać na poziomach zasobów i atrybutów/kolumn danych. Tagi słownika to centralnie zdefiniowane terminy słownika, których można użyć do kategoryzowania zasobów danych lub atrybutów przy użyciu typowej taksonomii biznesowej. Aby uzyskać więcej informacji, zobacz How to set up the Business Glossary for Governed Tagging (Jak skonfigurować słownik biznesowy na potrzeby znakowania zarządzanego).
Eksperci Eksperci mogą być dostarczani na poziomie zasobów danych. Eksperci identyfikują użytkowników lub grupy z perspektywami ekspertów w zakresie danych i mogą służyć jako punkty kontaktowe dla użytkowników, którzy odnajdują zarejestrowane źródła danych i mają pytania, na które nie odpowiadają istniejące adnotacje.
Żądanie dostępu Informacje o dostępie do żądań można podać na poziomie zasobu danych. Te informacje są przeznaczone dla użytkowników, którzy odnajdują źródło danych, do którego jeszcze nie mają uprawnień dostępu. Użytkownicy mogą wprowadzić adres e-mail użytkownika lub grupy, który udziela dostępu, adres URL procesu lub narzędzia, które użytkownicy muszą uzyskać dostęp, lub może wprowadzić sam proces jako tekst.
Dokumentacja Dokumentację można dostarczyć na poziomie zasobu danych. Dokumentacja zasobu to informacje tekstowe sformatowane, które mogą zawierać linki i obrazy, a także mogą udostępniać wszelkie informacje, które nie są przekazywane za pomocą opisów i tagów.

Dodawanie adnotacji do wielu zasobów

Użytkownicy mogą wybierać wiele zasobów danych w portalu usługi Data Catalog i dodawać adnotacje do wszystkich wybranych zasobów w ramach jednej operacji. Adnotacje będą stosowane do wszystkich wybranych zasobów, co ułatwia wybieranie i udostępnianie spójnego opisu oraz zestawów tagów i ekspertów dotyczących powiązanych zasobów danych.

Uwaga

Tagi i eksperci mogą również być udostępniane podczas rejestrowania zasobów danych przy użyciu narzędzia rejestracji źródła danych usługi Data Catalog.

Po wybraniu wielu tabel i widoków w portalu usługi Data Catalog będą wyświetlane tylko kolumny, które mają wszystkie wybrane zasoby danych. Dzięki temu użytkownicy mogą udostępniać tagi i opisy dla wszystkich kolumn o tej samej nazwie dla wszystkich wybranych zasobów.

Adnotacje i odnajdywanie

Podobnie jak metadane wyodrębnione ze źródła danych podczas rejestracji są dodawane do indeksu wyszukiwania usługi Data Catalog, metadane dostarczone przez użytkownika również są indeksowane. Oznacza to, że nie tylko adnotacje ułatwiają użytkownikom zrozumienie odnajdowanych danych, adnotacje ułatwiają również użytkownikom odnajdywanie zasobów danych z adnotacjami, wyszukując terminy, które mają sens.

Podsumowanie

Zarejestrowanie źródła danych w usłudze Data Catalog sprawia, że dane można odnaleźć, kopiując metadane strukturalne i opisowe ze źródła danych do usługi Catalog. Po zarejestrowaniu źródła danych użytkownicy mogą udostępniać adnotacje, aby ułatwić odnajdywanie i zrozumienie z poziomu portalu usługi Data Catalog.