Udostępnij za pośrednictwem


Wymagania dotyczące zarządzania danymi

Analiza w skali chmury zaleca uwzględnienie następujących wymagań dotyczących zarządzania danymi:

  • Definicja jednostki danych w celu utworzenia wspólnego słownictwa biznesowego w słowniku biznesowym. Jednostki danych w tym kontekście oznaczają pojęcia, takie jak klient, dostawca, materiały, pracownik i inne.
  • Identyfikacja i odnajdywanie jednostek danych.
  • Klasyfikacja danych w celu zarządzania zabezpieczeniami dostępu do danych, prywatnością danych i przechowywaniem danych.
  • Osoby, podobnie jak właściciele danych z odpowiedzialność za ład i stewardzy danych odpowiedzialni za ochronę danych i jakość.
  • Procesy nadzoru nad danymi.
  • Zarządzanie cyklem życia danych w celu zarządzania tym, jak długo powinny być przechowywane dane
  • Zasady i reguły definiujące, jak konkretne dane powinny być zarządzane w całym cyklu życia.
  • Wymuszanie zasad w magazynach danych w rozproszonym środowisku danych.
  • Zarządzanie danymi głównymi w celu zapewnienia spójności danych. Może to być między systemami operacyjnymi i analitycznymi, takimi jak klient, produkt i dostawca.
  • Pochodzenie metadanych w celu zrozumienia transformacji i relacji jednostek danych.
  • Technologia umożliwiająca zarządzanie danymi ustrukturyzowanymi, wieloustrukturyzowanymi i bez struktury. Nadzór może obejmować całe centrum danych, wiele chmur i brzeg.

Jednym z wyzwań jest to, że dane są zbierane i przechowywane w wielu miejscach w przedsiębiorstwie. Dane mogą obejmować dane zebrane i przechowywane w różnych lokalizacjach geograficznych oraz w różnych jurysdykcjach prawnych. W związku z tym różne przepisy mogą mieć zastosowanie do zarządzania tymi samymi danymi w różnych jurysdykcjach. Odnajdywanie danych rozproszonych w wielu chmurach i lokalizacjach geograficznych w celu:

  • Dowiedz się, jakie atrybuty danych, jednostki danych i relacje danych istnieją w rozproszonym krajobrazie danych.
  • Klasyfikowanie danych, aby wiedzieć, jak je zarządzać
  • Zdefiniuj zasady, aby określić sposób zarządzania danymi dla każdego typu klasyfikacji danych i zarządzania cyklem życia.
  • Wymuszanie jakości danych, zabezpieczeń dostępu do danych, prywatności danych i zasad zarządzania cyklem życia w całym rozproszonym krajobrazie danych.

Klasyfikacja danych

Klasyfikacja danych to sposób kategoryzowania zasobów danych przez przypisanie unikatowych tagów logicznych lub klas do zasobów danych. Klasyfikacja jest oparta na kontekście biznesowym danych.

Musi istnieć sposób klasyfikowania danych, aby zrozumieć ich poziom poufności i jak długo je zachować. Klasyfikacja wymaga:

  • Schemat klasyfikacji poufności danych
  • Schemat klasyfikacji przechowywania danych

Przykładem tych schematów jest:

Schemat klasyfikacji poufności danych

Klasyfikacja Opis
Publiczne Każda osoba może uzyskać dostęp do danych i może zostać wysłana do wszystkich osób. Na przykład otwórz dane dla instytucji rządowych.
Tylko do użytku wewnętrznego Tylko pracownicy mogą uzyskiwać dostęp do danych i nie mogą być wysyłane poza firmę.
Poufne Dane mogą być udostępniane tylko wtedy, gdy są potrzebne do wykonania określonego zadania. Nie można wysyłać danych poza firmę bez umowy o zachowaniu poufności.
Poufne (dane osobowe) Dane zawierają informacje prywatne, które muszą być maskowane i udostępniane tylko w oparciu o potrzebę znajomości przez ograniczony czas. Nie można wysyłać danych do nieautoryzowanego personelu ani spoza firmy.
Z ograniczeniami Dane mogą być udostępniane tylko nazwanym osobom odpowiedzialnym za ich ochronę. Na przykład dokumenty prawne lub tajemnice handlowe.

Schemat klasyfikacji przechowywania cyklu życia danych

Przechowywanie Opis
Brak Dane można usuwać w dowolnym momencie.
Tymczasowe Przechowywanie danych przez krótki czas. Na przykład przechowuj dane w serwisie Twitter przez tydzień.
Stały okres Zachowaj dane przez określoną liczbę lat, po których można je usunąć. Na przykład przechowywanie rejestrów podatkowych przez siedem lat w celu zachowania zgodności z przepisami rządowymi.
Stale Nigdy nie usuwaj danych. Na przykład korespondencja prawna.

Automatyzacja procesu klasyfikacji poufności danych i przechowywania cyklu życia danych przy użyciu klas zdefiniowanych w każdym schemacie jest wymagana do spójnego etykietowania danych w rozproszonym krajobrazie danych. Automatyzacja umożliwi jej spójne i poprawne uregulowanie. Następnie zdefiniuj reguły i zasady dla każdej klasy w schemacie klasyfikacji, aby określić sposób zarządzania danymi zgodnie z klasyfikacją.

Role i obowiązki związane z ładem danych

Innym wymaganiem jest potrzeba odpowiedzialności. W przeciwnym razie zamieszanie pozostaje w odniesieniu do tego, kto jest odpowiedzialny za zarządzanie danymi. Jeśli nie ma odpowiedzialności, jak odpowiedzieć na następujące pytania?

  • Kto ustawia metryki sukcesu i monitoruje, jak dobrze działa program ładu danych?
  • Kim są właściciele danych?
  • Kto definiuje i utrzymuje słownik biznesowy?
  • Kto tworzy i utrzymuje zasady dotyczące zabezpieczeń dostępu?
  • Kto chroni prywatność danych osobowych pod kątem zgodności?
  • Kto dba o jakość danych o produktach we wszystkich broszurach i witrynach partnerskich?
  • Kto zapewnia spójność danych klientów we wszystkich systemach?
  • Kto jest policją użycia danych subskrypcji zewnętrznej w porównaniu z licencją?
  • Kim są uprzywilejowani użytkownicy policji, tacy jak administratorzy baz danych i analitycy danych?

Czy jest to kadra kierownicza na poziomie C? Czy jest to szef działu? Czy jest to szef zarządzania, ryzyka i zgodności? A co z działem prawnym? Czy jest to odpowiedzialność IT? Role i obowiązki są potrzebne, aby uniknąć pomyłek i ustawić podstawy, na których kultura danych może zmaterializować.

Procesy nadzoru nad danymi

Procesy są potrzebne wraz z rolami i obowiązkami:

  • Nadzorowanie definicji i utrzymania wspólnego słownictwa biznesowego
  • Odnajdywanie i identyfikowanie posiadanych danych, ich znaczenie i miejsce ich przechowywania
  • Klasyfikowanie danych w celu poznania sposobu zarządzania nim
  • Zarządzanie definicją i konserwacją zasad zabezpieczeń dostępu do danych
  • Zarządzanie definicją i konserwacją zasad ochrony prywatności danych
  • Wykrywanie problemów z jakością danych i ich korygowanie
  • Stosowanie zasad w celu zapewnienia zgodności akcji
  • Zarządzanie konserwacją danych głównych

Zasady i reguły ładu danych

Definiowanie zasad i reguł do zarządzania:

  • Reguły integralności danych
  • Zasady i reguły pozyskiwania danych
  • Zasady i reguły zabezpieczeń dostępu do danych
  • Zasady i reguły dotyczące prywatności danych
  • Zasady i reguły dotyczące jakości danych
  • Zasady i reguły konserwacji danych
  • Zasady i reguły przechowywania danych

Skojarz te zasady i reguły z każdą klasą w schematach klasyfikacji ładu danych.

Zarządzanie danymi głównymi

Innym wymaganiem w zarządzaniu danymi jest zarządzanie danymi głównymi. Dane główne są najczęściej udostępnianymi danymi w dowolnej organizacji i zawierają podstawowe jednostki danych. Podstawowe jednostki danych obejmują klienta, dostawcę, materiały, pracownika i zasób. Zawiera również wykres finansowy danych dotyczących kont znalezionych w różnych aplikacjach finansowych. Ponieważ dane główne są tak szeroko udostępniane, są niezależne od aplikacji. Jest on wymagany zarówno przez operacyjne aplikacje przetwarzania transakcji, jak i systemy analityczne. Synchronizowanie tych danych może rozwiązać tak wiele błędów danych i błędów przetwarzania. Dlatego utrzymanie go centralnie za pośrednictwem wspólnego procesu i synchronizowanie każdego systemu, który go potrzebuje, jest idealną sytuacją. Ponadto konieczne jest zapewnienie ładu w zakresie tego, kto może go utrzymywać i gdzie taka konserwacja musi się zdarzyć.

Dotyczy to danych referencyjnych, takich jak zestawy kodu i dane rynków finansowych. W takim przypadku standaryzacja i synchronizacja zestawów kodu jest nazywana zarządzaniem danymi referencyjnymi, co jest również wymaganiem.

Pochodzenie metadanych

Na koniec istnieje wymóg pochodzenia metadanych. Możesz użyć dziennika inspekcji, aby dowiedzieć się, skąd pochodzą dane i jak zostały przekształcone na trasie do raportu lub magazynu danych. Możesz użyć metadanych do śledzenia, kto lub co utrzymuje dane, w tym kiedy i gdzie się dzieje.

Podsumowanie tego, co jest potrzebne w celu zapewnienia kompleksowego ładu w zakresie danych

Potrzebujesz kompleksowego rozwiązania, które może zarządzać danymi w całym cyklu życia w magazynach danych na brzegu, w wielu chmurach i centrum danych.

Diagram struktury ładu danych.

Rozwiązanie do zapewniania ładu danych powinno mieć kilka składników:

  • Wizja i strategia zapewniania ładu danych
  • Same dane, takie jak dane klienta, dane dostawcy, dane zamówienia i inne.
  • Cykl życia danych od utworzenia do zniszczenia, w którym dane muszą być zarządzane.
  • Role i obowiązki związane z zarządzaniem danymi (osoby).
  • Procesy i działania związane z zarządzaniem danymi oraz sposób ich stosowania do cyklu życia danych.
  • Zasady i reguły do zarządzania danymi w różnych punktach cyklu życia.
  • Technologie zapewniania ładu danych, które ułatwiają zapewnienie ładu danych.

Następne kroki