Udostępnij za pośrednictwem


Zarządzanie cyklem życia danych

Zarządzanie cyklem życia danych to praktyka korzystania z określonych zasad w celu efektywnego zarządzania danymi przez cały czas, w jaki istnieje w systemie. Te zasady powinny składać się z nadrzędnego magazynu i zasad danych, które napędzają procesy zarządzania danymi. Ponieważ cele biznesowe i czynniki dyktują zasady zarządzania cyklem życia danych, zazwyczaj wiążą się one ze strukturą ogólnych umów dotyczących ładu i zarządzania it oraz poziomu usług (SLA).

Gdy wiesz, jaki typ posiadanych danych i jak będzie używany, wiesz już, że jego najbardziej prawdopodobna ewolucja i przeznaczenie. Musisz zrozumieć, w jaki sposób dane ewoluują, określić, jak rosną, monitorować zmiany użycia w czasie, decydować, jak długo powinny istnieć, i przestrzegać wszystkich reguł i przepisów mających zastosowanie do tych danych.

Zarządzanie cyklem życia danych odpowiada tym potrzebom przy użyciu kombinacji procesów, zasad i oprogramowania, dzięki czemu zespoły mogą korzystać z odpowiedniej technologii dla każdej fazy cyklu życia danych.

Cykl życia danych

Produkty danych mogą mieć różne cykle życia. W typowym wzorcu cyklu życia nowo pozyskane dane są często używane i używane. Wraz ze wzrostem wieku szybkość dostępu często się zmniejsza, a starsze dane widzą drastyczny spadek użycia.

Cykle życia danych mogą jednak różnić się od tego typowego wzorca. Niektóre dane pozostają nieużywane po początkowym pozyskiwaniu lub rzadko są dostępne po ich przechowywaniu. Niektóre produkty danych mogą wygasać dni lub miesiące po ich utworzeniu, podczas gdy inne produkty danych są aktywnie używane i modyfikowane przez całe ich okresy istnienia.

Większość miejsc ma przepisy, które określają, jak długo są wymagane do przechowywania danych, takich jak dane osobowe i dane księgowe. Określony kraj/region może wymagać zachowania podstawowej dokumentacji pięć lat na dane, takie jak faktury przychodzące i wychodzące, salda gotówki, bony bankowe i poślizgi wynagrodzenia. Może również wymagać przechowywania dodatkowej dokumentacji przez trzy do pięciu lat, w tym rzeczy, takie jak listy, umowy i notatki.

Zarządzanie cyklami życia danych

Istnieją dwa sposoby podejścia do zarządzania cyklem życia danych w analizie w skali chmury.

  • Możesz użyć wbudowanych funkcji cyklu życia danych każdej usługi platformy Azure zawierającej utrwalone dane, takie jak usługa Azure Data Lake. Ta metoda jest dobra do przenoszenia danych do warstw zimnych i archiwalnych, ale nie zapewnia usunięcia danych po upływie określonego czasu.

Ważne

Warstwa archiwum nie jest obecnie obsługiwana dla kont magazynu strefowo nadmiarowego. Aby uzyskać więcej informacji, zobacz nadmiarowość danych.

  • Cykl życia danych można zintegrować w procesie dołączania, co daje właścicielom aplikacji możliwość definiowania zasad cyklu życia danych. Ten proces obejmuje niestandardową aplikację do przechwytywania kluczowych metryk do standardów metadanych dla każdego produktu danych. Część tej metody polega na przeniesieniu danych z gorącej do zimnej do archiwum i zapewnia usunięcie danych po upływie określonego czasu.

Następne kroki