Dela via


Datalivscykelhantering

Datalivscykelhantering är att använda vissa principer för att effektivt hantera data under hela den tid de finns i systemet. Dessa principer bör bestå av övergripande lagrings- och dataprinciper som driver dina datahanteringsprocesser. Eftersom affärsmål och drivrutiner dikterar principer för datalivscykelhantering är de vanligtvis knutna till ett ramverk för övergripande IT-styrning och hanterings- och serviceavtal (SLA).

När du vet vilken typ av data du har och hur de kommer att användas vet du redan dess mest sannolika utveckling och öde. Du behöver förstå hur dina data utvecklas, bestämma hur de växer, övervaka ändringar i användningen över tid, bestämma hur länge de ska finnas och följa alla regler och regler som gäller för dessa data.

Datalivscykelhantering tillgodoser dessa behov med hjälp av en kombination av processer, principer och programvara så att dina team kan använda lämplig teknik för varje fas av dina datas livscykel.

Livscykel för data

Dataprodukter kan ha olika livscykeler. I ett typiskt livscykelmönster används och används nyligen inmatade data ofta. I takt med att dess ålder ökar minskar ofta åtkomstfrekvensen och äldre data ser en drastisk minskning av användningen.

Datalivscykler kan dock skilja sig från det här typiska mönstret. Vissa data förblir oanvända efter den första inmatningen eller används sällan när de har lagrats. Vissa dataprodukter kan upphöra att gälla dagar eller månader efter att de har skapats, medan andra dataprodukter används och ändras aktivt under hela livslängden.

De flesta platser har regler som avgör hur länge du måste lagra data, till exempel personliga data och redovisningsdata. Ett visst land/en viss region kan kräva att du behåller den primära dokumentationen fem år för data som inkommande och utgående fakturor, saldon för kontantbok, bankkuponger och lönebesked. Det kan också kräva att sekundär dokumentation bevaras i tre till fem år, vilket inkluderar saker som brev, avtal och anteckningar.

Hantera datalivscykler

Det finns två sätt att hantera datalivscykeln i analys i molnskala.

  • Du kan använda inbyggda datalivscykelfunktioner i varje Azure-tjänst som innehåller sparade data, till exempel Azure Data Lake. Den här metoden är bra för att flytta data till köld- och arkivnivåer, men det går inte att se till att data tas bort efter en angiven tidsperiod.

Viktigt

Arkivnivån stöds för närvarande inte för zonredundanta lagringskonton. Mer information finns i dataredundans.

  • Du kan integrera datalivscykeln i en registreringsprocess, vilket ger programföretagsägare möjlighet att definiera sin policy för datalivscykel. Den här processen omfattar ett anpassat program för att samla in viktiga mått i metadatastandarder för varje dataprodukt. En del av den här metoden handlar om att flytta data från frekvent till kall till arkivering och säkerställer borttagning av data efter en angiven tidsperiod.

Nästa steg