Condividi tramite


Gestione del ciclo di vita dei dati

La gestione del ciclo di vita dei dati è la pratica dell'uso di determinati criteri per gestire efficacemente i dati per l'intera durata del sistema. Questi criteri devono essere costituiti da criteri di archiviazione e dati che determinano i processi di gestione dei dati. Poiché gli obiettivi aziendali e i driver determinano i criteri di gestione del ciclo di vita dei dati, in genere si associano a un framework di governance e gestione IT generali e contratti di servizio.

Una volta che si conosce il tipo di dati disponibili e come verranno usati, si conosce già la sua evoluzione e il destino più probabili. È necessario comprendere l'evoluzione dei dati, determinare in che modo cresce, monitorare le modifiche nell'utilizzo nel tempo, decidere per quanto tempo deve esistere e rispettare tutte le regole e le normative applicabili a tali dati.

La gestione del ciclo di vita dei dati soddisfa queste esigenze usando una combinazione di processi, criteri e software in modo che i team possano usare la tecnologia appropriata per ogni fase del ciclo di vita dei dati.

Ciclo di vita dei dati

I prodotti dati possono avere cicli di vita diversi. In un modello tipico del ciclo di vita, i dati appena inseriti vengono usati e a cui si accede spesso. Con l'aumentare dell'età, il tasso di accesso diminuisce spesso e i dati meno recenti vedono un calo drastico dell'utilizzo.

I cicli di vita dei dati possono tuttavia differire da questo modello tipico. Alcuni dati rimangono inutilizzati dopo l'inserimento iniziale o a cui si accede raramente dopo l'archiviazione. Alcuni prodotti dati potrebbero scadere giorni o mesi dopo la loro creazione, mentre altri prodotti dati vengono usati e modificati attivamente nell'intera durata.

La maggior parte delle posizioni ha normative che determinano per quanto tempo è necessario archiviare i dati, ad esempio i dati personali e i dati contabili. Un paese o un'area geografica specifica potrebbe richiedere di conservare la documentazione primaria cinque anni per dati quali fatture in ingresso e in uscita, saldi del libro di cassa, buoni bancari e lista di stipendio. Potrebbe anche essere necessario conservare la documentazione secondaria per tre o cinque anni, che include elementi come lettere, accordi e note.

Gestione dei cicli di vita dei dati

Esistono due modi per affrontare la gestione del ciclo di vita dei dati nell'analisi su scala cloud.

  • È possibile usare le funzionalità predefinite del ciclo di vita dei dati di ogni servizio di Azure contenente dati persistenti, ad esempio Azure Data Lake. Questo metodo è utile per lo spostamento dei dati a livelli ad accesso sporadico e archivio, ma non garantisce che i dati vengano eliminati dopo un periodo di tempo specificato.

Importante

Il livello di archiviazione non è attualmente supportato per gli account di archiviazione con ridondanza della zona. Per altre informazioni, vedere Ridondanza dei dati.

  • È possibile integrare il ciclo di vita dei dati in un processo di onboarding, che consente ai proprietari aziendali di applicazioni di definire i criteri relativi al ciclo di vita dei dati. Questo processo prevede un'applicazione personalizzata per acquisire le metriche chiave in standard di metadati per ogni prodotto dati. Parte di questo metodo prevede lo spostamento dei dati da accesso frequente a accesso sporadico all'archivio e garantisce l'eliminazione dei dati dopo un periodo di tempo specificato.

Passaggi successivi