Share via


Administración del ciclo de vida de los datos

La administración del ciclo de vida de los datos es la práctica de usar determinadas directivas para administrar de forma eficaz los datos durante todo el tiempo que existe en el sistema. Estas directivas deben constar de directivas generales de datos y almacenamiento que impulsen los procesos de administración de datos. Dado que los objetivos empresariales y los controladores dictan las directivas de administración del ciclo de vida de los datos, normalmente se vinculan a un marco de acuerdos generales de administración y administración de TI y de nivel de servicio (SLA).

Una vez que sepa qué tipo de datos tiene y cómo se usará, podrá conocer su evolución y destino más probables. Necesita comprender cómo evolucionan los datos, determinar cómo crecen, supervisar los cambios en su uso a lo largo del tiempo, decidir cuánto tiempo deben existir, y cumplir todas las reglas y regulaciones que se aplican a esos datos.

La administración del ciclo de vida de los datos aborda estas necesidades mediante una combinación de procesos, directivas y software para que los equipos puedan usar la tecnología adecuada para cada fase del ciclo de vida de los datos.

Ciclo de vida de los datos

Los productos de datos pueden tener ciclos de vida diferentes. En un patrón de ciclo de vida típico, los datos recién ingeridos se usan y se accede a ellos a menudo. A medida que aumenta su edad, su tasa de acceso disminuye y se ve una reducción drástica del uso de los datos más antiguos.

Sin embargo, los ciclos de vida de los datos pueden diferir de este patrón típico. Algunos datos permanecen sin usar tras la ingesta inicial o rara vez se accede a estos una vez almacenados. Algunos productos de datos pueden expirar días o meses después de su creación, mientras que otros productos de datos se usan y modifican activamente durante toda su duración.

La mayoría de los lugares tienen regulaciones que determinan el tiempo necesario para almacenar datos, como datos personales y datos de contabilidad. Un país o región determinado puede requerir que conserve la documentación principal durante cinco años para los datos, por ejemplo, facturas entrantes y salientes, saldos del libro de caja, justificantes bancarios y nóminas. También puede requerir que la documentación secundaria se conserve durante tres a cinco años, lo que incluye cosas como cartas, acuerdos y notas.

Administración de los ciclos de vida de los datos

Hay dos maneras de abordar la administración del ciclo de vida de los datos en el análisis a escala de la nube.

  • Puede usar las características integradas del ciclo de vida de los datos de cada servicio de Azure que contiene datos persistentes, como Azure Data Lake. Este método es adecuado para mover datos que se utilizan con poca frecuencia y a nivel de archivo, pero no puede asegurarse de que los datos se eliminan después de una cantidad de tiempo especificada.

Importante

El nivel de archivo no se admite actualmente para las cuentas de almacenamiento con redundancia de zona. Para más información, consulte redundancia de datos.

  • Puede integrar el ciclo de vida de los datos en un proceso de incorporación, lo que ofrece a los propietarios empresariales de aplicaciones la oportunidad de definir su directiva de ciclo de vida de los datos. Este proceso implica una aplicación personalizada para capturar métricas clave en estándares de metadatos para cada producto de datos. Parte de este método implica mover datos de uso frecuente a uso poco frecuente a archivo y garantiza la eliminación de datos después de una cantidad de tiempo especificada.

Pasos siguientes