Partilhar via


Gestão do ciclo de vida dos dados

A gestão do ciclo de vida dos dados é a prática de utilizar determinadas políticas para gerir dados de forma eficaz durante todo o tempo em que existe no seu sistema. Estas políticas devem consistir em políticas de armazenamento e dados abrangentes que impulsionam os seus processos de gestão de dados. Uma vez que os objetivos empresariais e os controladores ditam as políticas de gestão do ciclo de vida dos dados, geralmente associam-se a um quadro de contratos globais de governação e gestão de TI e de nível de serviço (SLAs).

Assim que souber que tipo de dados tem e como serão utilizados, já sabe a evolução e o destino mais prováveis. Tem de compreender como os seus dados evoluem, determinar como estes crescem, monitorizar as alterações na sua utilização ao longo do tempo, decidir quanto tempo devem existir e cumprir todas as regras e regulamentos aplicáveis a esses dados.

A gestão do ciclo de vida de dados aborda estas necessidades através de uma combinação de processos, políticas e software para que as suas equipas possam utilizar a tecnologia adequada para cada fase do ciclo de vida dos seus dados.

Ciclo de vida dos dados

Os produtos de dados podem ter ciclos de vida diferentes. Num padrão de ciclo de vida típico, os dados recentemente ingeridos são utilizados e acedidos frequentemente. À medida que a idade aumenta, a sua taxa de acesso diminui frequentemente e os dados mais antigos vêem uma queda drástica na utilização.

No entanto, os ciclos de vida dos dados podem ser diferentes deste padrão típico. Alguns dados permanecem não utilizados após a ingestão inicial ou raramente são acedidos depois de serem armazenados. Alguns produtos de dados podem expirar dias ou meses após a criação, enquanto outros produtos de dados são ativamente utilizados e modificados ao longo de toda a duração.

A maioria dos locais tem regulamentos que ditam durante quanto tempo é necessário armazenar dados, como dados pessoais e dados contabilísticos. Um país/região específico pode exigir que mantenha a documentação primária cinco anos para dados como faturas recebidas e enviadas, saldos de livros monetários, vouchers bancários e recibos salariais. Também pode exigir que a documentação secundária seja mantida durante três a cinco anos, o que inclui coisas como cartas, contratos e notas.

Gerir ciclos de vida de dados

Existem duas formas de abordar a gestão do ciclo de vida dos dados na análise à escala da cloud.

  • Pode utilizar as funcionalidades de ciclo de vida de dados incorporadas de cada serviço do Azure que contenham dados persistentes, como o Data Lake do Azure. Este método é bom para mover dados para camadas frias e de arquivo, mas não consegue garantir que os dados são eliminados após um período de tempo especificado.

Importante

A camada de arquivo não é atualmente suportada para contas de armazenamento com redundância entre zonas. Para obter mais informações, veja Redundância de dados.

  • Pode integrar o ciclo de vida dos dados num processo de inclusão, o que dá aos proprietários de empresas da aplicação a oportunidade de definirem a política de ciclo de vida dos dados. Este processo envolve uma aplicação personalizada para capturar as principais métricas em padrões de metadados para cada produto de dados. Parte deste método envolve mover dados de frequente para frio para arquivo e garante a eliminação de dados após um período de tempo especificado.

Passos seguintes