Partilhar via


Requisitos para a governação de dados

A análise à escala da cloud recomenda que considere os seguintes requisitos para governar os dados:

  • Definição de entidade de dados para criar um vocabulário empresarial comum num glossário empresarial. As entidades de dados neste contexto significam conceitos como cliente, fornecedor, materiais, colaborador e outros.
  • Identificação e deteção de entidades de dados.
  • Classificação de dados para governar a segurança de acesso a dados, privacidade de dados e retenção de dados.
  • Pessoas, como proprietários de dados com responsabilidade de governação e responsáveis pela proteção e qualidade dos dados.
  • Processos de governação de dados.
  • Gestão do ciclo de vida dos dados para governar durante quanto tempo os dados devem ser mantidos
  • Políticas e regras para definir a forma como os dados específicos devem ser regidos ao longo do ciclo de vida.
  • Imposição de políticas entre arquivos de dados no panorama dos dados distribuídos.
  • Gestão de dados principal para tornar os dados consistentes. Isto pode ser em sistemas operacionais e analíticos, como cliente, produto e fornecedor.
  • Linhagem de metadados para compreender a transformação e a relação das entidades de dados.
  • Tecnologia para permitir a governação de dados estruturados, multiestruturados e não estruturados. A governação pode abranger o datacenter, várias clouds e a periferia.

Um dos desafios é que os dados estão a ser recolhidos e armazenados em vários locais da empresa. Os dados podem incluir dados recolhidos e armazenados em diferentes geografias e diferentes jurisdições legais. Como resultado, pode aplicar-se legislação diferente à governação dos mesmos dados em diferentes jurisdições. Descubra dados distribuídos por várias clouds e localizações geográficas para:

  • Compreenda que atributos de dados, entidades de dados e relações de dados existem no panorama dos dados distribuídos.
  • Classificar os dados para saber como governá-lo
  • Defina políticas para especificar a forma como os dados devem ser regidos para cada tipo de classificação de dados e gestão do ciclo de vida.
  • Impor a qualidade dos dados, a segurança de acesso a dados, a privacidade dos dados e as políticas de gestão do ciclo de vida no panorama dos dados distribuídos.

Classificação de dados

A classificação de dados é uma forma de categorizar recursos de dados ao atribuir etiquetas ou classes lógicas exclusivas aos recursos de dados. A classificação baseia-se no contexto empresarial dos dados.

Tem de haver uma forma de classificar os dados para compreender o seu nível de confidencialidade e quanto tempo os manter. A classificação requer:

  • Um esquema de classificação de confidencialidade de dados
  • Um esquema de classificação de retenção de dados

Um exemplo destes esquemas é:

Esquema de classificação de confidencialidade de dados

Classificação Descrição
Público Qualquer pessoa pode aceder aos dados e pode ser enviada para qualquer pessoa. Por exemplo, abra dados governamentais.
Utilização interna apenas Apenas os colaboradores podem aceder aos dados e não podem ser enviados para fora da empresa.
Confidencial Os dados só podem ser partilhados se forem necessários para uma tarefa específica. Os dados não podem ser enviados para fora da empresa sem um contrato de não divulgação.
Sensível (dados pessoais) Os dados contêm informações privadas, que têm de ser mascaradas e partilhadas apenas numa base de necessidade de saber durante um tempo limitado. Os dados não podem ser enviados para pessoal não autorizado ou fora da empresa.
Restrito Os dados só podem ser partilhados com indivíduos nomeados responsáveis pela sua proteção. Por exemplo, documentos legais ou segredos comerciais.

Esquema de classificação de retenção do ciclo de vida de dados

Retenção Descrição
Nenhum Os dados podem ser eliminados em qualquer altura.
Temporária Mantenha os dados durante um curto período de tempo. Por exemplo, mantenha os dados do Twitter durante uma semana.
Período fixo Mantenha os dados durante um determinado número de anos, após o qual podem ser eliminados. Por exemplo, mantenha os registos fiscais durante sete anos para cumprir as leis governamentais.
Permanente Nunca elimine dados. Por exemplo, correspondência legal.

Automatizar a confidencialidade dos dados e o processo de classificação de retenção do ciclo de vida dos dados com as classes definidas em cada esquema é necessário para etiquetar dados de forma consistente no panorama dos dados distribuídos. A automatização permitirá que seja regida de forma consistente e correta. Em seguida, defina regras e políticas para cada classe no esquema de classificação para especificar como governar os dados de acordo com a respetiva classificação.

Funções e responsabilidades de governação de dados

Outro requisito é a necessidade de prestação de contas. Caso contrário, a confusão permanece sobre quem é responsável pela governação dos dados. Se não houver responsabilidade, como responde às seguintes perguntas?

  • Quem define as métricas de sucesso e monitoriza o funcionamento do programa de governação de dados?
  • Quem são os proprietários de dados?
  • Quem define e mantém um glossário empresarial?
  • Quem cria e mantém políticas de segurança de acesso?
  • Quem está a proteger a privacidade dos dados pessoais para conformidade?
  • Quem está a cuidar da qualidade dos dados do produto em todas as brochuras e sites de parceiros?
  • Quem garante que os dados dos clientes são consistentes em todos os sistemas?
  • Quem está a policiar a utilização de dados de subscrição externa versus a licença?
  • Quem está a policiar utilizadores privilegiados, como administradores de bases de dados e cientistas de dados?

É um executivo de nível C? É um chefe de departamento? É o responsável pela governação, risco e conformidade? E o departamento jurídico? Ou é da responsabilidade das TI? São necessárias funções e responsabilidades para evitar confusões e definir as bases sobre as quais uma cultura de dados se pode materializar.

Processos de governação de dados

São necessários processos, juntamente com funções e responsabilidades para:

  • Governar a definição e manutenção de um vocabulário empresarial comum
  • Descubra e identifique os dados que tem, o que significa e onde estão armazenados
  • Classificar dados para saber como governá-lo
  • Governar a definição e manutenção das políticas de segurança de acesso a dados
  • Governar a definição e manutenção das políticas de privacidade de dados
  • Detetar problemas de qualidade de dados e remediar os mesmos
  • Aplicar políticas para garantir que são tomadas medidas para a conformidade
  • Reger a manutenção dos dados principais

Políticas e regras de governação de dados

Definir políticas e regras para governar:

  • Regras de integridade de dados
  • Políticas e regras de ingestão de dados
  • Políticas e regras de segurança de acesso a dados
  • Políticas e regras de privacidade de dados
  • Políticas e regras de qualidade de dados
  • Políticas e regras de manutenção de dados
  • Políticas e regras de retenção de dados

Associe estas políticas e regras a cada classe nos esquemas de classificação de governação de dados.

Gestão de dados principais

Outro requisito na governação de dados é a gestão de dados principais. Os dados principais são os dados partilhados mais amplamente em qualquer organização e incluem entidades de dados principais. As entidades de dados principais incluem clientes, fornecedores, materiais, funcionários e recursos. Também inclui um gráfico financeiro de dados de contas que se encontra em diferentes aplicações financeiras. Uma vez que os dados principais são amplamente partilhados, são agnósticos à aplicação. É necessário para aplicações de processamento de transações operacionais e sistemas analíticos. Manter estes dados sincronizados pode resolver tantos erros de dados e processar erros. Assim, mantê-lo centralmente através de um processo comum e sincronizar todos os sistemas que precisam dele, é a situação ideal. Além disso, a governação é necessária sobre quem está autorizado a mantê-la e onde essa manutenção tem de acontecer.

O mesmo se aplica aos dados de referência, como conjuntos de código e dados de mercados financeiros. Neste caso, a uniformização e sincronização de conjuntos de código é conhecida como gestão de dados de referência, o que também é um requisito.

Linhagem de metadados

Por fim, existe um requisito para a linhagem de metadados. Pode utilizar um registo de auditoria para saber a origem dos dados e como foram transformados a caminho de um relatório ou arquivo de dados. Pode utilizar metadados para rastrear quem ou o que está a manter os dados, incluindo quando e onde ocorrem.

Resumo do que é necessário para a governação de dados ponto a ponto

Precisa de uma solução ponto a ponto que possa governar os dados ao longo do ciclo de vida nos arquivos de dados no edge, em várias clouds e no datacenter.

Diagrama da arquitetura de governação de dados.

A solução de governação de dados deve ter vários componentes:

  • Uma visão e estratégia de governação de dados
  • Os dados propriamente ditos, tais como dados do cliente, dados do fornecedor, dados de encomendas e outros.
  • O ciclo de vida dos dados desde a criação até à destruição em que os dados têm de ser regidos.
  • Funções e responsabilidades de governação de dados (pessoas).
  • Processos e atividades de governação de dados e como se aplicam ao ciclo de vida dos dados.
  • Políticas e regras para governar dados em diferentes pontos do ciclo de vida.
  • Tecnologias de governação de dados para ajudar a tornar a governação de dados possível.

Passos seguintes