Requisitos para a governação de dados
A análise à escala da cloud recomenda que considere os seguintes requisitos para governar os dados:
- Definição de entidade de dados para criar um vocabulário empresarial comum num glossário empresarial. As entidades de dados neste contexto significam conceitos como cliente, fornecedor, materiais, colaborador e outros.
- Identificação e deteção de entidades de dados.
- Classificação de dados para governar a segurança de acesso a dados, privacidade de dados e retenção de dados.
- Pessoas, como proprietários de dados com responsabilidade de governação e responsáveis pela proteção e qualidade dos dados.
- Processos de governação de dados.
- Gestão do ciclo de vida dos dados para governar durante quanto tempo os dados devem ser mantidos
- Políticas e regras para definir a forma como os dados específicos devem ser regidos ao longo do ciclo de vida.
- Imposição de políticas entre arquivos de dados no panorama dos dados distribuídos.
- Gestão de dados principal para tornar os dados consistentes. Isto pode ser em sistemas operacionais e analíticos, como cliente, produto e fornecedor.
- Linhagem de metadados para compreender a transformação e a relação das entidades de dados.
- Tecnologia para permitir a governação de dados estruturados, multiestruturados e não estruturados. A governação pode abranger o datacenter, várias clouds e a periferia.
Um dos desafios é que os dados estão a ser recolhidos e armazenados em vários locais da empresa. Os dados podem incluir dados recolhidos e armazenados em diferentes geografias e diferentes jurisdições legais. Como resultado, pode aplicar-se legislação diferente à governação dos mesmos dados em diferentes jurisdições. Descubra dados distribuídos por várias clouds e localizações geográficas para:
- Compreenda que atributos de dados, entidades de dados e relações de dados existem no panorama dos dados distribuídos.
- Classificar os dados para saber como governá-lo
- Defina políticas para especificar a forma como os dados devem ser regidos para cada tipo de classificação de dados e gestão do ciclo de vida.
- Impor a qualidade dos dados, a segurança de acesso a dados, a privacidade dos dados e as políticas de gestão do ciclo de vida no panorama dos dados distribuídos.
Classificação de dados
A classificação de dados é uma forma de categorizar recursos de dados ao atribuir etiquetas ou classes lógicas exclusivas aos recursos de dados. A classificação baseia-se no contexto empresarial dos dados.
Tem de haver uma forma de classificar os dados para compreender o seu nível de confidencialidade e quanto tempo os manter. A classificação requer:
- Um esquema de classificação de confidencialidade de dados
- Um esquema de classificação de retenção de dados
Um exemplo destes esquemas é:
Esquema de classificação de confidencialidade de dados
Classificação | Descrição |
---|---|
Público | Qualquer pessoa pode aceder aos dados e pode ser enviada para qualquer pessoa. Por exemplo, abra dados governamentais. |
Utilização interna apenas | Apenas os colaboradores podem aceder aos dados e não podem ser enviados para fora da empresa. |
Confidencial | Os dados só podem ser partilhados se forem necessários para uma tarefa específica. Os dados não podem ser enviados para fora da empresa sem um contrato de não divulgação. |
Sensível (dados pessoais) | Os dados contêm informações privadas, que têm de ser mascaradas e partilhadas apenas numa base de necessidade de saber durante um tempo limitado. Os dados não podem ser enviados para pessoal não autorizado ou fora da empresa. |
Restrito | Os dados só podem ser partilhados com indivíduos nomeados responsáveis pela sua proteção. Por exemplo, documentos legais ou segredos comerciais. |
Esquema de classificação de retenção do ciclo de vida de dados
Retenção | Descrição |
---|---|
Nenhum | Os dados podem ser eliminados em qualquer altura. |
Temporária | Mantenha os dados durante um curto período de tempo. Por exemplo, mantenha os dados do Twitter durante uma semana. |
Período fixo | Mantenha os dados durante um determinado número de anos, após o qual podem ser eliminados. Por exemplo, mantenha os registos fiscais durante sete anos para cumprir as leis governamentais. |
Permanente | Nunca elimine dados. Por exemplo, correspondência legal. |
Automatizar a confidencialidade dos dados e o processo de classificação de retenção do ciclo de vida dos dados com as classes definidas em cada esquema é necessário para etiquetar dados de forma consistente no panorama dos dados distribuídos. A automatização permitirá que seja regida de forma consistente e correta. Em seguida, defina regras e políticas para cada classe no esquema de classificação para especificar como governar os dados de acordo com a respetiva classificação.
Funções e responsabilidades de governação de dados
Outro requisito é a necessidade de prestação de contas. Caso contrário, a confusão permanece sobre quem é responsável pela governação dos dados. Se não houver responsabilidade, como responde às seguintes perguntas?
- Quem define as métricas de sucesso e monitoriza o funcionamento do programa de governação de dados?
- Quem são os proprietários de dados?
- Quem define e mantém um glossário empresarial?
- Quem cria e mantém políticas de segurança de acesso?
- Quem está a proteger a privacidade dos dados pessoais para conformidade?
- Quem está a cuidar da qualidade dos dados do produto em todas as brochuras e sites de parceiros?
- Quem garante que os dados dos clientes são consistentes em todos os sistemas?
- Quem está a policiar a utilização de dados de subscrição externa versus a licença?
- Quem está a policiar utilizadores privilegiados, como administradores de bases de dados e cientistas de dados?
É um executivo de nível C? É um chefe de departamento? É o responsável pela governação, risco e conformidade? E o departamento jurídico? Ou é da responsabilidade das TI? São necessárias funções e responsabilidades para evitar confusões e definir as bases sobre as quais uma cultura de dados se pode materializar.
Processos de governação de dados
São necessários processos, juntamente com funções e responsabilidades para:
- Governar a definição e manutenção de um vocabulário empresarial comum
- Descubra e identifique os dados que tem, o que significa e onde estão armazenados
- Classificar dados para saber como governá-lo
- Governar a definição e manutenção das políticas de segurança de acesso a dados
- Governar a definição e manutenção das políticas de privacidade de dados
- Detetar problemas de qualidade de dados e remediar os mesmos
- Aplicar políticas para garantir que são tomadas medidas para a conformidade
- Reger a manutenção dos dados principais
Políticas e regras de governação de dados
Definir políticas e regras para governar:
- Regras de integridade de dados
- Políticas e regras de ingestão de dados
- Políticas e regras de segurança de acesso a dados
- Políticas e regras de privacidade de dados
- Políticas e regras de qualidade de dados
- Políticas e regras de manutenção de dados
- Políticas e regras de retenção de dados
Associe estas políticas e regras a cada classe nos esquemas de classificação de governação de dados.
Gestão de dados principais
Outro requisito na governação de dados é a gestão de dados principais. Os dados principais são os dados partilhados mais amplamente em qualquer organização e incluem entidades de dados principais. As entidades de dados principais incluem clientes, fornecedores, materiais, funcionários e recursos. Também inclui um gráfico financeiro de dados de contas que se encontra em diferentes aplicações financeiras. Uma vez que os dados principais são amplamente partilhados, são agnósticos à aplicação. É necessário para aplicações de processamento de transações operacionais e sistemas analíticos. Manter estes dados sincronizados pode resolver tantos erros de dados e processar erros. Assim, mantê-lo centralmente através de um processo comum e sincronizar todos os sistemas que precisam dele, é a situação ideal. Além disso, a governação é necessária sobre quem está autorizado a mantê-la e onde essa manutenção tem de acontecer.
O mesmo se aplica aos dados de referência, como conjuntos de código e dados de mercados financeiros. Neste caso, a uniformização e sincronização de conjuntos de código é conhecida como gestão de dados de referência, o que também é um requisito.
Linhagem de metadados
Por fim, existe um requisito para a linhagem de metadados. Pode utilizar um registo de auditoria para saber a origem dos dados e como foram transformados a caminho de um relatório ou arquivo de dados. Pode utilizar metadados para rastrear quem ou o que está a manter os dados, incluindo quando e onde ocorrem.
Resumo do que é necessário para a governação de dados ponto a ponto
Precisa de uma solução ponto a ponto que possa governar os dados ao longo do ciclo de vida nos arquivos de dados no edge, em várias clouds e no datacenter.
A solução de governação de dados deve ter vários componentes:
- Uma visão e estratégia de governação de dados
- Os dados propriamente ditos, tais como dados do cliente, dados do fornecedor, dados de encomendas e outros.
- O ciclo de vida dos dados desde a criação até à destruição em que os dados têm de ser regidos.
- Funções e responsabilidades de governação de dados (pessoas).
- Processos e atividades de governação de dados e como se aplicam ao ciclo de vida dos dados.
- Políticas e regras para governar dados em diferentes pontos do ciclo de vida.
- Tecnologias de governação de dados para ajudar a tornar a governação de dados possível.