Partilhar via


Gerir dados principais na malha de dados

Muitas vezes, as empresas que utilizam uma arquitetura de malha de dados têm um grande número de domínios, cada um com sistemas e dados exclusivos.

Esta ampla disseminação de dados aumenta a complexidade porque podem existir várias versões dos mesmos dados nesta configuração. A integração requer mais esforço porque os proprietários têm de integrar e harmonizar todas as diferentes partes dos mesmos dados de vários domínios. Os dados podem ser inconsistentes em contextos entre estes domínios diferentes. A qualidade dos dados também pode variar. Aplique a gestão de dados mestra (MDM) para enfrentar estes desafios.

Gestão de dados mestre orientada para domínios

Os números de identificação principal são um aspeto importante da mdm. Os seus números de identificação mestra ligam dados e dados do domínio dominados dos seus domínios. Estes números são fundamentais para a sua capacidade de localizar os dados que foram dominados e que dados pertencem em conjunto. Só pode identificar dados exclusivos e atribuir números de identificação principal centralmente, não localmente num sistema. Os dados principais de diferentes sistemas têm de estar juntos na sua solução mdm.

A MDM funciona de forma diferente em arquiteturas orientadas para o domínio devido à sua natureza distribuída. A consistência é mais difícil de alcançar porque depende da MDM nos seus domínios.

Uma forma de obter consistência é pedir aos seus domínios que estejam em conformidade com os dados mestras geridos centralmente ao distribuir produtos de dados. Pode publicar uma lista de dados principais num arquivo de dados principal ou num repositório central. O seu domínio pode classificar dados com os identificadores de referência empresarial dos dados de referência da empresa ao distribuir produtos de dados por outros domínios. Isto permite que os outros domínios reconheçam rapidamente quaisquer dados principais nesses produtos de dados.

Domínio Gestão de Dados Principal

Também pode criar novos domínios MDM ao agrupar as suas atividades de MDM e utilizar um arquivo de dados principal como um repositório centralizado. Cada novo domínio MDM deve conter um titular de dados específico no qual a identificação e o controlo dos dados principais se concentram. Alguns exemplos conhecidos destes dados incluem clientes, produtos, funcionários, localizações geográficas e informações financeiras e de risco. Os dados dominados destes domínios MDM têm de encontrar o caminho de volta para outros domínios. Esta distribuição de dados é semelhante à distribuição dos seus produtos de dados.

Pode definir o âmbito da gestão de dados mestre e permitir diferentes abordagens à distribuição de produtos de dados. Dentro dos limites de um determinado âmbito, os produtos de dados não têm de estar em conformidade com os dados principais da empresa, mas para além dos limites do âmbito, os produtos de dados têm de estar em conformidade. Também pode aplicar este padrão ao contrário, exigindo a adesão aos dados principais apenas dentro de um âmbito específico e não fora do mesmo. Nestas configurações, os seus dados dominados são geridos centralmente na sua solução mdm. Os seus domínios têm de trocar dados principais para que saibam que dados locais mapear para dados principais centrais. Identifique e mantenha estas relações para que saiba que dados foram dominados e que dados pode ligar rapidamente. Se uma chave de domínio local num sistema operacional mudar, um identificador principal é o único elemento que une tudo.

Quando distribuir identificadores principais, não extrapolar os identificadores principais de MDM para todos os sistemas de origem. Fazê-lo pode causar problemas de consistência. Apenas as suas aplicações ou sistemas sujeitos a MDM devem obter um identificador principal a partir do seu hub mdm. Os sistemas não sujeitos à MDM devem utilizar a sua própria integridade local (domínio).

Gestão de dados mestre ao nível do domínio

Quando procura dados sobrepostos, é provável que descubra vários graus de sobreposição. Alguns dados são genéricos e abrangem muitos domínios. Outros dados têm sobreposição limitada e abrangem apenas alguns domínios. Distinguir a quantidade de dados sobreposta e a sua importância ao expandir a MDM para a MDM ao nível do domínio. Pode fazê-lo ao criar vistas parciais dos seus dados principais num âmbito específico. Isto é útil quando os seus dados são partilhados entre alguns, mas não todos, dos seus domínios.

Gestão de Dados Mestra ao nível do domínio

É importante que os domínios sobrepostos giram os dados, mas não têm dependência central. As soluções MDM podem ajudá-lo a alcançar este objetivo. Pode simplificar tremendamente a utilização ao abstrair a infraestrutura e fornecer MDM como um serviço aos seus domínios. Se utilizar uma solução central, aplique vistas segregadas para cada domínio ou âmbito individual.

Obter consistência com componentes reutilizáveis

A partilha de código é outra forma de garantir a colaboração e a reutilização dos dados principais. Em vez de partilhar dados principais, partilha o código subjacente (fragmentos e scripts) para gerar saídas e promover uma reutilização eficaz. Armazene este código subjacente num repositório central e aberto com controlo de versões. As suas equipas podem contribuir e melhorar com o código que se encontra neste repositório.

Neste modelo, só aplica lógica de negócio em domínios. As suas equipas podem desviar-se, melhorar ou utilizar versões ligeiramente otimizadas da lógica conforme entenderem. Pode regenerar as suas saídas à medida que as melhorias da sua comunidade são adicionadas ao seu repositório de código central.

Tenha em atenção que permitir que as suas equipas modifiquem o código pode dificultar a comparação de resultados entre várias equipas, o que pode afetar a consistência.

Resumo da gestão de dados principais

Os utilizadores só podem tomar decisões corretas se os dados que utilizam forem consistentes e corretos. Ao utilizar a MDM, pode garantir a consistência e a qualidade dos seus dados ao nível da empresa.

A sua organização tem de encontrar o saldo correto para a MDM. Ter demasiadas áreas de dados principais ou valores de referência leva a demasiado alinhamento entre domínios. Não ter dados empresariais torna impossível comparar resultados. Uma forma prática de começar a utilizar a MDM de forma equilibrada é implementar um repositório. Esta é a forma mais simples de gerir os dados principais da sua organização. Com um repositório, não precisa de ajustar os seus sistemas de domínio para saber que dados são de baixa qualidade ou que precisam de estar alinhados. Com um repositório que o ajuda a obter essas informações, pode fornecer valor mais rapidamente.

Depois de implementar um repositório, tem de destacar um âmbito claro. Não caia na armadilha da unificação de dados empresariais ao selecionar todos os dados. Apenas os dados principais dos campos mais importantes. Comece por selecionar assuntos que adicionam mais valor, como clientes, contratos, produtos e unidades organizacionais. O seu número de atributos deve estar entre as dezenas e não as centenas ou milhares.

Alinhe os seus processos e governação assim que chegar a um acordo com os seus domínios. Tornar todos os contratos sobre linhas cronológicas e revisões claros para todos os domínios. Certifique-se também de que trabalha nos metadados. Cataloge os seus dados principais. Certifique-se de que os seus domínios sabem que elementos de dados são candidatos a partir de que sistemas de origem e como esses elementos fluem através dos seus pipelines de dados.

O último passo, e o seu objectivo final, é alcançar a coexistência. As melhorias devem ser diretamente reativadas para os seus domínios. Esta é a parte mais difícil do processo, porque requer que faça muitas alterações de arquitetura. Os seus domínios têm de ser capazes de lidar com correções e melhorias enviadas a partir da sua solução de MDM gerida centralmente.

Passos seguintes