Condividi tramite


Gestire i dati master nella mesh dei dati

Le aziende che usano un'architettura di mesh dati hanno spesso un numero elevato di domini, ognuno contenente sistemi e dati univoci.

Questa ampia diffusione dei dati aumenta la complessità perché in questa configurazione potrebbero esistere più versioni degli stessi dati. L'integrazione richiede più sforzo perché i proprietari devono integrare e armonizzare tutte le diverse parti degli stessi dati da più domini. I dati possono essere incoerenti nei contesti tra questi diversi domini. La qualità dei dati può variare anche. Applicare la gestione dei dati master (MDM) per risolvere questi problemi.

Gestione dei dati master orientata al dominio

I numeri di identificazione master sono un aspetto importante della soluzione MDM. I numeri di identificazione master collegano i dati master e i dati dai domini. Questi numeri sono fondamentali per la possibilità di tenere traccia dei dati masterati e dei dati che appartengono insieme. È possibile identificare solo i dati univoci e assegnare numeri di identificazione master centralmente, non in locale all'interno di un sistema. I dati master provenienti da sistemi diversi devono essere insieme all'interno della soluzione MDM.

MDM funziona in modo diverso nelle architetture orientate al dominio a causa della loro natura distribuita. La coerenza è più difficile da ottenere perché si basa su MDM all'interno dei domini.

Un modo per ottenere coerenza consiste nel chiedere ai domini di conformarsi ai dati master gestiti centralmente durante la distribuzione di prodotti dati. È possibile pubblicare un elenco di dati master in un archivio dati master o in un repository centrale. Il dominio può classificare i dati usando gli identificatori di riferimento aziendali dai dati di riferimento aziendali durante la distribuzione di prodotti dati in altri domini. Ciò consente agli altri domini di riconoscere rapidamente tutti i dati master all'interno di tali prodotti dati.

Dominio master Gestione dati

È anche possibile creare nuovi domini MDM durante il raggruppamento delle attività MDM e l'uso di un archivio dati master come repository centralizzato. Ogni nuovo dominio MDM deve contenere un soggetto dati specifico che identifica e controlla i dati master è incentrato su. Alcuni esempi noti di questi dati includono clienti, prodotti, dipendenti, posizioni geografiche e informazioni sui rischi. I dati masterati da questi domini MDM devono tornare ad altri domini. Questa distribuzione dei dati è simile alla distribuzione dei prodotti dati.

È possibile definire l'ambito della gestione dei dati master e consentire approcci diversi alla distribuzione dei prodotti dati. Entro i limiti di un determinato ambito, i prodotti dati non devono essere conformi ai dati master aziendali, ma oltre i limiti dell'ambito, i prodotti dati devono essere conformi. È anche possibile applicare questo modello inverso, richiedendo l'adesione ai dati master solo all'interno di un ambito specifico e non all'esterno. In queste configurazioni i dati masterati vengono gestiti centralmente all'interno della soluzione MDM. I domini devono scambiare i dati master in modo che sappiano quali dati locali eseguire il mapping ai dati master centrali. Identificare e gestire queste relazioni in modo da conoscere quali dati sono stati gestiti e quali dati è possibile collegare rapidamente. Se una chiave di dominio locale in un sistema operativo cambia, un identificatore master è l'unico elemento che associa tutto insieme.

Quando si distribuiscono gli identificatori master, non estrapolare gli identificatori master MDM in tutti i sistemi di origine. In questo modo è possibile causare problemi di coerenza. Solo le applicazioni o i sistemi soggetti a MDM devono ottenere un identificatore master dall'hub MDM. I sistemi non soggetti a MDM devono usare la propria integrità locale (dominio).

Gestione dei dati master a livello di dominio

Quando si cercano dati sovrapposti, probabilmente si individuano vari gradi di sovrapposizione. Alcuni dati sono generici e si estendono su molti domini. Altri dati hanno sovrapposizioni limitate e si estende solo su alcuni domini. Distinguere la quantità di dati sovrapposti e la relativa importanza estendendo MDM a livello di dominio MDM. È possibile eseguire questa operazione creando visualizzazioni parziali dei dati master all'interno di un ambito specifico. Ciò è utile quando i dati vengono condivisi tra alcuni, ma non tutti, dei domini.

Gestione dati master a livello di dominio

È importante che i domini sovrapposti gestiscono i dati, ma non hanno dipendenze centrali. Le soluzioni MDM consentono di ottenere questo risultato. È possibile semplificare l'utilizzo in modo enorme astraendo l'infrastruttura e fornendo MDM come servizio ai domini. Se si usa una soluzione centrale, applicare viste separate per ogni singolo dominio o ambito.

Ottenere coerenza con i componenti riutilizzabili

La condivisione del codice è un altro modo per garantire la collaborazione e la riutilizzabilità dei dati master. Anziché condividere i dati master, condividere il codice sottostante (frammenti e script) per generare output e promuovere il riutilizzo efficace. Archiviare questo codice sottostante in un repository centrale e aperto con il controllo della versione. I team possono contribuire a e migliorare il codice che vive in questo repository.

In questo modello si applica la logica di business solo nei domini. I team possono deviare, apportare miglioramenti o usare versioni leggermente ottimizzate della logica in base alla loro adattabilità. È possibile rigenerare gli output come miglioramenti della community vengono aggiunti nel repository del codice centrale.

Si noti che consente ai team di modificare il codice può rendere più difficile confrontare i risultati tra vari team, che possono influire sulla coerenza.

Riepilogo della gestione dei dati master

Gli utenti possono prendere decisioni corrette solo se i dati usati sono coerenti e corretti. Usando MDM, è possibile garantire la coerenza e la qualità dei dati a livello aziendale.

L'organizzazione deve trovare il saldo corretto per MDM. La presenza di troppe aree di dati master o valori di riferimento comporta un numero eccessivo di allineamento tra domini. L'assenza di dati aziendali rende impossibile confrontare i risultati. Un modo pratico per iniziare a usare MDM in modo bilanciato consiste nell'implementare un repository. Questo è il modo più semplice per gestire i dati master dell'organizzazione. Con un repository non è necessario modificare i sistemi di dominio per apprendere quali dati sono di bassa qualità o devono essere allineati. Con un repository che consente di ottenere tali informazioni, è possibile offrire valore più rapidamente.

Dopo aver implementato un repository, è necessario strutturare un ambito chiaro. Non cadere nella trappola dell'unificazione dei dati aziendali selezionando tutti i dati. Solo i dati master dei campi più importanti. Iniziare selezionando soggetti che aggiungono il valore più elevato, ad esempio clienti, contratti, prodotti e unità organizzative. Il numero di attributi deve essere compreso tra decine, non centinaia o migliaia.

Allineare i processi e la governance dopo aver ricevuto un accordo con i domini. Rendere chiari tutti i contratti relativi alle sequenze temporali e alle revisioni a tutti i domini. Assicurarsi inoltre di lavorare sui metadati. Cataloga i dati master. Assicurarsi che i domini sappiano quali elementi di dati sono candidati dai sistemi di origine e come questi elementi vengono trasmessi attraverso le pipeline di dati.

Il passaggio finale, e il vostro obiettivo finale, è raggiungere la coesistenza. I miglioramenti devono tornare direttamente ai domini. Questa è la parte più difficile del processo, perché richiede di apportare molte modifiche all'architettura. I domini devono essere in grado di gestire le correzioni e i miglioramenti inviati dalla soluzione MDM gestita centralmente.

Passaggi successivi