Mengelola data master dalam jala data
Perusahaan yang menggunakan arsitektur jala data sering memiliki sejumlah besar domain, masing-masing berisi sistem dan data unik.
Penyebaran data yang luas ini meningkatkan kompleksitas karena beberapa versi data yang sama mungkin ada dalam penyiapan ini. Integrasi membutuhkan lebih banyak upaya karena pemilik harus mengintegrasikan dan menyelaraskan semua bagian yang berbeda dari data yang sama dari beberapa domain. Data dapat tidak konsisten dalam konteks antara domain yang berbeda ini. Kualitas data juga dapat bervariasi. Terapkan manajemen data master (MDM) untuk mengatasi tantangan ini.
Manajemen data master berorientasi domain
Nomor identifikasi master adalah aspek penting dari MDM Anda. Nomor identifikasi master Anda menautkan data dan data yang dikuasai dari domain Anda. Angka-angka ini sangat penting bagi kemampuan Anda untuk melacak data apa yang telah dikuasai dan data apa yang dimiliki bersama-sama. Anda hanya dapat mengidentifikasi data unik dan menetapkan nomor identifikasi master secara terpusat, bukan secara lokal dalam sistem. Data master Anda dari sistem yang berbeda harus bersama-sama dalam solusi MDM Anda.
MDM bekerja secara berbeda dalam arsitektur berorientasi domain karena sifatnya yang terdistribusi. Konsistensi lebih sulit dicapai karena Anda mengandalkan MDM dalam domain Anda.
Salah satu cara Anda dapat mencapai konsistensi adalah dengan meminta domain Anda menyesuaikan diri dengan data master yang dikelola secara terpusat saat mendistribusikan produk data. Anda dapat menerbitkan daftar data master di penyimpanan data master atau repositori pusat. Domain Anda dapat mengklasifikasikan data menggunakan pengidentifikasi referensi perusahaan dari data referensi perusahaan Anda saat mendistribusikan produk data di seluruh domain lain. Ini memungkinkan domain Anda yang lain dengan cepat mengenali data master apa pun dalam produk data tersebut.
Anda juga dapat membuat domain MDM baru saat mengelompokkan aktivitas MDM Anda dan menggunakan penyimpanan data master sebagai repositori terpusat. Setiap domain MDM baru harus berisi subjek data tertentu yang berfokus pada identifikasi dan kontrol data master Anda. Beberapa contoh terkenal dari data ini termasuk pelanggan, produk, karyawan, lokasi geografis, dan informasi keuangan dan risiko. Data yang dikuasai dari domain MDM ini harus menemukan jalan kembali ke domain lain. Distribusi data ini mirip dengan distribusi produk data Anda.
Anda dapat mencakup manajemen data master dan mengizinkan pendekatan yang berbeda untuk distribusi produk data. Dalam batas cakupan tertentu, produk data tidak harus sesuai dengan data master perusahaan, tetapi di luar batas cakupan, produk data harus sesuai. Anda juga dapat menerapkan pola ini secara terbalik, mengharuskan kepatuhan terhadap data master hanya dalam cakupan tertentu dan tidak di luarnya. Dalam penyiapan ini, data yang Anda kuasai dikelola secara terpusat dalam solusi MDM Anda. Domain Anda perlu bertukar data master sehingga mereka tahu data lokal mana yang akan dipetakan ke data master pusat. Identifikasi dan pertahankan hubungan ini sehingga Anda mengetahui data mana yang telah dikuasai dan data mana yang dapat Anda tautkan bersama dengan cepat. Jika kunci domain lokal dalam sistem operasional berubah, pengidentifikasi master adalah satu-satunya elemen yang mengikat semuanya bersama-sama.
Saat Anda mendistribusikan pengidentifikasi master, jangan mengekstrapolasi pengidentifikasi master MDM Anda ke semua sistem sumber. Melakukannya dapat menyebabkan masalah konsistensi. Hanya aplikasi atau sistem Anda yang tunduk pada MDM yang harus mendapatkan pengidentifikasi master dari hub MDM Anda. Sistem yang tidak tunduk pada MDM harus menggunakan integritas lokal (domain) mereka sendiri.
Manajemen data master tingkat domain
Saat Anda mencari data yang tumpang tindih, Anda mungkin akan menemukan berbagai tingkat tumpang tindih. Beberapa data bersifat umum dan mencakup banyak domain. Data lain memiliki tumpang tindih terbatas dan hanya mencakup beberapa domain. Membedakan jumlah tumpang tindih data dan kepentingannya dengan memperluas MDM ke MDM tingkat domain. Anda dapat melakukan ini dengan membuat tampilan parsial data master Anda dalam cakupan tertentu. Ini berguna saat data Anda dibagikan antara beberapa, tetapi tidak semua domain Anda.
Penting bahwa domain yang tumpang tindih mengelola data tetapi tidak memiliki dependensi pusat. Solusi MDM dapat membantu Anda mencapai hal ini. Anda dapat menyederhanakan penggunaan dengan sangat baik dengan mengabstraksi infrastruktur dan menyediakan MDM sebagai layanan ke domain Anda. Jika Anda menggunakan solusi pusat, terapkan tampilan terpisah untuk setiap domain atau cakupan individual.
Mencapai konsistensi dengan komponen yang dapat digunakan kembali
Berbagi kode adalah cara lain untuk memastikan kolaborasi dan penggunaan kembali data master. Alih-alih berbagi data master, Anda berbagi kode dasar (cuplikan dan skrip) untuk menghasilkan output dan mempromosikan penggunaan kembali yang efektif. Simpan kode yang mendasar ini di repositori pusat dan terbuka dengan kontrol versi. Semua tim Anda dapat berkontribusi dan meningkatkan kode yang hidup di repositori ini.
Dalam model ini, Anda hanya menerapkan logika bisnis dalam domain. Tim Anda dapat menyimpang, melakukan penyempurnaan, atau menggunakan versi logika yang sedikit dioptimalkan sesuai keinginan mereka. Anda dapat meregenerasi output saat peningkatan dari komunitas Anda ditambahkan ke dalam repositori kode pusat Anda.
Perhatikan bahwa memungkinkan tim Anda untuk memodifikasi kode mereka dapat membuat perbandingan hasil antara berbagai tim lebih sulit, yang dapat memengaruhi konsistensi.
Ringkasan manajemen data master
Pengguna hanya dapat membuat keputusan yang benar jika data yang mereka gunakan konsisten dan benar. Dengan menggunakan MDM, Anda dapat memastikan konsistensi dan kualitas data Anda di tingkat perusahaan.
Organisasi Anda harus menemukan saldo yang benar untuk MDM. Memiliki terlalu banyak area data master atau nilai referensi menyebabkan terlalu banyak perataan lintas domain. Tidak memiliki data perusahaan sama sekali membuatnya tidak mungkin untuk membandingkan hasil apa pun. Cara praktis untuk mulai menggunakan MDM dengan cara yang seimbang adalah dengan menerapkan repositori. Ini adalah cara paling sederhana untuk mengelola data master organisasi Anda. Dengan repositori, Anda tidak perlu menyesuaikan sistem domain untuk mempelajari data apa yang berkualitas rendah atau perlu diselaraskan. Dengan repositori yang membantu Anda mendapatkan informasi tersebut, Anda dapat memberikan nilai dengan lebih cepat.
Setelah menerapkan repositori, Anda perlu menguraikan cakupan yang jelas. Jangan jatuh ke dalam perangkap penyatuan data perusahaan dengan memilih semua data. Hanya master data dari bidang Anda yang paling penting. Mulailah dengan memilih subjek yang menambahkan nilai terbanyak, seperti pelanggan, kontrak, produk, dan unit organisasi. Jumlah atribut Anda harus dalam puluhan, bukan ratusan atau ribuan.
Selaraskan proses dan tata kelola Anda setelah Anda membuat perjanjian dengan domain Anda. Buat perjanjian apa pun tentang garis waktu dan tinjauan yang jelas untuk semua domain. Pastikan juga Anda mengerjakan metadata Anda. Katalogkan data master Anda. Pastikan domain Anda mengetahui elemen data mana yang merupakan kandidat dari sistem sumber mana, dan bagaimana elemen tersebut mengalir melalui alur data Anda.
Langkah terakhir, dan tujuan utama Anda, adalah mencapai koeksistensi. Penyempurnaan Anda harus mengalir langsung kembali ke domain Anda. Ini adalah bagian paling sulit dari proses, karena mengharuskan Anda untuk membuat banyak perubahan arsitektur. Domain Anda harus dapat menangani koreksi dan peningkatan yang dikirim dari solusi MDM yang dikelola secara terpusat.