Gambaran umum zona pendaratan manajemen data analitik skala cloud

Zona pendaratan manajemen data adalah fungsi manajemen dan merupakan pusat analitik skala cloud. Ini bertanggung jawab atas tata kelola platform analitik Anda.

Diagram of data management landing zone overview.

Zona pendaratan manajemen data Anda adalah langganan terpisah yang memiliki layanan zona pendaratan Azure standar yang sama. Ini memungkinkan tata kelola data Anda melalui perayap, yang terhubung ke data lake dan penyimpanan poliglot Anda di zona pendaratan data Anda. Peering jaringan virtual menghubungkan zona pendaratan manajemen data Anda ke zona pendaratan data dan langganan konektivitas Anda.

Gunakan arsitektur ini sebagai titik awal. Unduh file Visio dan ubah agar sesuai dengan persyaratan bisnis dan teknis spesifik Anda saat merencanakan implementasi zona pendaratan manajemen data Anda.

Catatan

Persistensi poliglot adalah istilah penyimpanan yang menjelaskan pilihan Anda antara berbagai teknologi penyimpanan data/penyimpanan data untuk mendukung berbagai jenis data dan kebutuhan penyimpanannya. Pada dasarnya, persistensi poliglot adalah konsep bahwa aplikasi dapat menggunakan lebih dari satu database inti atau teknologi penyimpanan.

Penting

Zona pendaratan manajemen data Anda harus disebarkan sebagai langganan terpisah di bawah grup manajemen dengan tata kelola yang sesuai. Anda kemudian dapat mengontrol tata kelola di seluruh organisasi Anda. Akselerator zona pendaratan Azure menggambarkan bagaimana Anda harus mendekati zona pendaratan Azure.

Katalog data

Grup sumber daya: governance-rg

Katalog data mendaftar dan memelihara informasi data di tempat terpusat dan membuatnya tersedia untuk organisasi. Ini memastikan bahwa perusahaan menghindari produk data duplikat yang disebabkan oleh penyerapan data berlebihan oleh tim proyek yang berbeda.

Sebaiknya Sediakan layanan katalog data untuk menentukan metadata produk data yang disimpan di seluruh zona pendaratan data.

Analitik skala cloud bergantung pada Microsoft Purview untuk berfungsi sebagai:

  • Sistem pendaftaran
  • Penemuan untuk sumber data perusahaan
  • Mesin klasifikasi data
  • Penyimpanan kebijakan
  • API untuk mendaftar dan membaca informasi data
  • Hub dasbor kepatuhan

Karena katalog data adalah bagian dari zona pendaratan manajemen data, katalog data dapat berkomunikasi dengan setiap zona pendaratan data melalui peering jaringan virtual (VNet) dan runtime integrasi yang dihost sendiri. Penemuan produk data di penyimpanan lokal dan cloud publik lainnya dicapai oleh lebih banyak penyebaran runtime integrasi yang dihost sendiri.

Catatan

Meskipun dokumentasi ini berfokus terutama pada penggunaan Microsoft Purview untuk kemampuan katalog data dan klasifikasi data, perusahaan mungkin telah berinvestasi dalam produk lain, seperti Alation, Okera, atau Collibra. Jika demikian, bekerja samalah dengan vendor Anda untuk menerapkan prinsip yang dijelaskan untuk zona pendaratan manajemen data sedekat mungkin. Pahami bahwa beberapa integrasi kustom mungkin diperlukan.

Untuk informasi selengkapnya, lihat Katalog data dan praktik terbaik penyebaran Microsoft Purview untuk analitik skala cloud.

Manajemen kualitas data

Grup sumber daya: governance-rg2

Lanjutkan dengan solusi Anda saat ini.

Anda harus mengelola kualitas data sedekat mungkin dengan sumber data sehingga Anda menghindari masalah kualitas yang mereplikasi di seluruh analitik dan properti AI Anda. Memindahkan metrik dan validasi kualitas ke integrasi data Anda menyelaraskan proses kualitas dengan tim yang paling dekat dengan data Anda. Tim ini memiliki pemahaman terdalam tentang aset data Anda.

Silsilah data juga memberikan kepercayaan kualitas data, dan Anda harus menyediakannya untuk semua produk dan produk data.

Untuk informasi selengkapnya tentang manajemen kualitas data, lihat Kualitas data.

Repositori pemodelan data

Grup sumber daya: governance-rg2

Anda harus mengambil dan menyimpan model hubungan entitas di lokasi pusat dalam zona pendaratan manajemen data Anda. Ini memberi konsumen data satu tempat untuk menemukan diagram konseptual.

Banyak pelanggan menggunakan ER Studio dan iServer untuk memodelkan produk data mereka sebelum penyerapan.

Manajemen data master

Grup sumber daya: governance-rg2

Kontrol manajemen data master berada di zona pendaratan manajemen data. Manajemen data master dalam jala data berisi pertimbangan khusus yang harus Anda panggil untuk jala data.

Banyak solusi manajemen data master yang sepenuhnya terintegrasi dengan MICROSOFT Entra ID. Integrasi ini memungkinkan Anda mengamankan data dan memberikan tampilan yang berbeda untuk grup pengguna yang berbeda.

Untuk informasi selengkapnya, lihat Sistem manajemen data master.

Katalog API

Grup sumber daya: governance-rg2

Tim aplikasi data Anda di seluruh kemungkinan akan membuat berbagai API untuk aplikasi data mereka. API ini mungkin sulit ditemukan di seluruh organisasi Anda. Menempatkan katalog API di zona pendaratan manajemen data Anda dapat menyelesaikan masalah ini.

Katalog API dapat membantu menstandarkan dokumentasi Anda dan menawarkan tempat untuk kolaborasi internal pada API. Ini juga dapat mendorong kontrol konsumsi, penerbitan, dan tata kelola di seluruh organisasi Anda.

Berbagi data dan kontrak

Grup sumber daya: governance-rg2

Analitik skala cloud menggunakan pengelolaan pemberian hak Microsoft Entra atau kebijakan Microsoft Purview untuk mengontrol akses ke berbagi data. Meskipun demikian, Anda mungkin masih memerlukan repositori berbagi dan kontrak. Repositori ini adalah fungsi organisasi dan harus berada di zona pendaratan manajemen data Anda.

Kontrak Anda harus memberikan informasi tentang validasi data, model, dan kebijakan keamanan.

Untuk informasi selengkapnya, lihat Kontrak data

Azure Container Registry

Grup sumber daya: containers-rg

Zona pendaratan manajemen data Anda menghosting Azure Container Registry. Azure Container Registry memungkinkan operasi platform data Anda untuk menyebarkan kontainer standar untuk digunakan dalam proyek ilmu data yang digunakan tim aplikasi data Anda.

Grup sumber daya: synapse-link-rg

Hub Azure Synapse Analytics Private Link adalah sumber daya Azure yang menghubungkan jaringan aman Anda dan pengalaman web Azure Synapse Studio. Analitik skala cloud menghubungkan Azure Virtual Network Anda dengan aman ke Azure Synapse Studio menggunakan tautan privat dari hub ini.

Ada dua langkah untuk menyambungkan ke Azure Synapse Studio menggunakan tautan privat.

  1. Buat sumber daya hub Private Link.
  2. Buat titik akhir privat dari Azure Virtual Network Anda ke hub Private Link tersebut.

Anda kemudian dapat menggunakan titik akhir privat untuk berkomunikasi dengan studio Azure Synapse secara aman. Integrasikan titik akhir privat ini dengan solusi DNS Anda, baik dengan solusi lokal Anda atau dengan Azure Private DNS.

Untuk informasi selengkapnya, lihat Tersambung ke studio Azure Synapse menggunakan tautan privat.

Antarmuka otomatisasi (opsional)

Organisasi Anda mungkin memutuskan untuk membuat banyak layanan otomatisasi untuk menambah kemampuan analitik skala cloud. Layanan otomatisasi ini mendorong kesesuaian dan solusi orientasi untuk status analitik Anda.

Jika Anda memutuskan untuk membangun layanan otomatisasi ini, Anda harus memiliki antarmuka pengguna yang bertindak sebagai marketplace data dan konsol operasi. Antarmuka ini harus mengandalkan penyimpanan metadata yang mendasar seperti yang telah kita bahas sebelumnya dalam standar Metadata.

Marketplace data atau konsol operasi Anda memanggil tingkat menengah layanan mikro untuk memfasilitasi onboarding, pendaftaran metadata, provisi keamanan, siklus hidup data, dan pengamatan.

Anda dapat menyediakan grup sumber daya automationdb-rg untuk menghosting penyimpanan metadata Anda.

Penting

Tidak satu pun dari layanan otomatisasi ini adalah produk, dan tidak menggambarkan item peta jalan apa pun. Mereka tercantum untuk membantu Anda mempertimbangkan item mana yang mungkin ingin Anda otomatisasi.

Layanan

Layanan Cakupan Layanan
Provisi zona pendaratan data Layanan ini membuat zona pendaratan data baru. Tidak mungkin memiliki penggunaan yang tinggi, tetapi disertakan untuk kelengkapan solusi onboarding end-to-end. Untuk informasi selengkapnya, lihat Menyediakan analitik skala cloud
Onboarding produk data Layanan ini membuat dan mengubah grup sumber daya yang berkaitan dengan penyewa onboarding. Ini juga berisi kemampuan untuk meningkatkan dan menurunkan SKU dan untuk mengaktifkan dan menonaktifkan grup sumber daya untuk penyewa atau layanan yang di-onboarding. Ini membuat devOps zona pendaratan data baru. Untuk informasi selengkapnya, lihat Menyediakan analitik skala cloud
Provisi akses Layanan ini membuat paket akses, kebijakan akses, dan proses persetujuan akses aset (manual atau otomatis) menggunakan SPN/UPN. Ini juga dapat mengekspos API untuk menyediakan daftar permintaan langganan (aset) yang telah dikirimkan pengguna dalam 90 hari terakhir. Untuk informasi selengkapnya, lihat Manajemen akses data
Penyerapan agnostik data Layanan mikro ini membuat sumber data baru untuk penyerapan ke zona pendaratan data Anda. Ini dilakukan dengan berkomunikasi dengan metastore Azure Data Factory SQL Database di setiap zona pendaratan data. Untuk informasi selengkapnya, lihat Cara kerangka kerja penyerapan otomatis mendukung analitik skala cloud di Azure
Metadata Layanan ini mengekspos dan membuat metadata untuk platform. Untuk informasi selengkapnya, lihat Standar metadata
Siklus hidup data Layanan ini bertanggung jawab untuk mempertahankan siklus hidup data Anda berdasarkan metadata. Pemeliharaan ini dapat mencakup pemindahan data ke penyimpanan dingin dan menghapus rekaman yang tidak perlu lagi dipertahankan. Untuk informasi selengkapnya, lihat Manajemen siklus hidup data
Onboarding domain data HANYA BERLAKU UNTUK JALA DATA. Layanan ini menangkap metadata yang berkaitan dengan domain baru dan melakukan onboarding domain baru sesuai kebutuhan. Ini juga dapat membuat, memperbarui, mengaktifkan, dan menonaktifkan domain atau lini layanan apa pun yang mungkin Anda bangun menjadi layanan mikro. Untuk informasi selengkapnya, lihat Menyediakan analitik skala cloud

Standarisasi data

Meskipun ini bukan fitur atau produk tertentu dari zona pendaratan manajemen data Anda, Anda harus memanggil standarisasi data di semua layanan. Standardisasi data mendefinisikan format tempat data Anda harus mendarat dan disimpan.

Tip

Gunakan format delta-lake sedapat mungkin sebagai standar defacto di semua layanan dan penyimpanan.

Untuk informasi selengkapnya, lihat Standardisasi data.

Langkah berikutnya