Bagikan melalui


Tata kelola data dan AI untuk data lakehouse

Prinsip arsitektur data dan pilar tata kelola AI mencakup cara mengelola aset dan akses secara terpusat.

Diagram arsitektur lakehouse tata kelola data untuk Databricks.

Prinsip tata kelola data dan AI

  1. Menyatukan data dan manajemen AI

    Manajemen data dan AI adalah fondasi untuk menjalankan data dan strategi tata kelola AI. Ini melibatkan pengumpulan, integrasi, organisasi, dan kegigihan aset data tepercaya untuk membantu organisasi memaksimalkan nilainya. Katalog terpadu secara terpusat dan konsisten menyimpan semua data dan artefak analitik Anda, serta metadata yang terkait dengan setiap objek data. Ini memungkinkan pengguna akhir untuk menemukan himpunan data yang tersedia untuk mereka dan memberikan visibilitas yang terbukti dengan melacak silsilah data semua aset.

  2. Menyatukan data dan keamanan AI

    Ada dua tenet tata kelola keamanan data yang efektif: memahami siapa yang memiliki akses ke data apa, dan yang baru-baru ini mengakses aset data apa. Informasi ini sangat penting untuk hampir semua persyaratan kepatuhan untuk industri yang diatur dan sangat mendasar untuk program tata kelola keamanan apa pun. Dengan sistem keamanan data terpadu, model izin dapat dikelola secara terpusat dan konsisten di semua aset data. Akses data diaudit secara terpusat dengan kemampuan pemberitahuan dan pemantauan untuk mempromosikan akuntabilitas.

  3. Menetapkan standar kualitas data

    Kualitas data sangat mendasar untuk memperoleh wawasan yang akurat dan bermakna dari data. Kualitas data memiliki banyak dimensi, termasuk kelengkapan, akurasi, validitas, dan konsistensi. Ini harus dikelola secara aktif untuk meningkatkan kualitas himpunan data akhir sehingga data berfungsi sebagai informasi yang andal dan dapat dipercaya untuk pengguna bisnis.

Berikutnya: Praktik terbaik untuk tata kelola data

Lihat Praktik terbaik untuk tata kelola data dan AI.