Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini membahas prinsip arsitektur pilar interoperabilitas dan kegunaan , mengacu pada interaksi lakehouse dengan pengguna dan sistem lainnya. Salah satu ide mendasar lakehouse adalah untuk memberikan pengalaman pengguna yang hebat bagi semua persona yang bekerja dengannya, dan untuk dapat berinteraksi dengan ekosistem sistem eksternal yang luas.
- Interoperabilitas adalah kemampuan sistem untuk bekerja dengan dan berintegrasi dengan sistem lain. Ini menyiratkan interaksi antara komponen dan produk yang berbeda, mungkin dari beberapa vendor, dan antara versi masa lalu dan masa depan dari produk yang sama.
- Kegunaan adalah ukuran seberapa baik sistem memungkinkan pengguna untuk melakukan tugas dengan aman, efektif, dan efisien.
Mengikuti prinsip-prinsip pilar ini membantu:
- Mencapai pengalaman pengguna yang konsisten dan kolaboratif.
- Manfaatkan sinergi di seluruh cloud.
- Menyederhanakan integrasi dari dan ke Lakehouse.
- Mengurangi biaya pelatihan dan pengaktifan.
Dan pada akhirnya mempercepat waktu untuk mencapai nilai.
Prinsip interoperabilitas dan kegunaan
Tentukan standar integrasi
Integrasi memiliki aspek yang berbeda dan dapat dilakukan dengan berbagai cara. Untuk menghindari alat dan pendekatan yang menjamur, praktik terbaik harus ditentukan dan daftar alat dan konektor yang didukung dengan baik dan disukai harus disediakan.
Salah satu prinsip arsitektur utama adalah modularitas dan kopling longgar daripada integrasi yang ketat. Ini mengurangi dependensi antara komponen dan beban kerja, membantu menghilangkan efek samping, dan memungkinkan pengembangan independen pada skala waktu yang berbeda. Gunakan himpunan data dan skemanya sebagai kontrak. Pisahkan beban kerja seperti pekerjaan penanganan data (seperti memuat dan mengubah data ke dalam data lake) dari pekerjaan nilai tambah (misalnya pelaporan, dasbor, dan rekayasa fitur ilmu data). Tentukan katalog data pusat dengan panduan untuk format data, kualitas data, dan siklus hidup data.
Gunakan antarmuka terbuka dan format data terbuka
Seringkali, solusi dikembangkan di mana data hanya dapat diakses melalui sistem tertentu. Ini dapat menyebabkan terjebak dalam penguncian vendor, tetapi juga dapat menjadi faktor biaya besar jika akses data melalui sistem tersebut dikenakan biaya lisensi. Menggunakan format dan antarmuka data terbuka membantu menghindari hal ini. Mereka juga menyederhanakan integrasi dengan sistem yang ada dan membuka ekosistem mitra yang telah mengintegrasikan alat mereka dengan lakehouse.
Jika Anda menggunakan ekosistem sumber terbuka seperti Python atau R untuk ilmu data, atau Spark atau ANSI SQL untuk akses data dan kontrol hak akses, Anda akan memiliki waktu yang lebih mudah menemukan personel untuk proyek. Ini juga akan menyederhanakan potensi migrasi ke dan dari platform.
Menyederhanakan implementasi kasus penggunaan baru
Untuk mendapatkan hasil maksimal dari data di data lake, pengguna harus dapat dengan mudah menyebarkan kasus penggunaan mereka di platform. Ini dimulai dengan proses efisien dalam hal akses platform dan manajemen data. Misalnya, akses layanan mandiri ke platform membantu mencegah tim pusat menjadi hambatan. Lingkungan bersama dan cetak biru yang telah ditentukan sebelumnya untuk menyebarkan lingkungan baru memastikan bahwa platform tersedia dengan cepat untuk setiap pengguna bisnis.
Memastikan konsistensi dan kegunaan data
Dua aktivitas penting pada platform data adalah penerbitan data dan konsumsi data . Dari perspektif penerbitan, data harus ditawarkan sebagai produk. Penerbit perlu mengikuti siklus hidup yang ditentukan dengan mengingat konsumen, dan data perlu didefinisikan dengan jelas dengan skema terkelola, deskripsi, dan sebagainya.
Penting juga untuk memberikan data yang konsisten secara semantik sehingga konsumen dapat dengan mudah memahami dan menggabungkan himpunan data yang berbeda dengan benar. Selain itu, semua data harus mudah ditemukan dan dapat diakses oleh konsumen melalui katalog pusat dengan metadata dan silsilah data yang dikumpulkan dengan benar.
Berikutnya: Praktik terbaik untuk interoperabilitas dan kegunaan
Lihat praktik terbaik untuk interoperabilitas dan kegunaan.