Bagikan melalui


Pengantar analitik skala cloud

Analitik skala cloud dibangun di atas zona pendaratan Azure untuk kemudahan penyebaran dan tata kelola. Tujuan utama zona pendaratan Azure adalah untuk memastikan bahwa, ketika aplikasi atau beban kerja mendarat di Azure, infrastruktur yang diperlukan sudah ada. Sebelum menyebarkan zona pendaratan analitik skala cloud, Anda harus telah menetapkan satu atau beberapa zona pendaratan Azure. Microsoft menyediakan templat sampel untuk memulai, yang dapat Anda gunakan untuk data lakehouse dan penyebaran jala data Anda. Templat ini memberikan kelincahan dan mematuhi persyaratan keamanan dan tata kelola.

Evaluasi analitik skala cloud

Seringkali, bisnis mencari kejelasan atau panduan preskriptif sebelum mulai mengukir detail teknis untuk kasus penggunaan, proyek, atau analitik skala cloud end-to-end tertentu. Sebagai bisnis merumuskan strategi datanya secara keseluruhan, dapat menjadi tantangan untuk memastikan bahwa ia mempertimbangkan semua prinsip strategis dan diperlukan dalam cakupan penggunaan saat ini.

Untuk mempercepat pengiriman perjalanan wawasan end-to-end ini, sambil mengingat tantangan ini, Microsoft telah mengembangkan skenario preskriptif untuk analitik skala cloud. Ini selaras dengan tema utama yang dibahas dalam Mengembangkan rencana untuk analitik skala cloud.

Analitik skala cloud dibangun di atas Microsoft Cloud Adoption Framework, sambil menerapkan lensa Microsoft Azure Well-Architected Framework. Microsoft Cloud Adoption Framework memberikan panduan preskriptif dan praktik terbaik pada model operasi cloud, arsitektur referensi, dan template platform. Ini didasarkan pada pembelajaran dunia nyata dari beberapa lingkungan kami yang paling menantang, canggih, dan kompleks.

Analitik skala cloud membuka jalan bagi pelanggan untuk membangun dan mengoperasionalkan zona pendaratan untuk menghosting dan menjalankan beban kerja analitik. Anda membangun zona arahan di atas fondasi keamanan, tata kelola, dan kepatuhan. Mereka dapat diskalakan dan modular, sambil mendukung otonomi dan inovasi.

Riwayat arsitektur data

Pada akhir 1980-an, gudang data generasi 1 diperkenalkan, yang menggabungkan sumber data yang berbeda dari seluruh perusahaan. Pada akhir 2000-an datang Gen2, dengan diperkenalkannya ekosistem big data seperti Hadoop dan data lake. Pertengahan 2010-an membawa platform data cloud. Ini mirip dengan generasi sebelumnya, tetapi dengan pengenalan penyerapan data streaming, seperti arsitektur kappa atau lambda. Awal 2020-an memperkenalkan konsep data lakehouse, data mesh, data fabric, dan pola operasional data-centric.

Terlepas dari kemajuan ini, banyak organisasi masih menggunakan platform monolitik terpusat, generasi 1. Sistem ini bekerja dengan baik, sampai titik tertentu. Namun, penyempitan dapat terjadi karena proses yang saling bergantung, komponen yang digabungkan dengan erat, dan tim hiperspesialisasi. Pekerjaan ekstraksi, transformasi, dan pemuatan (ETL) dapat menjadi garis waktu pengiriman yang menonjol dan memperlambat.

Gudang data dan data lake masih berharga, dan memainkan peran penting dalam arsitektur Anda secara keseluruhan. Dalam dokumentasi berikut, kami telah menyoroti beberapa tantangan yang dapat terjadi saat menggunakan praktik tradisional ini untuk menskalakan. Tantangan ini sangat relevan dalam organisasi yang kompleks, di mana sumber data, persyaratan, tim, dan output berubah.

Pindah ke analitik skala cloud

Arsitektur data analitik dan model operasi Anda saat ini dapat mencakup struktur gudang data, data lake, dan data lakehouse, atau bahkan model yang muncul seperti kain data atau jala data.

Setiap model data memiliki manfaat dan tantangannya sendiri. Analitik skala cloud membantu Anda bekerja dari penyiapan saat ini untuk mengalihkan pendekatan Anda ke manajemen data sehingga dapat berkembang dengan infrastruktur Anda.

Anda dapat mendukung platform dan skenario data apa pun untuk membuat kerangka kerja analitik skala cloud end-to-end yang berfungsi sebagai fondasi Anda dan memungkinkan penskalaan.

Platform data modern dan hasil yang diinginkan

Salah satu area fokus pertama adalah mengaktifkan strategi data Anda untuk memenuhi tantangan Anda dengan membangun platform data modern yang dapat diskalakan dan gesar secara berulang.

Alih-alih kewalahan dengan tiket layanan dan mencoba memenuhi kebutuhan bisnis yang bersaing, platform data modern memungkinkan Anda untuk memainkan peran yang lebih konsultasi dengan membebaskan waktu Anda untuk fokus pada pekerjaan yang lebih berharga. Anda menyediakan lini bisnis dengan platform dan sistem untuk kebutuhan data dan analitik mandiri.

Area fokus awal yang direkomendasikan adalah:

  • Meningkatkan kualitas data, memfasilitasi kepercayaan, dan mendapatkan wawasan untuk membuat keputusan bisnis berbasis data.

  • Terapkan data, manajemen, dan analitik holistik dengan mulus dalam skala besar, di seluruh organisasi Anda.

  • Menetapkan tata kelola data yang kuat yang memungkinkan layanan mandiri dan fleksibilitas untuk lini bisnis.

  • Menjaga keamanan dan kepatuhan hukum di lingkungan yang terintegrasi penuh.

  • Buat fondasi dengan cepat untuk kemampuan analitik tingkat lanjut, dengan solusi out-of-the-box dari pola modular yang dirancang dengan baik, berulang.

Mengatur real estat analitik Anda

Pertimbangan kedua adalah menentukan bagaimana organisasi menerapkan tata kelola data.

Tata kelola data adalah cara Anda memastikan bahwa data yang Anda gunakan dalam operasi, laporan, dan analisis bisnis Anda dapat ditemukan, akurat, tepercaya, dan dapat dilindungi.

Bagi banyak perusahaan, harapannya adalah bahwa data dan AI akan mendorong keunggulan kompetitif. Akibatnya, para eksekutif sangat ingin mensponsori inisiatif AI dalam tekad mereka untuk menjadi berbasis data. Namun, agar AI menjadi efektif, data yang digunakannya harus dipercaya. Jika tidak, akurasi keputusan dapat disusupi, keputusan mungkin tertunda, atau tindakan mungkin terlewatkan, yang dapat memengaruhi di garis bawah. Perusahaan tidak ingin kualitas data mereka menjadi sampah, sampah keluar. Pada awalnya, mungkin tampak mudah untuk memperbaiki kualitas data, sampai Anda melihat efek yang dimiliki transformasi digital pada data.

Dengan data yang tersebar di multicloud hibrid dan lanskap data terdistribusi, organisasi berjuang untuk menemukan di mana data mereka berada dan mengaturnya. Data yang tidak dikelola dapat memiliki efek yang cukup besar pada bisnis. Kualitas data yang buruk berdampak pada operasi bisnis, karena kesalahan data menyebabkan kesalahan proses dan penundaan. Kualitas data yang buruk juga memengaruhi pengambilan keputusan bisnis dan kemampuan untuk tetap patuh. Memastikan kualitas data di sumber sering disukai, karena memperbaiki masalah kualitas dalam sistem analitik bisa lebih kompleks dan mahal daripada menerapkan aturan kualitas data di awal fase penyerapan. Untuk membantu melacak dan mengatur aktivitas data, tata kelola data harus mencakup:

  • Penemuan data
  • Kualitas data
  • Pembuatan kebijakan
  • Berbagi data
  • Metadata

Mengamankan estate analitik Anda

Pendorong utama lain untuk tata kelola data adalah perlindungan data. Perlindungan data dapat membantu Anda mematuhi undang-undang peraturan, dan dapat mencegah pelanggaran data. Privasi data, dan meningkatnya jumlah pelanggaran data, telah menjadikan perlindungan data sebagai prioritas utama di ruang rapat. Pelanggaran ini menyoroti risiko terhadap data sensitif, seperti data pelanggan yang dapat diidentifikasi secara pribadi. Konsekuensi dari pelanggaran privasi data atau pelanggaran keamanan data banyak, dan dapat mencakup:

  • Kehilangan atau kerusakan serius pada citra merek

  • Hilangnya kepercayaan pelanggan dan pangsa pasar

  • Jatuhnya harga saham, yang berdampak pada pengembalian investasi dan gaji eksekutif pemangku kepentingan

  • Hukuman keuangan besar karena kegagalan audit atau kepatuhan

  • Tindakan hukum

  • Efek domino dari pelanggaran, misalnya, pelanggan mungkin menjadi korban pencurian identitas

Dalam kebanyakan kasus, perusahaan yang dikutip publik harus menyatakan pelanggaran ini. Jika pelanggaran terjadi, pelanggan lebih cenderung menyalahkan perusahaan terlebih dahulu, daripada peretas. Pelanggan mungkin memboikot perusahaan selama beberapa bulan atau mungkin tidak akan pernah kembali.

Kegagalan untuk mematuhi undang-undang peraturan tentang privasi data dapat mengakibatkan penalti keuangan yang signifikan. Mengatur data Anda akan membantu Anda menghindari risiko tersebut.

Model pengoperasian dan manfaat

Mengadopsi platform strategi data modern tidak hanya mengubah teknologi yang digunakan organisasi Anda, tetapi juga cara kerjanya.

Analitik skala cloud menyediakan panduan yang ditentukan untuk membantu Anda mempertimbangkan cara mengatur dan keterampilan orang dan tim Anda, termasuk:

  • Definisi persona, peran, dan tanggung jawab
  • Struktur yang disarankan untuk tim agile, vertikal, dan lintas domain
  • Sumber daya keterampilan, termasuk data Azure dan sertifikasi AI melalui Microsoft Learn

Penting juga untuk melibatkan pengguna akhir Anda selama proses modernisasi, dan saat Anda terus mengembangkan platform Anda dan onboarding kasus penggunaan baru.

Arsitektur

Zona landasan Azure mewakili jalur desain strategis dan status teknis target untuk lingkungan Anda. Mereka memungkinkan kemudahan penyebaran dan tata kelola untuk memberikan kelincahan dan kepatuhan yang lebih besar. Zona pendaratan Azure juga memastikan bahwa ketika aplikasi atau beban kerja baru mendarat di lingkungan Anda, infrastruktur yang tepat sudah ada. Manajemen data Azure dan zona pendaratan data dirancang dengan mempertimbangkan prinsip dasar yang sama ini dan, ketika dikombinasikan dengan elemen lain dari analitik skala cloud, dapat membantu mengaktifkan:

  • Layanan mandiri
  • Skalabilitas
  • Mulai cepat
  • Keamanan
  • Privasi
  • Operasi yang dioptimalkan

Zona arahan manajemen data

Zona pendaratan manajemen data menyediakan fondasi untuk tata kelola dan manajemen data terpusat platform Anda di seluruh organisasi Anda. Ini juga memfasilitasi komunikasi untuk menyerap data dari seluruh real estat digital Anda, termasuk infrastruktur multicloud dan hibrid.

Zona pendaratan manajemen data mendukung banyak kemampuan manajemen dan tata kelola data lainnya, seperti:

  • Katalog data
  • Klasifikasi data
  • Silsilah data
  • Manajemen kualitas data
  • Repositori pemodelan data
  • Katalog API
  • Berbagi data dan kontrak

Zona pendaratan data

Zona pendaratan data mendekatkan data dengan pengguna dan memungkinkan layanan mandiri, sambil mempertahankan manajemen dan tata kelola umum melalui koneksi ke zona pendaratan manajemen data.

Mereka menghosting layanan standar seperti jaringan, pemantauan, penyerapan dan pemrosesan data, serta kustomisasi seperti produk data dan visualisasi.

Zona pendaratan data adalah kunci untuk memungkinkan skalabilitas platform Anda. Bergantung pada ukuran dan kebutuhan organisasi Anda, Anda dapat memulai dengan satu atau beberapa zona pendaratan.

Saat Anda memutuskan antara satu dan beberapa zona pendaratan, pertimbangkan dependensi regional dan persyaratan residensi data. Misalnya, apakah ada undang-undang atau peraturan setempat yang mengharuskan data tetap berada di lokasi tertentu?

Terlepas dari keputusan awal Anda, Anda dapat menambahkan atau menghapus zona landasan data sesuai kebutuhan. Jika Anda memulai dengan satu zona pendaratan, kami sarankan Anda berencana untuk memperluas ke beberapa zona pendaratan untuk menghindari kebutuhan migrasi di masa mendatang.

Untuk informasi selengkapnya tentang zona pendaratan, lihat Zona pendaratan Azure untuk analitik skala cloud.

Kesimpulan

Setelah Anda membaca kumpulan dokumentasi ini, khususnya bagian tata kelola, keamanan, pengoperasian, dan praktik terbaik, kami sarankan Anda menyiapkan lingkungan bukti konsep dengan menggunakan templat penyebaran. Templat ini, bersama dengan panduan arsitektur, memberi Anda pengalaman langsung dengan beberapa teknologi Azure. Untuk informasi selengkapnya, lihat Daftar periksa memulai.

Langkah berikutnya

Mengintegrasikan analitik skala cloud ke dalam strategi adopsi cloud Anda