Mendemokratisasikan data dengan penemuan digital

Batubara, minyak, dan potensi manusia adalah tiga aset paling penting selama revolusi industri. Aset-aset ini membangun perusahaan, menggeser pasar, dan pada akhirnya mengubah negara. Dalam ekonomi digital, ada tiga aset yang sama pentingnya untuk inovasi: data, perangkat, dan potensi manusia. Aset ini memiliki potensi inovasi yang sangat besar. Untuk setiap upaya inovasi di era modern, data adalah minyak yang baru.

Di setiap perusahaan, terdapat data yang dapat digunakan untuk mengetahui dan memenuhi kebutuhan pelanggan. Sayangnya, proses penambangan data untuk mendorong inovasi bisa memakan biaya dan waktu, sehingga kebutuhan tidak diketahui dan solusi tidak dibuat. Demokratisasi data dapat mengatasi masalah ini.

Apa itu demokratisasi data? Ini adalah proses memberikan data ke pihak yang tepat untuk mendorong inovasi. Proses demokratisasi ini dapat memiliki beberapa bentuk, tetapi umumnya mencakup solusi untuk data mentah yang diserap atau terintegrasi, pemusatan data, berbagi data, dan pengamanan data. Ketika data didemokratisasi, para ahli di perusahaan dapat menggunakannya untuk membentuk dan menguji hipotesis. Dalam banyak kasus, tim adopsi cloud dapat membangun dengan empati pelanggan hanya dengan menggunakan data, untuk memenuhi kebutuhan pelanggan dengan cepat.

Cara mendemokratisasi data

Ada berbagai cara untuk mendemokratisasi data, tetapi sebagian besar mencakup metode pengumpulan, pemusatan, pengaturan, dan pembagian data. Bagian berikut menjelaskan beberapa metode ini. Saat Anda membangun solusi untuk hipotesis pelanggan, Anda harus menilai apakah akan mendemokratisasi data, sejauh mana, dan bagaimana melakukannya.

Proses untuk demokratisasi data, menunjukkan proses ini: mengatur, memusatkan, mengumpulkan, dan berbagi data.

Berbagi data

Ketika Anda membangun dengan empati pelanggan, kebutuhan pelanggan akan memandu solusinya. Jika kebutuhannya adalah data, solusinya memungkinkan pelanggan untuk menginterogasi, menganalisis, dan melaporkan data secara langsung, tanpa dukungan dari staf TI.

Banyak inovasi yang berhasil yang awalnya merupakan produk minimum yang layak (MVP) yang mengirimkan data ke pelanggan. MVP adalah versi produk yang memiliki fitur yang cukup untuk dapat digunakan oleh pelanggan. MVP menunjukkan kemungkinan potensi produk untuk mengumpulkan umpan balik dari pelanggan. Dalam model concierge ini, seorang karyawan adalah konsumen datanya. Karyawan tersebut menggunakan data untuk membantu pelanggan. Setiap kali pelanggan menggunakan dukungan manual, hipotesis dapat diuji dan divalidasi. Pendekatan ini sering kali merupakan cara yang hemat untuk menguji hipotesis yang berfokus pada pelanggan sebelum Anda berinvestasi besar-besaran pada solusi terintegrasi.

Alat utama untuk berbagi data secara langsung dengan konsumen data mencakup pelaporan mandiri atau data yang disematkan dalam pengalaman lain, menggunakan alat seperti Power BI.

Catatan

Sebelum Anda membagikan data, pastikan Anda telah membaca bagian berikut. Berbagi data mungkin mengharuskan tata kelola untuk memberikan perlindungan terhadap data. Selain itu, jika data mencakup beberapa cloud, data mungkin memerlukan pemusatan. Jika data berada di dalam aplikasi, Anda harus mengumpulkannya untuk membagikannya.

Mengatur data

Berbagi data dapat dengan cepat menghasilkan produk minimum yang layak untuk digunakan dalam percakapan pelanggan. Namun, untuk mengubah data yang dibagikan tersebut menjadi pengetahuan yang berguna dan dapat ditindaklanjuti, umumnya diperlukan lebih banyak data.

Setelah hipotesis divalidasi melalui berbagi data, fase pengembangan selanjutnya adalah tata kelola data.

Tata kelola data adalah topik luas yang mungkin memerlukan kerangka kerja khusus, masalah yang berada di luar cakupan Cloud Adoption Framework.

Ada beberapa aspek tata kelola data yang perlu dipertimbangkan segera setelah Anda memvalidasi hipotesis pelanggan. Contohnya:

  • Apakah data yang dibagikan sensitif?Data harus diklasifikasikan sebelum dibagikan secara publik untuk melindungi kepentingan pelanggan dan perusahaan.
  • Jika datanya sensitif, apakah sudah diamankan? Perlindungan data sensitif adalah suatu kewajiban untuk data yang didemokratisasi. Contoh beban kerja yang dibahas dalam Mengamankan solusi data memberikan beberapa referensi untuk mengamankan data.
  • Apakah data dikatalogkan? Mengidentifikasi sifat data bersama akan membantu manajemen data jangka panjang. Alat untuk mendokumentasikan data, seperti Azure Data Catalog, memudahkan proses ini di cloud. Panduan mengenai anotasi data dan dokumentasi sumber data dapat mempercepat proses ini.

Ketika demokratisasi data penting untuk hipotesis yang berfokus pada pelanggan, pastikan tata kelola data yang dibagikan ada dalam rencana rilis. Ini akan melindungi pelanggan, konsumen data, dan perusahaan.

Memusatkan data

Pemusatan data menghasilkan pelaporan yang lebih bermakna, memastikan bahwa data yang sama tersedia di seluruh organisasi, dan meningkatkan ROI Anda. Ketika data tersebar di lingkungan TI, peluang untuk berinovasi bisa sangat terbatas, mahal, dan memakan waktu. Cloud memberikan peluang baru untuk memusatkan data. Saat pemusatan beberapa sumber data diperlukan untuk membangun dengan empati pelanggan, cloud dapat mempercepat pengujian hipotesis.

Perhatian

Pemusatan data merupakan titik risiko dalam setiap proses inovasi. Ketika pemusatan data merupakan lonjakan teknis, dan bukan sumber nilai pelanggan, sebaiknya tunda pemusatan sampai hipotesis pelanggan telah divalidasi.

Saat memusatkan, Anda memerlukan penyimpanan data yang sesuai untuk data terpusat. Merupakan praktik yang baik untuk membangun gudang data di cloud. Opsi dapat diskalakan ini menyediakan lokasi terpusat untuk semua data Anda. Jenis solusi ini tersedia dalam pemrosesan analitik daring (OLAP) atau opsi big data.

Arsitektur referensi untuk solusi OLAP dan big data dapat membantu Anda memilih solusi pemusatan yang paling tepat di Azure. Jika solusi hibrid diperlukan, arsitektur referensi untuk memperluas data lokal juga dapat membantu mempercepat pengembangan solusi.

Penting

Untuk beberapa kebutuhan dan solusi pelanggan, pendekatan yang sederhana mungkin cukup. Arsitek cloud harus menantang tim untuk mempertimbangkan solusi berbiaya rendah untuk memvalidasi hipotesis pelanggan, terutama selama pengembangan awal. Bagian pengumpulan data ini membahas skenario yang mungkin menyarankan solusi yang berbeda untuk situasi Anda.

Mengumpulkan data

Dua bentuk utama pengumpulan data adalah integrasi dan penyerapan.

Integrasi: Data yang berada di penyimpanan data yang ada dapat diintegrasikan ke dalam penyimpanan data terpusat menggunakan teknik pergerakan data tradisional. Ini sangat umum untuk skenario yang melibatkan penyimpanan data multicloud. Teknik-teknik ini melibatkan ekstraksi data dari penyimpanan data yang ada dan kemudian memuatnya ke dalam penyimpanan data pusat. Pada titik tertentu dalam proses ini, data biasanya diubah menjadi lebih bermanfaat dan relevan di penyimpanan pusat.

Alat berbasis cloud telah mengubah teknik ini menjadi alat bayar per penggunaan, mengurangi hambatan masuk untuk pengumpulan dan pemusatan data. Alat seperti Azure Database Migration Service dan Azure Data Factory adalah dua contohnya. Arsitektur referensi untuk Data Factory dengan penyimpanan data OLAP adalah contoh dari salah satu solusi tersebut.

Penyerapan: Beberapa data tidak berada di penyimpanan data yang sudah ada. Jika data sementara ini merupakan sumber utama inovasi, sebaiknya pertimbangkan pendekatan alternatif. Data sementara dapat ditemukan di berbagai sumber yang ada seperti aplikasi, API, aliran, perangkat IoT, blockchain, cache aplikasi, dalam konten media, atau bahkan dalam file datar.

Anda dapat mengintegrasikan berbagai bentuk data ini ke dalam penyimpanan data pusat pada solusi big data atau OLAP. Namun, untuk iterasi awal siklus bangun-ukur-pelajari, solusi pemrosesan transaksional online (OLTP) mungkin cukup untuk memvalidasi hipotesis pelanggan. Solusi OLTP bukanlah pilihan terbaik untuk skenario pelaporan apa pun. Namun, saat Anda membangun dengan empati pelanggan, lebih penting untuk berfokus pada kebutuhan pelanggan daripada pada keputusan alat teknis. Setelah hipotesis pelanggan divalidasi dalam skala besar, mungkin diperlukan platform yang lebih cocok. Arsitektur referensi pada penyimpanan data OLTP dapat membantu Anda menentukan penyimpanan data mana yang paling sesuai untuk solusi Anda.

Virtualisasi: Integrasi dan penyerapan data terkadang dapat memperlambat inovasi. Ketika solusi untuk virtualisasi data sudah tersedia, itu mungkin mewakili pendekatan yang lebih masuk akal. Penyerapan dan integrasi dapat menduplikasi persyaratan pengembangan dan penyimpanan, menambahkan latensi data, meningkatkan area permukaan serangan, memicu masalah kualitas, dan meningkatkan upaya tata kelola. Virtualisasi data adalah alternatif yang lebih modern, yang meninggalkan data asli di satu lokasi dan membuat kueri yang di-cache atau pass-through dari data sumber.

SQL Server 2017 dan Azure SQL Data Warehouse mendukung PolyBase, yang merupakan pendekatan virtualisasi data yang paling umum digunakan di Azure.

Langkah berikutnya

Dengan strategi untuk mendemokrasikan data, selanjutnya Anda perlu mengevaluasi pendekatan terhadap pengembangan aplikasi.