Menggunakan gudang data modern untuk bisnis kecil dan menengah

Azure Data Lake
Azure SQL Database
Microsoft Fabric

Artikel ini menjelaskan beberapa cara agar bisnis kecil dan menengah (UKM) dapat memodernisasi penyimpanan data warisan dan menjelajahi alat dan kemampuan big data tanpa anggaran dan kumpulan keterampilan yang terlalu mendasar saat ini. Solusi pergudangan data komprehensif ini terintegrasi dengan azure Pembelajaran Mesin, layanan Azure AI, Microsoft Power Platform, Microsoft Dynamics 365, dan teknologi Microsoft lainnya. Solusi ini memberikan titik masuk yang mudah ke platform data software as a service (SaaS) yang dikelola sepenuhnya di Microsoft Fabric yang dapat diperluas seiring pertumbuhan kebutuhan Anda.

SMB yang menggunakan SQL Server lokal untuk solusi pergudangan data di bawah 500 GB mungkin mendapat manfaat dari penggunaan pola ini. Mereka menggunakan berbagai alat untuk penyerapan data ke dalam solusi pergudangan data mereka, termasuk SQL Server Integration Services (SSIS), SQL Server Analysis Services (SSAS), SQL Server Reporting Services (SSRS), prosedur tersimpan SQL umum, ekstrak eksternal, transformasi, dan pemuatan (ETL) dan mengekstrak, memuat, mengubah (ELT), pekerjaan SQL Server Agent, dan replikasi rekam jepret SQL. Operasi sinkronisasi data biasanya berbasis rekam jepret, dilakukan sekali sehari, dan tidak memiliki persyaratan pelaporan real time.

Arsitektur yang disederhanakan

Diagram yang mengilustrasikan arsitektur SMB yang disederhanakan.

Unduh file Visio arsitektur ini.

Peluang modernisasi konseptual melibatkan transisi solusi pergudangan data warisan ke kombinasi Azure SQL Database, Azure SQL Managed Instance, dan Fabric. Strategi ini memastikan kompatibilitas luas dengan alat klien SQL Server dan SQL tradisional seperti SQL Server Management Studio (SSMS). Ini juga menyediakan opsi lift-and-shift untuk proses yang ada dan membutuhkan upskilling minimal untuk tim dukungan. Solusi ini berfungsi sebagai langkah awal menuju modernisasi komprehensif, yang memungkinkan organisasi untuk sepenuhnya mengadopsi pendekatan lakehouse saat gudang data berkembang dan set keterampilan tim tumbuh.

Sistem

Diagram yang menggambarkan arsitektur diperluas yang dirancang untuk memenuhi kebutuhan di masa depan.

Unduh file Visio arsitektur ini.

Gudang data SMB warisan dapat berisi beberapa jenis data:

  • Data yang tidak terstruktur, seperti dokumen dan grafik.

  • Data semi-terstruktur, seperti log, CSV, JSON, dan file XML.

  • Data relasional terstruktur, termasuk database yang menggunakan prosedur tersimpan untuk aktivitas ETL dan ELT.

Aliran data

Aliran data berikut sesuai dengan diagram sebelumnya. Ini menunjukkan penyerapan jenis data yang Anda pilih:

  1. Alur data fabric atau alur Azure Data Factory mengatur penyerapan data transaksional ke dalam solusi pergudangan data.

    • Alur mengatur alur database warisan yang dimigrasikan atau direfaktor sebagian dan paket SSIS ke SQL Database dan SQL Managed Instance. Anda dapat dengan cepat menerapkan pendekatan lift-and-shift ini, yang memastikan transisi yang mulus dari solusi SQL lokal ke lingkungan Fabric SaaS di masa depan. Anda dapat memodernisasi database secara bertahap setelah lift dan shift.

    • Alur dapat meneruskan data yang tidak terstruktur, semi terstruktur, dan terstruktur ke Azure Data Lake Storage untuk penyimpanan dan analisis terpusat dengan sumber lain. Gunakan pendekatan ini saat menggabungkan data memberikan lebih banyak manfaat bisnis daripada mereplatformasi data.

  2. Gunakan sumber data Microsoft Dynamics 365 untuk membangun dasbor kecerdasan bisnis terpusat (BI) pada himpunan data tambahan dengan menggunakan alat analisis tanpa server Fabric. Anda dapat membawa data yang menyatu dan diproses kembali ke Dynamics dan menggunakannya untuk analisis lebih lanjut dalam Fabric.

  3. Data real time dari sumber streaming dapat memasuki sistem melalui Azure Event Hubs atau solusi streaming lainnya. Untuk pelanggan dengan persyaratan dasbor real time, Fabric Real-Time Analytics dapat segera menganalisis data ini.

  4. Data dapat diserap ke dalam Fabric OneLake terpusat untuk analisis, penyimpanan, dan pelaporan lebih lanjut dengan menggunakan pintasan Data Lake Storage. Proses ini memungkinkan analisis di tempat dan memfasilitasi konsumsi hilir.

  5. Alat analisis tanpa server, seperti titik akhir SQL Analytics dan kemampuan Fabric Spark, tersedia sesuai permintaan di dalam Fabric dan tidak memerlukan sumber daya yang disediakan. Alat analisis tanpa server sangat ideal untuk:

    • Aktivitas ETL dan ELT pada data OneLake.

    • Menyajikan lapisan emas arsitektur medali ke laporan Power BI melalui fitur DirectLake.

    • Eksplorasi ilmu data improvisasi dalam format T-SQL atau Python.

    • Pembuatan prototipe awal untuk entitas gudang data.

Fabric terintegrasi erat dengan calon konsumen himpunan data multisource Anda, termasuk laporan front-end Power BI, Pembelajaran Mesin, Power Apps, Azure Logic Apps, Azure Functions, dan aplikasi web Azure App Service.

Komponen

  • Fabric adalah layanan analitik yang menggabungkan kemampuan rekayasa data, pergudangan data, ilmu data, dan data real time dan BI. Dalam solusi ini, kemampuan rekayasa data Fabric menyediakan platform kolaboratif untuk insinyur data, ilmuwan data, analis data, dan profesional BI. Komponen kunci ini didukung oleh mesin komputasi tanpa server dan memberikan nilai bisnis dengan menghasilkan wawasan yang didistribusikan kepada pelanggan.

  • SQL Database dan SQL Managed Instance adalah layanan database relasional berbasis cloud. SQL Database dan SQL Managed Instance menggunakan SSMS untuk mengembangkan dan memelihara artefak warisan seperti prosedur tersimpan. Dalam solusi ini, layanan ini menghosting gudang data perusahaan dan melakukan aktivitas ETL dan ELT dengan menggunakan prosedur tersimpan atau paket eksternal. SQL Database dan SQL Managed Instance adalah lingkungan platform as a service (PaaS) yang dapat Anda gunakan untuk memenuhi persyaratan ketersediaan tinggi dan pemulihan bencana. Pastikan untuk memilih SKU yang memenuhi kebutuhan Anda. Untuk informasi selengkapnya, lihat Ketersediaan tinggi untuk SQL Database dan Ketersediaan tinggi untuk SQL Managed Instance.

  • SQL Server Management Studio adalah lingkungan terintegrasi untuk mengelola infrastruktur SQL yang dapat Anda gunakan untuk mengembangkan dan memelihara artefak warisan, seperti prosedur tersimpan.

  • Event Hubs adalah platform streaming data real time dan layanan penyerapan peristiwa. Azure Event Hubs terintegrasi dengan layanan data Azure dengan lancar dan dapat menyerap data dari mana saja.

Alternatif

  • Anda dapat menggunakan Azure IoT Hub untuk mengganti atau melengkapi Event Hubs. Pilih solusi Anda berdasarkan sumber data streaming Anda dan apakah Anda memerlukan kloning dan komunikasi dua arah dengan perangkat pelaporan.

  • Anda dapat menggunakan alur data Fabric alih-alih alur Data Factory untuk integrasi data. Keputusan Anda akan tergantung pada beberapa faktor. Untuk informasi selengkapnya, lihat Mendapatkan dari Azure Data Factory ke Data Factory di Fabric.

  • Anda dapat menggunakan Fabric Warehouse alih-alih SQL Database atau SQL Managed Instance untuk menyimpan data perusahaan. Artikel ini memprioritaskan waktu pasar bagi pelanggan yang ingin memodernisasi gudang data mereka. Untuk informasi selengkapnya tentang opsi penyimpanan data untuk Fabric, lihat Panduan keputusan Fabric.

Detail skenario

Ketika UKM memodernisasi gudang data lokal mereka untuk cloud, mereka dapat mengadopsi alat big data untuk skalabilitas di masa depan atau menggunakan solusi berbasis SQL tradisional untuk efisiensi biaya, kemudahan pemeliharaan, dan transisi yang lancar. Pendekatan hibrid memberikan yang terbaik dari kedua dunia dan memungkinkan migrasi yang mudah dari data estate yang ada sambil menggunakan alat modern dan kemampuan AI. UKM dapat menjaga sumber data berbasis SQL mereka tetap berjalan di cloud dan memodernisasinya sesuai kebutuhan.

Artikel ini menjelaskan beberapa strategi bagi UKM untuk memodernisasi penyimpanan data warisan dan menjelajahi alat dan kemampuan big data tanpa membentangkan anggaran dan set keterampilan saat ini. Solusi pergudangan data Azure yang komprehensif ini terintegrasi dengan Azure dan layanan Microsoft, termasuk layanan AI, Microsoft Dynamics 365, dan Microsoft Power Platform.

Kemungkinan kasus penggunaan

  • Migrasikan gudang data relasional lokal tradisional yang kurang dari 1 TB dan menggunakan paket SSIS untuk mengatur prosedur tersimpan.

  • Mesh data Dynamics atau Microsoft Power Platform Dataverse yang ada dengan sumber Data Lake batch dan real time.

  • Gunakan teknik inovatif untuk berinteraksi dengan data Azure Data Lake Storage Gen2 terpusat. Teknik ini termasuk analisis tanpa server, penambangan pengetahuan, fusi data antara domain, dan eksplorasi data pengguna akhir, termasuk Fabric Copilot.

  • Siapkan perusahaan e-niaga untuk mengadopsi gudang data untuk mengoptimalkan operasi mereka.

Solusi ini tidak disarankan untuk:

  • Penyebaran gudang data greenfield.

  • Migrasi gudang data lokal yang lebih besar dari 1 TB atau diproyeksikan mencapai ukuran tersebut dalam setahun.

Pertimbangan

Pertimbangan ini mengimplementasikan pilar Azure Well-Architected Framework, yang merupakan serangkaian tenet panduan yang dapat digunakan untuk meningkatkan kualitas beban kerja. Untuk informasi selengkapnya, lihat Microsoft Azure Well-Architected Framework.

Pengoptimalan biaya

Optimalisasi biaya adalah tentang mencari cara untuk mengurangi pengeluaran yang tidak perlu dan meningkatkan efisiensi operasional. Untuk informasi selengkapnya, lihat Daftar periksa tinjauan desain untuk Pengoptimalan Biaya.

  • Kalkulator harga Azure memungkinkan Anda memodifikasi nilai untuk memahami bagaimana persyaratan spesifik Anda memengaruhi biaya. Anda dapat melihat sampel harga untuk skenario pergudangan data SMB di kalkulator harga Azure.

  • Harga SQL Database tergantung pada tingkat komputasi dan layanan yang Anda pilih dan jumlah unit transaksi vCore dan database. Contoh menjelaskan database tunggal dengan komputasi yang disediakan dan delapan vCore dan mengasumsikan bahwa Anda perlu menjalankan prosedur tersimpan di SQL Database.

  • Harga Data Lake Storage Gen2 tergantung pada jumlah data yang Anda simpan dan seberapa sering Anda menggunakan data. Harga sampel mencakup 1 TB penyimpanan data dan asumsi transaksi lainnya. 1 TB mengacu pada ukuran data lake dan bukan ukuran database warisan asli.

  • Harga Fabric tergantung pada harga kapasitas Fabric F atau harga Premium Per Orang. Kemampuan tanpa server menggunakan CPU dan memori dari kapasitas khusus yang Anda beli.

  • Harga Azure Event Hubs tergantung pada tingkat yang Anda pilih, jumlah unit throughput yang disediakan, dan lalu lintas masuk yang diterima. Contohnya mengasumsikan satu unit throughput dalam penanganan tingkat Standar lebih dari satu juta peristiwa per bulan.

Kontributor

Artikel ini dikelola oleh Microsoft. Ini awalnya ditulis oleh kontributor berikut.

Penulis utama:

Untuk melihat profil LinkedIn non-publik, masuk ke LinkedIn.

Langkah berikutnya