Bagikan melalui


Analitik dan Kecerdasan Bisnis (BI) pada data Azure Cosmos DB Anda

Azure Cosmos DB menawarkan berbagai opsi untuk mengaktifkan analitik skala besar dan pelaporan BI pada data operasional Anda.

Untuk mendapatkan wawasan yang bermakna tentang data Azure Cosmos DB, Anda mungkin perlu mengkueri di beberapa partisi, koleksi, atau database. Dalam beberapa kasus, Anda mungkin menggabungkan data ini dengan sumber data lain di organisasi Anda seperti Azure SQL Database, Azure Data Lake Storage Gen2, dll. Anda mungkin juga mengkueri dengan fungsi agregat seperti jumlah, hitungan, dll. Kueri tersebut membutuhkan daya komputasi yang berat, yang kemungkinan mengonsumsi lebih banyak unit permintaan (RU) dan sebagai hasilnya, kueri ini mungkin berpotensi memengaruhi performa beban kerja penting misi Anda.

Untuk mengisolasi beban kerja transaksional dari dampak performa kueri analitik yang kompleks, data database diserap malam hari ke lokasi pusat menggunakan alur Extract-Transform-Load (ETL) yang kompleks. Analitik berbasis ETL semacam itu kompleks, mahal dengan wawasan yang tertunda tentang data bisnis.

Azure Cosmos DB mengatasi tantangan ini dengan memberikan penawaran analitik tanpa ETL dan hemat biaya.

Zero ETL, analitik mendekati real-time di Azure Cosmos DB

Azure Cosmos DB menawarkan nol ETL, analitik mendekati real-time pada data Anda tanpa memengaruhi performa beban kerja transaksional atau unit permintaan (RU). Penawaran ini menghapus kebutuhan akan alur ETL yang kompleks, membuat data Azure Cosmos DB Anda tersedia dengan mulus untuk mesin analitik. Dengan berkurangnya latensi terhadap wawasan, Anda dapat memberikan pengalaman pelanggan yang ditingkatkan dan bereaksi lebih cepat terhadap perubahan kondisi pasar atau lingkungan bisnis. Berikut adalah beberapa skenario sampel yang dapat Anda capai dengan wawasan cepat tentang data Anda.

Anda dapat mengaktifkan analitik nol-ETL dan pelaporan BI di Azure Cosmos DB menggunakan opsi berikut:

  • Mencerminkan data Anda ke Microsoft Fabric
  • Mengaktifkan Azure Synapse Link untuk mengakses data dari Azure Synapse Analytics

Opsi 1: Mencerminkan data Azure Cosmos DB Anda ke Microsoft Fabric

Pencerminan memungkinkan Anda membawa data database Azure Cosmos DB Anda dengan lancar ke Microsoft Fabric. Dengan nol ETL, Anda bisa mendapatkan wawasan bisnis yang cepat dan kaya tentang data Azure Cosmos DB Anda menggunakan kemampuan analitik, BI, dan AI bawaan Fabric.

Data operasional Cosmos DB Anda direplikasi secara bertahap ke Fabric OneLake mendekati real-time. Data di OneLake disimpan dalam format Delta Parquet sumber terbuka dan tersedia untuk semua mesin analitik di Fabric. Dengan akses terbuka, Anda dapat menggunakannya dengan berbagai layanan Azure seperti Azure Databricks, Azure HDInsight, dan banyak lagi. OneLake juga membantu menyatukan data estate Anda untuk kebutuhan analitis Anda. Data yang dicerminkan dapat digabungkan dengan data lain di OneLake, seperti Lakehouses, Gudang, atau pintasan. Anda juga dapat menggabungkan data Azure Cosmos DB dengan sumber database cermin lainnya seperti Azure SQL Database, Snowflake. Anda dapat mengkueri di seluruh koleksi atau database Azure Cosmos DB yang dicerminkan ke dalam OneLake.

Dengan Mirroring in Fabric, Anda tidak perlu mengumpulkan layanan yang berbeda dari beberapa vendor. Sebagai gantinya, Anda dapat menikmati produk yang sangat terintegrasi, end-to-end, dan mudah digunakan yang dirancang untuk menyederhanakan kebutuhan analitik Anda. Anda dapat menggunakan T-SQL untuk menjalankan kueri agregat kompleks dan Spark untuk eksplorasi data. Anda dapat mengakses data dengan lancar di notebook, menggunakan ilmu data untuk membangun model pembelajaran mesin, dan membuat laporan Power BI menggunakan Direct Lake yang didukung oleh integrasi Copilot yang kaya.

Diagram pencerminan Azure Cosmos DB di Microsoft Fabric.

Jika Anda mencari analitik pada data operasional Anda di Azure Cosmos DB, pencerminan menyediakan:

  • Zero ETL, analitik mendekati real-time hemat biaya pada data Azure Cosmos DB tanpa memengaruhi konsumsi unit permintaan (RU) Anda
  • Kemudahan membawa data di berbagai sumber ke Fabric OneLake.
  • Peningkatan performa kueri mesin SQL yang menangani tabel delta, dengan pengoptimalan urutan V
  • Peningkatan waktu mulai dingin untuk mesin Spark dengan integrasi mendalam dengan ML/notebook
  • Integrasi satu klik dengan Power BI dengan Direct Lake dan Copilot
  • Integrasi aplikasi yang lebih kaya untuk mengakses kueri dan tampilan dengan GraphQL
  • Membuka akses ke dan dari layanan lain seperti Azure Databricks

Untuk mulai mencerminkan, kunjungi "Mulai tutorial pencerminan".

Azure Synapse Link untuk Azure Cosmos DB membuat integrasi yang ketat antara Azure Cosmos DB dan Azure Synapse Analytics, memungkinkan nol ETL, analitik mendekati real time pada data operasional Anda. Data transaksional disinkronkan dengan mulus ke penyimpanan Analitik, yang menyimpan data dalam format kolom yang dioptimalkan untuk analitik.

Azure Synapse Analytics dapat mengakses data ini di penyimpanan Analytical, tanpa pergerakan lebih lanjut, menggunakan Azure Synapse Link. Analis bisnis, teknisi data, dan ilmuwan data sekarang dapat menggunakan Synapse Spark atau Synapse SQL secara bergantian untuk menjalankan kecerdasan bisnis, analitik, dan alur pembelajaran mesin mendekati real-time.

Citra berikut menunjukkan integrasi Azure Synapse Link dengan Azure Cosmos DB dan Azure Synapse Analytics:

Diagram of Azure Cosmos DB Synapse Link.

Penting

Pencerminan di Microsoft Fabric sekarang tersedia dalam pratinjau untuk NoSql API. Fitur ini menyediakan semua kemampuan Azure Synapse Link dengan performa analitik yang lebih baik, kemampuan untuk menyatukan data estate Anda dengan Fabric OneLake dan membuka akses ke data Anda di OneLake dengan format Delta Parquet. Jika Anda mempertimbangkan Azure Synapse Link, kami sarankan Anda mencoba mencerminkan untuk menilai kecocokan keseluruhan untuk organisasi Anda. Untuk mulai menggunakan pencerminan, klik di sini.

Untuk mulai menggunakan Azure Synapse Link, kunjungi "Mulai menggunakan Azure Synapse Link".

Analitik real time dan BI di Azure Cosmos DB: Opsi lainnya

Ada beberapa opsi lain untuk mengaktifkan analitik real time pada data Azure Cosmos DB:

Meskipun opsi ini disertakan untuk kelengkapan dan bekerja dengan baik dengan kueri partisi tunggal secara real time, metode ini memiliki tantangan berikut untuk kueri analitik:

  • Dampak performa pada beban kerja Anda:

    Kueri analitik cenderung kompleks dan mengonsumsi kapasitas komputasi yang signifikan. Saat kueri ini dijalankan terhadap data Azure Cosmos DB Anda secara langsung, Anda mungkin mengalami penurunan performa pada kueri transaksional Anda.

  • Dampak biaya:

    Saat kueri analitik dijalankan langsung terhadap database atau koleksi Anda, kueri analitik meningkatkan kebutuhan unit permintaan yang dialokasikan, karena kueri analitik cenderung kompleks dan membutuhkan lebih banyak daya komputasi. Peningkatan penggunaan RU kemungkinan akan menyebabkan dampak biaya yang signifikan dari waktu ke waktu, jika Anda menjalankan kueri agregat.

Alih-alih opsi ini, kami sarankan Anda menggunakan Mirroring di Microsoft Fabric atau Azure Synapse Link, yang menyediakan analitik ETL nol, tanpa memengaruhi performa beban kerja transaksional atau unit permintaan.