Apa itu Cosmos DB (di Azure dan Fabric)

Cosmos DB adalah mesin database NoSQL terdistribusi yang dibangun untuk latensi rendah yang dapat diprediksi, skala horizontal elastis, dan ketersediaan global. Gunakan Cosmos DB untuk menyimpan data JSON semi terstruktur dengan pengindeksan otomatis, kueri cepat, dan dukungan untuk kueri seperti SQL, operasi geospasial, teks lengkap, dan pencarian vektor. Gambaran umum ini menjelaskan kemampuan inti, tujuan desain, dan bagaimana Cosmos DB membantu Anda membangun aplikasi latensi rendah yang didistribusikan secara global di Azure dan Microsoft Fabric.

Tujuan dan kemampuan desain inti

Mesin menangani dokumen JSON yang fleksibel dan berlapis tanpa menentukan skema sebelumnya, memungkinkan penyimpanan dan perulangan skema-agnostik. Mesin menyalin data di berbagai wilayah. Penyiapan ini merutekan permintaan ke wilayah terdekat untuk pembacaan cepat. Sistem menskalakan dengan membagi data menjadi partisi logis. Partisi ini memetakan ke partisi fisik. Desain ini memungkinkan kontainer menskalakan throughput dan penyimpanan sendiri.

Aplikasi dapat memilih dari beberapa model konsistensi untuk menukar latensi dan kebenaran. Mesin menggunakan model Unit Permintaan (RU) yang menyediakan throughput yang dapat diprediksi dan abstraksi biaya untuk baca, tulis, dan kueri. Mesin mengindeks semua data secara otomatis secara default. Anda dapat membuat kebijakan pengindeksan kustom untuk mengoptimalkan performa kueri. Kebijakan ini mendukung indeks rentang, indeks spasial, indeks komposit, dan indeks vektor. Mesin kueri yang kaya mendukung kueri seperti SQL deklaratif, agregat, fungsi skalar, dan integrasi dengan API lain yang dibangun di mesin yang sama.

Masalah operasional umum

Hindari partisi panas dan tetap berada dalam batas partisi logis dengan memilih kunci partisi yang menyeimbangkan distribusi data dan pola kueri. Untuk pengindeksan, andalkan pengindeksan semua properti default untuk pengembangan cepat, lalu persempit kebijakan pengindeksan atau tambahkan indeks komposit dan vektor untuk mengoptimalkan biaya dan latensi kueri untuk beban kerja produksi. Pilih tingkat konsistensi yang sesuai untuk persyaratan kebenaran dan latensi Anda. Sesi adalah default umum untuk banyak aplikasi.

Skenario

Mesin Cosmos DB dirancang untuk aplikasi terdistribusi secara global latensi rendah seperti game, e-niaga, dan penyerapan IoT. Mesin mendukung analitik real time dan pencarian hibrid. Ini menggunakan fitur pencarian teks lengkap dan vektor bawaan. Anda dapat menggunakannya sebagai basis untuk penyimpanan fitur AI dan ML. Ini juga berfungsi dengan baik untuk menyematkan indeks. Fleksibilitas ini terutama berlaku ketika Anda menggunakan koneksi Fabric.

Implementasi

Mesin Cosmos DB diimplementasikan dalam dua layanan yang memiliki teknologi inti yang sama sambil menyediakan model operasional dan kemampuan integrasi yang berbeda.

Azure Cosmos DB

Azure Cosmos DB adalah layanan database cloud terkelola penuh yang menggunakan mesin Cosmos DB untuk memberikan dukungan untuk mengkueri item dengan skema fleksibel dan dukungan asli untuk JSON. Ini menawarkan distribusi global dengan replikasi multi-wilayah, memungkinkan aplikasi untuk mencapai pembacaan dan penulisan latensi rendah di seluruh wilayah geografis. Layanan ini memberikan kontrol terperindeks atas provisi throughput, kebijakan pengindeksan, dan tingkat konsistensi, memungkinkan Anda mengoptimalkan performa dan biaya untuk beban kerja spesifik Anda. Azure Cosmos DB terintegrasi dengan layanan Azure. Layanan ini mendukung kit pengembangan perangkat lunak (SDK) untuk .NET, Java, Python, Node.js, dan Go. Kompatibilitas ini membuatnya cocok untuk aplikasi misi penting. Aplikasi ini memerlukan performa yang dapat diprediksi dan ketersediaan tinggi.

Untuk informasi selengkapnya tentang Azure Cosmos DB, lihat dokumentasi Azure Cosmos DB.

Cosmos DB di Microsoft Fabric

Cosmos DB di Microsoft Fabric adalah database NoSQL yang dioptimalkan AI dengan pengalaman manajemen yang disederhanakan yang menggunakan mesin dan infrastruktur Cosmos DB yang sama. Cosmos DB dalam Fabric terintegrasi erat ke dalam Fabric, menyediakan default otonom yang dioptimalkan untuk sebagian besar beban kerja aplikasi dan menghilangkan tugas manajemen database yang khas. Data di Cosmos DB muncul secara otomatis di Fabric OneLake. Data menggunakan format Delta Parquet. Format ini memungkinkan analitik yang berjalan mendekati real-time. Anda dapat menjalankan kueri yang dijalankan di berbagai database. Anda dapat membuat visualisasi Power BI. Layanan ini terintegrasi dengan alat ilmu data. Alat-alat ini termasuk notebook dan Lakehouse. Layanan ini mencakup fitur AI bawaan. Fitur-fitur ini termasuk pencarian teks lengkap, pencarian hibrid, dan pengindeksan vektor. Alat-alat ini memudahkan untuk membangun aplikasi AI. Anda dapat membangun dengan lebih sedikit gesekan saat Anda menyimpan model data yang fleksibel. Layanan ini mempertahankan penskalakan otomatis dan performa cepat yang disediakan mesin inti.

Untuk informasi selengkapnya tentang Cosmos DB di Microsoft Fabric, lihat Cosmos DB di Microsoft Fabric.