Baca dalam bahasa Inggris

Bagikan melalui


Pengambilan Augmented Generation (RAG) di Azure Cosmos DB

Retrieval Augmented Generation (RAG) menggabungkan kekuatan model bahasa besar (LLM) dengan sistem pengambilan informasi yang kuat untuk menciptakan respons yang lebih akurat dan relevan secara kontekstual. Tidak seperti model generatif tradisional yang hanya mengandalkan data yang telah dilatih sebelumnya, arsitektur RAG meningkatkan kemampuan LLM dengan mengintegrasikan pengambilan informasi real-time. Augmentasi ini memastikan respons tidak hanya generatif tetapi juga di-grounded dalam data terbaru yang paling relevan yang tersedia.

Azure Cosmos DB, database operasional yang mendukung pencarian vektor, menonjol sebagai platform yang sangat baik untuk menerapkan RAG. Kemampuannya untuk menangani beban kerja operasional dan analitik dalam satu database, bersama dengan fitur canggih seperti kunci partisi multitenansi dan hierarkis, menyediakan fondasi yang kuat untuk membangun aplikasi AI generatif yang canggih.

Keuntungan Utama Menggunakan Azure Cosmos DB

Penyimpanan dan pengambilan data terpadu

Azure Cosmos DB memungkinkan integrasi kemampuan pencarian vektor yang mulus dalam sistem database terpadu. Ini berarti bahwa data operasional Anda dan data vektorisasi hidup berdampingan, menghilangkan kebutuhan akan sistem pengindeksan terpisah.

Penyerapan dan kueri data real time

Azure Cosmos DB mendukung penyerapan dan kueri real time, sehingga ideal untuk aplikasi AI. Ini sangat penting untuk arsitektur RAG, di mana kesegaran data dapat secara signifikan berdampak pada relevansi respons yang dihasilkan.

Skalabilitas dan distribusi global

Dirancang untuk aplikasi skala besar, Azure Cosmos DB menawarkan distribusi global dan skala otomatis instan. Ini memastikan bahwa aplikasi berkemampuan RAG Anda dapat menangani volume kueri tinggi dan memberikan performa yang konsisten terlepas dari lokasi pengguna.

Ketersediaan dan keandalan tinggi

Azure Cosmos DB menawarkan SLA komprehensif untuk throughput, latensi, dan ketersediaan. Keandalan ini memastikan bahwa sistem RAG Anda selalu tersedia untuk menghasilkan respons dengan waktu henti minimal.

Multitenansi dengan kunci partisi hierarkis

Azure Cosmos DB mendukung multitenansi melalui berbagai model isolasi performa dan keamanan, sehingga lebih mudah untuk mengelola data untuk klien atau grup pengguna yang berbeda dalam database yang sama. Fitur ini sangat berguna untuk aplikasi SaaS di mana pemisahan data penyewa sangat penting untuk keamanan dan kepatuhan.

Fitur keamanan komprehensif

Dengan fitur bawaan seperti enkripsi end-to-end, kontrol akses berbasis peran (RBAC), dan integrasi jaringan virtual (VNet), Azure Cosmos DB memastikan bahwa data Anda tetap aman. Langkah-langkah keamanan ini sangat penting untuk aplikasi RAG tingkat perusahaan yang menangani informasi sensitif.

Menerapkan RAG dengan Azure Cosmos DB

Tip

Untuk sampel RAG, kunjungi: AzureDataRetrievalAugmentedGenerationSamples

Berikut adalah proses yang disederhanakan untuk membangun aplikasi RAG dengan Azure Cosmos DB:

  1. Penyerapan Data: Simpan dokumen, gambar, dan tipe konten lainnya di Azure Cosmos DB. Gunakan dukungan database untuk pencarian vektor untuk mengindeks dan mengambil konten vektor.
  2. Eksekusi Kueri: Saat pengguna mengirimkan kueri, Azure Cosmos DB dapat dengan cepat mengambil data yang paling relevan menggunakan kemampuan pencarian vektornya.
  3. Integrasi LLM: Teruskan data yang diambil ke LLM (misalnya, Azure OpenAI) untuk menghasilkan respons. Data terstruktur baik yang disediakan oleh Cosmos DB meningkatkan kualitas output model.
  4. Pembuatan Respons: LLM memproses data dan menghasilkan respons komprehensif, yang kemudian dikirimkan kepada pengguna.