Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Retrieval-augmented generation (RAG) adalah teknik kuat yang menggabungkan model bahasa besar (LLM) dengan pengambilan data real time untuk menghasilkan respons yang lebih akurat, up-to-date, dan relevan secara kontekstual.
Pendekatan ini sangat berharga untuk menjawab pertanyaan tentang informasi kepemilikan, sering berubah, atau khusus domain.
Apa itu generasi yang ditingkatkan oleh pengambilan informasi?
Dalam bentuk paling sederhana, agen RAG melakukan hal berikut:
- Pengambilan: Permintaan pengguna digunakan untuk mengkueri pangkalan pengetahuan luar seperti penyimpanan vektor, pencarian kata kunci, atau database SQL. Tujuannya adalah untuk mendapatkan data pendukung untuk respons LLM.
- Augmentasi: Data pendukung dikombinasikan dengan permintaan pengguna, sering menggunakan templat dengan pemformatan dan instruksi tambahan ke LLM, untuk membuat permintaan.
- Generasi: Perintah diteruskan ke LLM untuk menghasilkan respons terhadap permintaan pengguna.
Manfaat RAG
RAG meningkatkan LLM dengan cara berikut:
- Pengetahuan kepemilikan: RAG dapat menyertakan informasi kepemilikan yang awalnya tidak digunakan untuk melatih LLM, seperti memo, email, dan dokumen untuk menjawab pertanyaan khusus domain.
- Informasi terbaru: Aplikasi RAG dapat menyediakan LLM dengan informasi dari pangkalan pengetahuan yang diperbarui.
- Mengutip sumber: RAG memungkinkan LLM untuk mengutip sumber tertentu, memungkinkan pengguna memverifikasi akurasi respons faktual.
- Daftar keamanan data dan kontrol akses (ACL): Langkah pengambilan dapat dirancang untuk mengambil informasi pribadi atau kepemilikan secara selektif berdasarkan kredensial pengguna.
Komponen RAG
Aplikasi RAG umum melibatkan beberapa tahap:
Alur data: Pra-proses dan indeks dokumen, tabel, atau data lainnya untuk pengambilan yang cepat dan akurat.
Rantai RAG (Retrieval, Augmentasi, Generasi): Panggil serangkaian (atau rantai) langkah untuk:
- Pahami pertanyaan pengguna.
- Mengambil data pendukung.
- Memperkuat prompt dengan data pendukung.
- Hasilkan respons dari LLM menggunakan perintah tambahan.
Evaluasi dan pemantauan: Menilai aplikasi RAG untuk menentukan kualitas, biaya, dan latensinya untuk memastikan aplikasi memenuhi persyaratan bisnis Anda.
Tata kelola dan LLMOps: Melacak dan mengelola siklus hidup setiap komponen, termasuk silsilah data dan kontrol akses.
Jenis data RAG: terstruktur dan tidak terstruktur
Arsitektur RAG dapat bekerja dengan data pendukung yang tidak terstruktur atau terstruktur. Data yang Anda gunakan dengan RAG tergantung pada kasus penggunaan Anda.
Data yang tidak terstruktur: Data tanpa struktur atau organisasi tertentu.
- Dokumen Google/Office
- Wiki
- Gambar
- Video
Data terstruktur: Data tabular yang disusun dalam baris dan kolom dengan skema tertentu, seperti tabel dalam database.
- Catatan pelanggan dalam sistem BI atau Gudang Data
- Data transaksi dari database SQL
- Data dari API aplikasi (misalnya, SAP, Salesforce, dll.)
Evaluasi & pemantauan
Evaluasi dan pemantauan membantu menentukan apakah aplikasi RAG Anda memenuhi persyaratan kualitas, biaya, dan latensi Anda. Evaluasi terjadi selama pengembangan, sementara pemantauan terjadi setelah aplikasi disebarkan ke produksi.
RAG atas data yang tidak terstruktur memiliki banyak komponen yang berdampak pada kualitas. Misalnya, perubahan pemformatan data dapat memengaruhi potongan yang diambil dan kemampuan LLM untuk menghasilkan respons yang relevan. Jadi, penting untuk mengevaluasi komponen individual selain aplikasi keseluruhan.
Untuk informasi selengkapnya, lihat Evaluasi Agen AI Mosaik (MLflow 2).
RAG di Databricks
Databricks menawarkan platform end-to-end untuk pengembangan RAG, termasuk:
- Alur data terintegrasi dengan Delta Lake dan Lakeflow Declarative Pipelines
- Pencarian vektor yang dapat diskalakan dengan Pencarian Vektor Databricks
- Alat penyajian model dan pengelolaan orkestrasi
- Evaluasi Gen AI untuk meningkatkan performa dan kualitas
- Pemantauan Gen AI untuk aplikasi RAG yang disebarkan
- Tata kelola dan keamanan bawaan, lihat Pusat Keamanan dan Kepercayaan dan Gateway AI.
Langkah selanjutnya
Pelajari tentang alur data, komponen utama aplikasi RAG. Lihat Membangun alur data yang tidak terstruktur untuk RAG
Gunakan AI Playground untuk membuat prototipe agen RAG Anda sendiri. Lihat Prototipe agen pemanggilan alat di AI Playground.
- Gunakan Agent Bricks: Knowledge Assistant untuk membuat agen RAG sebagai chatbot pada dokumen Anda dan sebagai titik akhir yang dapat digunakan dalam aplikasi lanjutan. Lihat Menggunakan Agent Bricks: Asisten Pengetahuan untuk membuat chatbot berkualitas tinggi di atas dokumen Anda.