RAG (Retrieval Augmented Generation) di Azure Databricks

Retrieval-augmented generation (RAG) adalah teknik kuat yang menggabungkan model bahasa besar (LLM) dengan pengambilan data real time untuk menghasilkan respons yang lebih akurat, up-to-date, dan relevan secara kontekstual.

Pendekatan ini sangat berharga untuk menjawab pertanyaan tentang informasi kepemilikan, sering berubah, atau khusus domain.

Apa itu generasi yang ditingkatkan oleh pengambilan informasi?

Dalam bentuk paling sederhana, agen RAG melakukan hal berikut:

Pengambilan: Permintaan pengguna digunakan untuk mengkueri pangkalan pengetahuan luar seperti penyimpanan vektor, pencarian kata kunci, atau database SQL. Tujuannya adalah untuk mendapatkan data pendukung untuk respons LLM.
Augmentasi: Data pendukung dikombinasikan dengan permintaan pengguna, sering menggunakan templat dengan pemformatan dan instruksi tambahan ke LLM, untuk membuat permintaan.
Generasi: Perintah diteruskan ke LLM untuk menghasilkan respons terhadap permintaan pengguna.

Alur aplikasi RAG dari permintaan pengguna ke pengambilan dan respons data.

Manfaat RAG

RAG meningkatkan LLM dengan cara berikut:

Pengetahuan kepemilikan: RAG dapat menyertakan informasi kepemilikan yang awalnya tidak digunakan untuk melatih LLM, seperti memo, email, dan dokumen untuk menjawab pertanyaan khusus domain.
Informasi terbaru: Aplikasi RAG dapat menyediakan LLM dengan informasi dari pangkalan pengetahuan yang diperbarui.
Mengutip sumber: RAG memungkinkan LLM untuk mengutip sumber tertentu, memungkinkan pengguna memverifikasi akurasi respons faktual.
Daftar keamanan data dan kontrol akses (ACL): Langkah pengambilan dapat dirancang untuk mengambil informasi pribadi atau kepemilikan secara selektif berdasarkan kredensial pengguna.

Komponen RAG

Aplikasi RAG umum melibatkan beberapa tahap:

Alur data: Pra-proses dan indeks dokumen, tabel, atau data lainnya untuk pengambilan yang cepat dan akurat.
Rantai RAG (Retrieval, Augmentasi, Generasi): Panggil serangkaian (atau rantai) langkah untuk:
- Pahami pertanyaan pengguna.
- Mengambil data pendukung.
- Memperkuat prompt dengan data pendukung.
- Hasilkan respons dari LLM menggunakan perintah tambahan.
Evaluasi dan pemantauan: Menilai aplikasi RAG untuk menentukan kualitas, biaya, dan latensinya untuk memastikan aplikasi memenuhi persyaratan bisnis Anda.
Tata kelola dan LLMOps: Melacak dan mengelola siklus hidup setiap komponen, termasuk silsilah data dan kontrol akses.

Diagram komponen aplikasi RAG.

Jenis data RAG: terstruktur dan tidak terstruktur

Arsitektur RAG dapat bekerja dengan data pendukung yang tidak terstruktur atau terstruktur. Data yang Anda gunakan dengan RAG tergantung pada kasus penggunaan Anda.

Data yang tidak terstruktur: Data tanpa struktur atau organisasi tertentu.

PDF
Dokumen Google/Office
Wiki
Gambar
Video

Data terstruktur: Data tabular yang disusun dalam baris dan kolom dengan skema tertentu, seperti tabel dalam database.

Catatan pelanggan dalam sistem BI atau Gudang Data
Data transaksi dari database SQL
Data dari API aplikasi (misalnya, SAP, Salesforce, dll.)

Evaluasi & pemantauan

Evaluasi dan pemantauan membantu menentukan apakah aplikasi RAG Anda memenuhi persyaratan kualitas, biaya, dan latensi Anda. Evaluasi terjadi selama pengembangan, sementara pemantauan terjadi setelah aplikasi disebarkan ke produksi.

RAG atas data yang tidak terstruktur memiliki banyak komponen yang berdampak pada kualitas. Misalnya, perubahan pemformatan data dapat memengaruhi potongan yang diambil dan kemampuan LLM untuk menghasilkan respons yang relevan. Jadi, penting untuk mengevaluasi komponen individual selain aplikasi keseluruhan.

Untuk informasi selengkapnya, lihat Evaluasi Agen (MLflow 2).

RAG di Azure Databricks

Databricks menawarkan platform end-to-end untuk pengembangan RAG, termasuk:

Alur data terintegrasi dengan Delta Lake dan Lakeflow Spark Declarative Pipelines
Pencarian vektor yang dapat diskalakan dengan Pencarian Vektor Databricks
Alat penyajian model dan pengelolaan orkestrasi
Evaluasi Gen AI untuk meningkatkan performa dan kualitas
Pemantauan Gen AI untuk aplikasi RAG yang disebarkan
Tata kelola dan keamanan bawaan, lihat Pusat Keamanan dan Kepercayaan dan Gateway AI.

Langkah selanjutnya

Pelajari tentang alur data, komponen utama aplikasi RAG. Lihat Membangun alur data yang tidak terstruktur untuk RAG
Gunakan AI Playground untuk membuat prototipe agen RAG Anda sendiri. Lihat Memulai: Mengkueri LLM dan membuat prototipe agen AI tanpa kode.

Gunakan Asisten Pengetahuan untuk membuat agen RAG sebagai chatbot pada dokumen Anda dan sebagai endpoint yang dapat Anda gunakan dalam aplikasi lanjutan. Lihat Menggunakan Asisten Pengetahuan untuk membuat chatbot berkualitas tinggi di atas dokumen Anda.

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-04-30