Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Alma artırılmış oluşturma (RAG), daha doğru, up-to-tarih ve bağlamsal olarak ilgili yanıtlar oluşturmak için büyük dil modellerini (LLM) gerçek zamanlı veri alma ile birleştiren güçlü bir tekniktir.
Bu yaklaşım özellikle özel, sık değişen veya etki alanına özgü bilgilerle ilgili soruları yanıtlamak için değerlidir.
Geri getirme destekli üretim nedir?
En basit biçimde, BIR RAG aracısı aşağıdakileri yapar:
- Alma: Kullanıcının isteği vektör deposu, anahtar sözcük araması veya SQL veritabanı gibi bir dış bilgi bankasını sorgulamak için kullanılır. Amaç, LLM'nin yanıtı için destekleyici veriler almaktır.
- Büyütme: Destekleyici veriler kullanıcının isteğiyle birleştirilir ve genellikle LLM'ye ek biçimlendirme ve yönergeler içeren bir şablon kullanılarak bir istem oluşturulur.
- Oluşturma: Kullanıcının isteğine yanıt oluşturmak için llm'ye istem geçirilir.
RAG avantajları
RAG, LLM'leri aşağıdaki yollarla geliştirir:
- Özel bilgi: RAG, başlangıçta LLM'yi eğitmek için kullanılmayan notlar, e-postalar ve belgeler gibi etki alanına özgü soruları yanıtlamak için özel bilgiler içerebilir.
- Güncel bilgiler: RAG uygulaması LLM'ye güncelleştirilmiş bir bilgi bankasından bilgi sağlayabilir.
- Kaynaklardan alıntı: RAG, LLM'lerin belirli kaynakları alıntılayarak kullanıcıların yanıtların gerçek doğruluğunu doğrulamasına olanak tanır.
- Veri güvenliği ve erişim denetimi listeleri (ACL): Alma adımı, kullanıcı kimlik bilgilerine göre kişisel veya özel bilgileri seçmeli olarak almak için tasarlanabilir.
RAG bileşenleri
Tipik bir RAG uygulaması birkaç aşamadan oluşur:
Veri işlem hattı: Hızlı ve doğru alma için belgeleri, tabloları veya diğer verileri önceden işleyin ve dizinleyin.
RAG zinciri (Alma, Genişletme, Oluşturma): Aşağıdaki adımlardan oluşan bir dizi veya zinciri çağırın:
- Kullanıcının sorusunu anlayın.
- Destekleyici verileri alma.
- İstemi destekleyici verilerle genişletin.
- Genişletilmiş istemi kullanarak bir LLM'den yanıt oluşturun.
Değerlendirme ve izleme: İŞ gereksinimlerinizi karşıladığından emin olmak için RAG uygulamasını değerlendirerek kalitesini, maliyetini ve gecikme süresini belirleyin.
İdare ve LLMOps: Veri kökeni ve erişim denetimleri dahil olmak üzere her bileşenin yaşam döngüsünü izleyin ve yönetin.
RAG veri türleri: yapılandırılmış ve yapılandırılmamış
RAG mimarisi yapılandırılmamış veya yapılandırılmış destekleyici verilerle çalışabilir. RAG ile kullandığınız veriler kullanım örneğine bağlıdır.
Yapılandırılmamış veriler: Belirli bir yapısı veya kuruluşu olmayan veriler.
- PDF'ler
- Google/Office belgeleri
- Wiki siteleri
- Görüntüler
- Videolar
Yapılandırılmış veri: Belirli bir şemaya sahip satırlar ve sütunlar halinde düzenlenmiş tabular veriler, örneğin bir veritabanındaki tablolar.
- BI veya Veri Ambarı sisteminde müşteri kayıtları
- SQL veritabanından işlem verileri
- Uygulama API'lerinden alınan veriler (örneğin SAP, Salesforce vb.)
Değerlendirme ve izleme
Değerlendirme ve izleme, RAG uygulamanızın kalite, maliyet ve gecikme süresi gereksinimlerinizi karşılayıp karşılamadığını belirlemeye yardımcı olur. Değerlendirme geliştirme sırasında gerçekleşirken, uygulama üretime dağıtıldıktan sonra izleme gerçekleşir.
Yapılandırılmamış veriler üzerinde RAG, kaliteyi etkileyen birçok bileşene sahiptir. Örneğin veri biçimlendirme değişiklikleri, alınan öbekleri ve LLM'nin ilgili yanıtları oluşturma becerisini etkileyebilir. Bu nedenle, genel uygulamaya ek olarak tek tek bileşenlerin de değerlendirilmesi önemlidir.
Daha fazla bilgi için bkz . Mozaik AI Aracısı Değerlendirmesi (MLflow 2).
Databricks üzerinde RAG
Databricks, AŞAĞıDAKIler dahil olmak üzere RAG geliştirme için uçtan uca bir platform sunar:
- Delta Lake ve Lakeflow Bildirimli İşlem Hatları ile tümleşik veri işlem hatları
- Databricks Vektör Araması ile ölçeklenebilir vektör araması
- Model sunma ve düzenleme araçları
- Performansı ve kaliteyi geliştirmek için Gen AI değerlendirmesi
- Dağıtılan RAG uygulamaları için Gen AI izleme
- Yerleşik idare ve güvenlik, bkz. Güvenlik ve Güven Merkezi ve AI Ağ Geçidi.
Sonraki Adımlar
RAG uygulamalarının temel bileşenlerinden biri olan veri işlem hatları hakkında bilgi edinin. Bkz . RAG için yapılandırılmamış veri işlem hattı oluşturma
Kendi RAG aracınızın prototipini oluşturmak için AI Playground'ı kullanın. Bkz. AI Playground 'da prototip araç çağırma aracıları.
- Agent Bricks'i kullanma: Bilgi Yardımcısı belgelerinizde sohbet botu olarak ve aşağı akış uygulamalarında kullanabileceğiniz bir uç nokta olarak bir RAG aracısı oluşturur. Belgeleriniz üzerinde yüksek kaliteli bir sohbet botu oluşturmak için bkz. Agent Bricks: Knowledge Assistant'ı kullanma.