Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Получение дополненного поколения (RAG) — это мощный метод, который объединяет большие языковые модели (LLM) с получением данных в режиме реального времени для создания более точных, up-to-date и контекстно релевантных ответов.
Этот подход особенно важен для ответов на вопросы о частной, часто меняющейся информации или конкретной области.
Что такое генерация с дополнением средствами поиска?
В самой простой форме агент RAG выполняет следующие действия:
- Получение. Запрос пользователя используется для запроса внешней базы знаний, например хранилища векторов, поиска ключевых слов или базы данных SQL. Цель — получить вспомогательные данные для ответа LLM.
- Расширение: вспомогательные данные объединяются с запросом пользователя, часто используя шаблон с дополнительным форматированием и инструкциями для LLM, чтобы создать запрос.
- Создание: запрос передается в LLM для генерации ответа на запрос пользователя.
Преимущества RAG
RAG улучшает LLM следующим образом:
- Собственные знания: RAG может включать в себя частную информацию, которая изначально не используется для обучения LLM, таких как заметки, сообщения электронной почты и документы для ответа на вопросы, относящиеся к домену.
- Актуальные сведения: Приложение RAG может предоставить LLM информацию из обновленной базы знаний.
- Ссылаясь на источники: RAG позволяет LLM ссылаться на определенные источники, позволяя пользователям проверять фактическую точность ответов.
- списки управления безопасностью и доступом данных (ACL): Шаг извлечения можно сконструировать для выборочного получения персональных или частных данных на основе учетных данных пользователя.
Компоненты RAG
Обычное приложение RAG включает несколько этапов:
Конвейер данных: предварительная обработка и индексирование документов, таблиц или других данных для быстрого и точного извлечения.
Цепочка RAG (извлечение, дополнение, поколение): вызов серии (или цепочки) шагов:
- Понять вопрос пользователя.
- Получение вспомогательных данных.
- Увеличение запроса с дополнительными данными.
- Сгенерируйте ответ от модели машинного обучения с помощью дополненного запроса.
Оценка и мониторинг. Оцените приложение RAG, чтобы определить его качество, стоимость и задержку, чтобы обеспечить соответствие бизнес-требованиям.
Управление и LLMOps: отслеживание жизненного цикла каждого компонента и управление ими, включая элементы управления происхождением данных и доступом.
Типы данных RAG: структурированные и неструктурированные
Архитектура RAG может работать с неструктурированными или структурированными вспомогательными данными. Данные, используемые с RAG, зависят от вашего варианта использования.
Неструктурированные данные: данные без определенной структуры или организации.
- PDF-файлы
- Документы Google и Office
- Вики-страницы
- Изображения
- Видео
структурированные данные: табличные данные, расположенные в строках и столбцах с определенной схемой, например таблицы в базе данных.
- Записи клиентов в системе бизнес-аналитики или хранилища данных
- Данные транзакций из базы данных SQL
- Данные из API приложений (например, SAP, Salesforce и т. д.)
Оценка и мониторинг
Оценка и мониторинг помогают определить, соответствует ли приложение RAG требованиям к качеству, стоимости и задержке. Оценка происходит во время разработки, а мониторинг происходит после развертывания приложения в рабочей среде.
RAG по неструктурированным данным имеет множество компонентов, влияющих на качество. Например, изменения форматирования данных могут повлиять на полученные блоки и способность LLM создавать соответствующие ответы. Поэтому важно оценить отдельные компоненты в дополнение к общему приложению.
Дополнительные сведения см. в разделе "Оценка агента ИИ Мозаики" (MLflow 2).
RAG (компьютерное моделирование на основе данных) в Databricks
Databricks предлагает сквозную платформу для разработки RAG, в том числе:
- Интегрированные конвейеры данных с Delta Lake и Декларативными конвейерами Lakeflow
- Масштабируемый векторный поиск с помощью векторного поиска Databricks
- Средства обслуживания и оркестрации моделей
- Оценка ИИ поколения для повышения производительности и качества
- Мониторинг генеративного ИИ для развернутых приложений RAG
- Встроенные функции управления и безопасности см. в Центр безопасности и доверия и Шлюз ИИ.
Дальнейшие шаги
Узнайте о конвейерах данных, ключевом компоненте приложений RAG. См. статью "Создание неструктурированного конвейера данных для RAG"
Используйте ИИ-площадку для прототипа собственного агента RAG. См. Прототип агентов, вызывающих инструменты, на AI Playground.
- Использование агентов Bricks: Помощник по знаниям создает агент RAG в качестве чат-бота в документах и в качестве конечной точки, которую можно использовать в подчиненных приложениях. См. раздел "Использование кирпичей агента: помощник по знаниям" для создания высококачественного чат-бота по документам.