Общие сведения о создании приложений ИИ поколения на Databricks
Мозаичный ИИ предоставляет комплексную платформу для создания, развертывания и управления приложениями GenAI. В этой статье описаны основные компоненты и процессы, участвующие в разработке приложений GenAI в Databricks.
Развертывание и выполнение запросов моделей ИИ поколения
Для простых вариантов использования можно напрямую обслуживать и запрашивать модели ИИ поколения, включая высококачественные модели с открытым исходным кодом, а также сторонние модели от поставщиков LLM, таких как OpenAI и Anthropic.
Служба модели ИИ мозаики поддерживает обслуживание и запросы моделей сгенерируемым ИИ с помощью следующих возможностей:
- API-интерфейсы модели foundation. Эта функция позволяет открывать современные модели и точно настроенные варианты моделей для конечной точки обслуживания модели. Эти модели являются курируемыми архитектурами базовых моделей, поддерживающими оптимизированное вывод. Базовые модели, такие как инструкции DBRX, Meta-Llama-3.1-70B-Instruct, GTE-Large и Mistral-7B доступны для немедленного использования с ценами на токен , а рабочие нагрузки, требующие гарантий производительности, таких как варианты точно настроенных моделей, могут быть развернуты с подготовленной пропускной способностью.
- Внешние модели. Это генеривные модели ИИ, размещенные за пределами Databricks. Конечные точки, обслуживающие внешние модели, могут централизованно управляться, и клиенты могут устанавливать ограничения скорости и управление доступом для них. Примеры включают в себя базовые модели, такие как GPT-4 OpenAI, Anthropic в Клоде и другие.
См. статью "Создание модели создания модели искусственного интеллекта" для обслуживания конечных точек.
Платформа агента ИИ мозаики
Платформа агента ИИ Мозаики состоит из набора инструментов для Databricks, предназначенных для создания, развертывания и оценки рабочих агентов, таких как приложения получения дополненного поколения (RAG).
Она совместима с сторонними платформами, такими как LangChain и LlamaIndex, что позволяет разрабатывать с помощью предпочтительной платформы и использовать управляемый каталог Unity Databricks, платформу оценки агентов и другие преимущества платформы.
Быстро выполните итерацию по разработке агента с помощью следующих функций:
- Создание и ведение журналов агентов с помощью любой библиотеки и MLflow. Параметризируйте агенты, чтобы быстро экспериментировать и выполнять итерацию по разработке агентов.
- Трассировка агента позволяет выполнять журнал, анализ и сравнение трассировок в коде агента для отладки и понимания того, как агент отвечает на запросы.
- Повышение качества агента с помощью DSPy. DSPy может автоматизировать инженерию запросов и тонкой настройке, чтобы повысить качество агентов GenAI.
- Развертывание агентов в рабочей среде с собственной поддержкой потоковой передачи маркеров и ведения журнала запросов и ответов, а также встроенное приложение проверки для получения отзывов пользователей для агента.