Поделиться через


Основные понятия. Создание искусственного интеллекта в Azure Databricks

Приложение GenAI — это приложение, использующее созданные модели искусственного интеллекта (например, крупные языковые модели, модели создания изображений и модели преобразования текста в речь) для создания новых выходных данных, автоматизации сложных задач или участия в интеллектуальном взаимодействии на основе ввода пользователем.

Приложение GenAI может быть использовано с простыми вызовами к LLM или другим моделям GenAI, либо управляется сложными агентами ИИ. Дополнительные сведения о уровнях сложности.

Агенты, средства, оценка, модели и другие аспекты приложений GenAI можно настроить с помощью собственных данных. Эта настройка на основе данных приводит к анализу данных, что позволяет выйти за рамки общей аналитики, предоставляемой консервированными моделями ИИ.

Приложения GenAI

Приложение GenAI для пользователя может принимать множество форм, таких как:

Для успешного использования приложений GenAI часто требуется два набора навыков: разработка приложений и оценка ИИ. Разработка приложений GenAI очень похожа на разработку приложений, отличных от ИИ, требующих навыков программного обеспечения, которые зависят от типа приложения. Однако для оценки приложений GenAI требуются специализированные средства и методы для обработки сложных и открытых ответов от GenAI.

Дополнительные сведения о создании приложений GenAI для конкретной отрасли в Azure Databricks см. в следующем разделе:

Оценка GenAI

Модели GenAI, агенты и приложения часто имеют сложное, открытое поведение. Пользователи могут вводить любой запрос. Агент ИИ может собирать текст, изображения и многое другое во время выполнения. Выходные данные могут быть произвольным текстом, изображениями или другими носителями, и может быть много "хороших" ответов.

Эти сложности делают оценку GenAI проблематичной. Требуется правильная оценка:

  • Автоматизация с помощью ИИ для оценки ИИ
  • Человеческая обратная связь от экспертов и пользователей, чтобы собрать эталонные данные и калибровать автоматизированную оценку.
  • Глубокое погружение в сложные агенты для понимания и отладки поведения

Управляемый Azure Databricks MLflow и связанные инструменты предоставляют основы для оценки GenAI.

Агенты

Агент или система агента — это система на основе искусственного интеллекта, которая может автономно воспринимать, решать и действовать в среде для достижения целей. В отличие от автономной модели GenAI, которая производит выходные данные только при появлении запроса, система агентов обладает степенью агентства. Современные агенты ИИ используют модель GenAI в качестве "мозга" системы, которая:

  1. Получает запросы пользователей или сообщения от другого агента.
  2. Соображения о том, как действовать: какие данные следует получить, какую логику применить, какие инструменты использовать, или запрашивать дополнительные данные от пользователя.
  3. Выполняет план и, возможно, вызывает несколько инструментов или передает полномочия подчиненным агентам.
  4. Возвращает ответ или запрашивает у пользователя дополнительное уточнение.

Благодаря соединению общего интеллекта (предварительно обученные способности модели GenAI) и интеллекта данных (специализированные знания и API, относящиеся к вашему бизнесу), системы агентов обеспечивают высокоэффективные корпоративные варианты использования, такие как усовершенствованные потоки клиентского обслуживания, боты для анализа богатых данных и мультиагентная координация для сложных операционных задач.

Существует континуум от простых моделей GenAI до сложных агентов. Дополнительные сведения см. в шаблонах проектирования системы агента.

Azure Databricks предоставляет широкий спектр вариантов создания агентов, от полного до полного пользовательского:

  • Агент Bricks предоставляет инструменты для построения управляемых агентов для ключевых приложений, таких как интеллектуальные помощники и извлечение информации.
  • Ai Playground предоставляет пользовательский интерфейс для создания прототипов агентов, вызывающих средства, из которых можно экспортировать созданный код агента.
  • Agent Framework позволяет создавать и развертывать агенты с помощью пользовательских библиотек разработки или сторонних агентов.

Инструменты

Агенты ИИ могут вызывать средства для сбора информации или выполнения действий. Средства — это функции с одним взаимодействием, которые LLM может вызывать для выполнения четко определенной задачи. Модель искусственного интеллекта обычно создает параметры для каждого вызова средства, а средство обеспечивает простое взаимодействие с входными выходными данными.

К общим категориям инструментов относятся:

  • Средства , которые извлекают или анализируют данные
    • Семантическое извлечение: выполнение запроса к векторному индексу для поиска соответствующего текста или других неструктурированных данных.
    • Структурированное извлечение: выполнение запросов SQL или использование API для получения структурированной информации.
    • Средство поиска в Интернете: поиск по Интернету или внутреннему веб-корпусу.
    • Классические модели машинного обучения: вызов моделей машинного обучения для выполнения классификации, регрессии или других прогнозов.
    • Модели GenAI: создание специализированных выходных данных, таких как код или изображения.
  • средства , изменяющие состояние внешней системы
    • Вызов API: вызов конечных точек CRM, внутренних служб или других сторонних интеграции.
    • Интеграция с приложением электронной почты или обмена сообщениями: публикация сообщения или отправка уведомления.
  • Средства, выполняющие логику или выполняющие определенную задачу
    • Выполнение кода: запустите предоставленный пользователем код или код LLM в песочнице.

Средства можно встроить в агентическую логику или получить к ней доступ с помощью стандартных интерфейсов, таких как MCP.

Средства и агенты:

  • Средства выполняют одну хорошо определенную операцию. Агенты могут выполнять более открытые задачи.
  • Средства обычно не имеют состояния и не поддерживают контекст за пределами каждого вызова. Агенты поддерживают состояние, так как они итеративно решают задачи.

Обработка ошибок и безопасность инструментов:

Так как каждый вызов средства является внешней операцией, такой как вызов API, система должна корректно обрабатывать сбои. Время ожидания, неправильные ответы или невалидные входные данные не должны привести к отказу агента. В производственной эксплуатации ограничьте количество разрешенных вызовов инструментов, предусмотрите резервный ответ в случае сбоя вызовов, и примените предохранительные меры, чтобы система агентов не пыталась неоднократно выполнять одно и то же неудачное действие.

Дополнительные сведения о средствах искусственного интеллекта в Databricks:

Модели GenAI и LLM

Крупные языковые модели (LLMs) — это модели ИИ, обучаемые на огромных текстовых наборах данных, которые могут понимать, генерировать и рассуждать по человеческому языку. Приложения, такие как чат-боты, помощники по коду и средства создания контента, используют большие языковые модели (LLM) для прогнозирования и создания текста, соответствующего контексту на основе входных запросов.

Как правило, модели GenAI или базовые модели обучаются на массивном тексте, изображении, видео, аудио или других данных, чтобы узнать о режимах, отличных от текста. Многомодальные модели учатся коннексировать человеческий язык с изображениями, аудио и другими носителями. LLMs — это тип модели GenAI или базовой модели, хотя эти термины часто используются слабо и взаимозаменяемо.

Модели GenAI обеспечивают аналитику агентов и приложений GenAI. Простые приложения часто создаются с помощью одной модели, настраиваемой с помощью инженерии подсказок.

Узнайте об использовании моделей GenAI в Azure Databricks:

Инженерия подсказок

Модели GenAI обычно принимают запросы или инструкции, рассказывающие модели, как обрабатывать входные данные пользователя. Запросы могут быть глубоко настроены с помощью подробных шагов, экспертных знаний, данных и других сведений.

Azure Databricks предоставляет гибкие способы разработки запросов. Рассмотрим пример.

  • Агент Bricks автоматизирует инженеринг запросов, опираясь на ваши данные и обратную связь.
  • Ai Playground предоставляет пользовательский интерфейс для ручной интерактивной разработки запросов.
  • Оптимизация запросов MLflow и DSPy предоставляют подпрограммы оптимизации запросов на основе данных.

Тонкая настройка моделей

Модели GenAI также можно настроить с помощью тонкой настройки, которая настраивает модель для определенного домена или приложения с помощью пользовательских данных.

Azure Databricks предоставляет гибкие способы настройки моделей. Рассмотрим пример.

Что такое платформа GenAI?

Для GenAI требуется объединенная платформа данных и искусственного интеллекта. Для разработчиков и администраторов ключевые компоненты для GenAI должны быть подключены и управляются на простой унифицированной платформе.

К ключевым компонентам относятся:

  • Ресурсы ИИ, такие как модели, агенты и приложения
  • Ресурсы данных, такие как файлы, таблицы, конвейеры обработки, векторные индексы и хранилища компонентов
  • Развертывания ИИ, например, точки доступа для моделей и агентов
  • Инструмент для создания и развертывания ресурсов ИИ и данных

К ключевым возможностям управления относятся следующие возможности:

  • Единое управление ресурсами ИИ и данными. Дополнительные сведения см. в статье "Что такое каталог Unity?".
  • Единое управление конечными точками модели GenAI. Дополнительные сведения см. в статье "Общие сведения о шлюзе ИИ Для Мозаики".
  • Единый подход к безопасности. Дополнительные сведения см. в databricks AI Security.
  • Единое администрирование средств искусственного интеллекта и данных. Подробнее см. в разделе Администрирование.

Также смотрите возможности Mosaic AI для GenAI и архитектуру Databricks.

Подробнее