Compartir a través de


Introducción a las aplicaciones de inteligencia artificial generativa en Databricks

Mosaic AI admite aplicaciones de IA generativa tanto simples como complejas, desde chatbots de generación aumentada mediante recuperación (RAG) hasta agentes que realizan llamadas a herramientas. Conozca los conceptos clave que subyacen a las aplicaciones de inteligencia artificial de generación y los sistemas de agentes, explore patrones de diseño comunes y consulte los tutoriales para crear, evaluar y escalar aplicaciones de inteligencia artificial de generación.

Aprende los conceptos de la aplicación de IA generativa

Familiarícese con los conceptos fundamentales de las aplicaciones de IA generativa.

Obtenga información sobre cómo Mosaic AI aborda los desafíos clave durante el desarrollo de inteligencia artificial de generación.

Intente crear aplicaciones de IA generativa con Mosaic AI

Comienza con los siguientes tutoriales de cuadernos:

Cuando esté listo para más complejidad, consulte las guías y tutoriales avanzados:

¿Qué son las aplicaciones de inteligencia artificial generativa?

Una aplicación de inteligencia artificial de generación es una aplicación que usa modelos de IA generativos (como LLM, modelos de generación de imágenes y modelos de texto a voz) para crear nuevas salidas, automatizar tareas complejas o interactuar con interacciones inteligentes basadas en la entrada del usuario. Aunque las aplicaciones de inteligencia artificial de generación pueden usar varios modelos, esta guía se centra en aplicaciones con tecnología LLM.

Aunque las aplicaciones de inteligencia artificial generativa impulsadas por tecnología LLM se pueden desarrollar de maneras diferentes, generalmente siguen uno de estos dos patrones arquitectónicos.

Tipo 1: LLM monolítico + prompt Tipo 2 (recomendado): sistema del agente
¿Qué es? Un único LLM con indicaciones cuidadosamente diseñadas. Varios componentes que interactúan (llamadas LLM, recuperadores, llamadas API) organizados conjuntamente, desde cadenas simples hasta sistemas sofisticados de varios agentes.
Caso de uso de ejemplo Clasificación de contenido: Usar un LLM para clasificar las incidencias de soporte al cliente en temas predefinidos. Asistente inteligente: Combinar la recuperación de documentos, varias llamadas LLM y API externas para investigar, analizar y generar informes completos.
Más adecuado para Tareas sencillas, centradas, prototipos rápidos y avisos claros y bien definidos. Flujos de trabajo complejos, tareas que requieren varias funcionalidades y tareas que requieren reflexión en los pasos anteriores.
Ventajas principales Implementación más sencilla, desarrollo más rápido y menor complejidad operativa. Más confiable y fácil de mantener, mejor control y flexibilidad, más fácil de probar y comprobar, y la optimización de nivel de componente.
Limitaciones Menos flexible, más difícil de optimizar y una funcionalidad limitada. Implementación más compleja, más configuración inicial y necesita coordinación de componentes.

Para la mayoría de los casos de uso empresariales, Databricks recomienda un sistema de agente. Al dividir los sistemas en componentes más pequeños y bien definidos, los desarrolladores pueden administrar mejor la complejidad al tiempo que mantienen altos niveles de control y cumplimiento necesarios para las aplicaciones empresariales.

Mosaic AI tiene herramientas y funcionalidades que funcionan tanto para sistemas monolíticos como para sistemas de agentes, y el resto de esta documentación abarca la creación de ambos tipos de aplicaciones de inteligencia artificial de generación.

Para obtener más información sobre la teoría detrás de los sistemas de agentes frente a los modelos monolíticos, consulte entradas de blog de los fundadores de Databricks:

¿Qué es un sistema de agente?

Un sistema de agentes es un sistema controlado por inteligencia artificial que puede percibir, decidir y actuar de forma autónoma en un entorno para lograr objetivos. A diferencia de un LLM independiente que solo genera una salida cuando se le solicita, un sistema de agente posee un grado de agencia. Los sistemas de agentes modernos basados en LLM utilizan un LLM como "cerebro" para interpretar el contexto, razonar sobre qué hacer a continuación y emitir acciones como llamadas a API, mecanismos de recuperación de información e invocaciones de herramientas para llevar a cabo tareas.

Un sistema de agente es un sistema con un LLM en su núcleo. Ese sistema:

  1. Recibe solicitudes de usuario o mensajes de otro agente.
  2. Razones sobre cómo proceder: qué datos se van a recopilar, qué lógica se va a aplicar, qué herramientas se deben utilizar o si se debe solicitar más información del usuario.
  3. Ejecuta un plan y posiblemente llama a varias herramientas o delega a subagentes.
  4. Devuelve una respuesta o solicita al usuario una aclaración adicional.

Al poner en puente la inteligencia general (las funcionalidades preentrenadas de LLM) e inteligencia de datos (los conocimientos especializados y las API específicas de su negocio), los sistemas de agentes permiten casos de uso empresariales de alto impacto, como flujos avanzados de servicio al cliente, bots de análisis enriquecidos y orquestación multiagente para tareas operativas complejas.

¿Qué puede hacer un sistema de agente?

Un sistema de agente puede:

  • Planear dinámicamente las acciones
  • Transferir el estado de un paso a otro
  • Ajustar su estrategia en función de la nueva información sin intervención humana continua

Donde un LLM independiente podría generar un itinerario de viaje cuando se le pregunte, un sistema de agente podría recuperar la información del cliente y reservar los vuelos de forma autónoma aprovechando herramientas y API. Mediante la combinación de "inteligencia general" de LLM con "inteligencia de datos" (datos o API específicos del dominio), los sistemas de agentes pueden abordar casos de uso empresariales sofisticados que un único modelo estático tendría que resolver.

La agencia es una continuidad; cuanta más libertad dé a los modelos para controlar el comportamiento del sistema, más autónoma se vuelve la aplicación. En la práctica, la mayoría de los sistemas de producción restringen cuidadosamente la autonomía del agente para garantizar el cumplimiento y la previsibilidad, por ejemplo, al requerir la aprobación humana para acciones de riesgo.

Inteligencia general frente a inteligencia de datos

Diagrama que compara la inteligencia general frente a la inteligencia de datos.

  • Inteligencia general: Hace referencia a lo que el LLM conoce inherentemente de un amplio entrenamiento previo en texto diverso. Esto es útil para la fluidez del lenguaje y el razonamiento general.
  • Inteligencia de datos: Hace referencia a los datos y API específicos del dominio de la organización. Esto puede incluir registros de clientes, información de productos, bases de conocimiento o documentos que reflejen su entorno empresarial único.

Los sistemas de agente combinan estas dos perspectivas: comienzan con los conocimientos generales y genéricos de un LLM y, a continuación, aportan datos específicos en tiempo real o específicos del dominio para responder preguntas detalladas o realizar acciones especializadas.

Ejemplo del sistema del agente

Diagrama de flujo de la interacción del cliente con la aplicación gen AI.

Imagine un escenario de un centro de llamadas entre un cliente y un agente de inteligencia artificial generativa.

El cliente realiza una solicitud: "¿Puede ayudarme a devolver mi último pedido?"

  1. Motivo y plan: dada la intención de la consulta, el agente "planea": "Busque el pedido reciente del usuario y compruebe nuestra política de devoluciones".
  2. Buscar información (inteligencia de datos): el agente consulta la base de datos de pedidos para recuperar el pedido pertinente y hace referencia a un documento de directiva.
  3. Motivo: el agente comprueba si ese pedido se ajusta al plazo de devolución.
    • Opcional humano en el proceso: El agente comprueba una regla adicional: si el elemento se encuentra en una determinada categoría o está fuera de la ventana de retorno normal, escala a un humano.
  4. Acción: el agente desencadena el proceso de devolución y genera una etiqueta de envío.
  5. Motivo: el agente genera una respuesta al cliente.

El agente de IA responde al cliente: "Listo! Aquí está la etiqueta de envío..."

Estos pasos son algo natural en un centro de llamadas humano. En un contexto de un sistema de agentes, el LLM "razona" mientras el sistema recurre a herramientas especializadas o fuentes de datos para rellenar los detalles.

Herramientas y orígenes de datos que usa el sistema del agente.

Niveles de complejidad: desde LLMs a sistemas de agentes

Es posible que encuentre varios niveles de complejidad al construir sistemas de inteligencia artificial.

  • LLMs (LLM + Prompt)

    • Un LLM independiente responde a indicaciones de texto basadas en el conocimiento de un amplio conjunto de datos de formación.
    • Adecuado para consultas simples o genéricas, pero a menudo desconectados de los datos empresariales del mundo real.

    LLM responde a los usuarios

  • Sistema de agente codificado de forma rígida ("Cadena")

    • Los desarrolladores orquestan pasos deterministas y predefinidos. Por ejemplo, una aplicación RAG siempre puede recuperar datos de un almacén de vectores y combinar los resultados con el aviso del usuario.
    • La lógica está fija, y el LLM no decide qué herramienta llamar a continuación.

    Cadenas de herramientas codificadas de forma dura

  • Sistema de agentes de invocación de herramientas

    • LlM decide qué herramienta usar y cuándo usarla en tiempo de ejecución.
    • Este enfoque admite decisiones dinámicas y contextuales sobre qué herramientas se van a invocar, como una base de datos crm o una API de publicación de Slack.

    Los agentes de inteligencia artificial racionalizan un plan y lo ejecutan con herramientas.

  • Sistemas multiagente

    • Varios agentes especializados, cada uno con su propia función o dominio.
    • Un coordinador (a veces un supervisor de inteligencia artificial, a veces basado en reglas) decide qué agente invocar en cada paso.
    • Los agentes pueden entregar tareas entre sí a la vez que conservan el flujo de conversación general.

    Un coordinador administra varios agentes de IA.

Al construir cualquier aplicación con tecnología LLM, empiece de manera sencilla. Introduce comportamientos agente más complejos cuando realmente los necesites para mejorar la flexibilidad o las decisiones controladas por modelos. Las cadenas deterministas ofrecen flujos predecibles basados en reglas para tareas bien definidas, mientras que los enfoques más agenteicos conllevan un costo adicional de complejidad y latencia potencial.

Mosaic AI Agent Framework es independiente de estos patrones, lo que facilita el inicio sencillo y evoluciona hacia niveles más altos de automatización y autonomía a medida que crecen los requisitos de la aplicación.

Herramientas en un sistema de agente

En el contexto de un sistema de agente, las herramientas son funciones de interacción única que un LLM puede invocar para realizar una tarea bien definida. El modelo de IA normalmente genera parámetros para cada llamada de herramienta y la herramienta proporciona una interacción directa de entrada y salida. No hay memoria para varios turnos en el lado de la herramienta.

Algunas categorías de herramientas comunes incluyen:

  • Herramientas que recuperan o analizan datos
    • Herramientas de recuperación de vectores: Consulte un índice vectorial para buscar los fragmentos de texto más relevantes.
    • Herramientas de recuperación estructuradas: Consulta de tablas delta o usa API para recuperar información estructurada.
    • Herramienta de búsqueda web: Busque en Internet o en un corpus web interno.
    • Modelos clásicos de ML: Herramientas que invocan modelos de ML para realizar predicciones de clasificación o regresión, como un modelo scikit-learn o XGBoost.
    • Modelos de inteligencia artificial de generación: Herramientas que realizan una generación especializada, como código o generación de imágenes, y devuelven los resultados.
  • Herramientas que modifican el estado de un sistema externo
    • Herramienta de llamada de API: Endpoints de CRM, servicios internos u otras integraciones externas para tareas como "actualizar el estado del envío".
    • Herramienta de ejecución de código: Ejecuta código proporcionado por el usuario (o, en algunos casos, generado por LLM) en un espacio aislado.
    • Integración de Slack o correo electrónico: Envía un mensaje o envía una notificación.
  • Herramientas que ejecutan lógica o realizan una tarea específica
    • Herramienta de ejecutor de código: Ejecuta código generado por el usuario o LLM en un espacio aislado, como scripts de Python.

Para más información sobre las herramientas del agente de Mosaic AI, consulte Herramientas del agente de IA.

Características clave de las herramientas

Herramientas en un sistema de agente

  • Realice una sola operación bien definida.
  • No mantenga el contexto continuo más allá de esa invocación.
  • Permitir que el sistema del agente llegue a datos externos o servicios a los que LLM no puede acceder directamente.

Control y seguridad de errores de herramientas

Dado que cada llamada a herramienta es una operación externa, por ejemplo, llamar a una API, el sistema debe controlar los errores correctamente, como : tiempos de espera, respuestas con formato incorrecto o entradas no válidas. En producción, limite la cantidad de llamadas a herramientas permitidas, proporcione una respuesta alternativa si fallan todas las llamadas a herramientas y aplique medidas de protección para asegurarse de que el sistema del agente no siga intentando la misma acción fallida repetidamente.

Ver más