Ampliación de las funcionalidades del agente con herramientas

Completado

Una de las características más eficaces de los agentes de inteligencia artificial es su capacidad de usar herramientas que amplían sus funcionalidades más allá de la generación de texto. Las herramientas permiten a los agentes realizar acciones, acceder a los datos e integrarlos con sistemas externos. Microsoft Foundry proporciona herramientas integradas y admite integraciones personalizadas, lo que transforma los agentes de interfaces de chat simples en sistemas de automatización sofisticados.

Comprensión de las herramientas del agente

Las herramientas son funciones mediante programación que los agentes pueden invocar para completar tareas. Cuando un agente determina que se necesita una herramienta para responder a una solicitud de usuario, llama automáticamente a la herramienta adecuada, procesa los resultados e las incorpora en su respuesta. Esta funcionalidad permite a los agentes trabajar con datos en tiempo real, ejecutar código, buscar bases de conocimiento e interactuar con servicios externos.

El ciclo de vida de llamada a herramientas empieza automáticamente:

  1. El usuario envía un mensaje al agente
  2. El agente analiza la solicitud y determina qué herramientas (si las hay) son necesarias.
  3. El agente invoca las herramientas adecuadas con parámetros pertinentes.
  4. Las herramientas ejecutan y devuelven resultados
  5. El agente incorpora resultados en una respuesta de lenguaje natural
  6. La respuesta se devuelve al usuario.

Esta integración sin problemas significa que puede agregar funcionalidades eficaces a los agentes sin necesidad de escribir código de orquestación complejo.

Introducción a las herramientas integradas

Microsoft Foundry proporciona un catálogo de herramientas que organiza las herramientas disponibles en tres categorías: Configuradas (herramientas integradas listas para usar), Catálogo (herramientas adicionales que puede agregar desde un registro, incluidos los servidores MCP) y Custom (sus propias herramientas a través de especificaciones o implementaciones personalizadas de OpenAPI). Puede acceder al catálogo de herramientas a través de Herramientas > de compilación en el portal o a través de la extensión de VS Code.

A continuación se muestran algunas de las herramientas más usadas.

Intérprete de código

El intérprete de código permite a los agentes escribir y ejecutar código Python en un entorno seguro y de espacio aislado. Úselo para cálculos matemáticos, análisis de datos, generación de gráficos, procesamiento de archivos y solución de problemas complejos. Por ejemplo, si un usuario pide a un agente que "calcule el interés compuesto en una inversión de 10 000 USD a 5% tasa anual durante 10 años", el agente escribe y ejecuta Python código para calcular el resultado exacto.

La búsqueda de archivos proporciona generación aumentada por recuperación (RAG) al permitir que los agentes busquen en los documentos que has cargado. La herramienta indexa tus documentos en un almacén de vectores y recupera información relevante cuando es necesario, anclando las respuestas del agente en tu base de conocimiento específica.

File Search admite PDF, Word (.docx), texto sin formato (.txt), Markdown (.md) y otros formatos. Al agregar búsqueda de archivos a un agente, cree o seleccione un almacén de vectores, cargue documentos y el sistema los indexe automáticamente para la búsqueda semántica.

Bing Web Search conecta el agente a la información de Internet en tiempo real, lo que permite el acceso a eventos actuales, temas de tendencias e información más allá de los datos de entrenamiento. Incluye la generación automática de citas, por lo que los agentes pueden hacer referencia a sus orígenes.

Azure AI Search proporciona recuperación de conocimientos avanzados de los índices de búsqueda existentes. A diferencia de la búsqueda de archivos (que funciona con documentos cargados directamente en el agente), Azure AI Search se conecta a orígenes de datos indexados a escala empresarial para escenarios de búsqueda estructurados y no estructurados.

Herramientas de OpenAPI

Las herramientas de OpenAPI permiten a los agentes interactuar con las API externas definidas por las especificaciones de OpenAPI 3.0, conectando los agentes a servicios web y sistemas empresariales. Proporciona la especificación y Microsoft Foundry controla la asignación de parámetros y el análisis de respuestas.

Herramientas integradas adicionales

El catálogo de herramientas incluye muchas más herramientas para escenarios especializados:

Herramienta Descripción
Automatización del explorador Interacción con páginas web, formularios de relleno y extracción de contenido
Uso del ordenador Interacción con aplicaciones de escritorio
Generación de imágenes Crear imágenes basadas en descripciones de texto
SharePoint Accede al contenido y las bibliotecas de documentos de SharePoint
Microsoft Fabric Conexión a agentes de datos de Fabric para el análisis de datos
Investigación profunda Realizar investigaciones detalladas en varios orígenes
Agente a agente Delegar tareas a otros agentes
Intérprete de código personalizado Ejecución de código personalizable para entornos especializados

El catálogo de herramientas continúa expandiéndose. Consulte el portal de Foundry para ver las herramientas disponibles más recientes.

Adición de herramientas en Visual Studio Code

La extensión Microsoft Foundry proporciona una interfaz intuitiva para agregar y configurar herramientas. Puede agregar herramientas a través del diseñador visual o editando el archivo YAML directamente.

Uso del diseñador visual

Para agregar herramientas a través del Diseñador de agentes:

  1. Abra el agente en diseñador de agentes
  2. Vaya a la sección Herramientas del panel de configuración.
  3. Seleccione Agregar herramienta o el icono.+
  4. Examinar las herramientas disponibles en la biblioteca de herramientas
  5. Seleccione la herramienta que desea agregar.
  6. Configuración de opciones específicas de la herramienta si es necesario
  7. Guardar los cambios

Captura de pantalla de la interfaz del catálogo de herramientas en la extensión de VS Code de Microsoft Foundry.

Al agregar determinadas herramientas, la extensión le pedirá que configure recursos relacionados. Por ejemplo, agregar búsqueda de archivos le permite crear o seleccionar un almacén de vectores para la indexación de documentos.

Adición de herramientas a través de YAML

También puede agregar herramientas editando el archivo YAML del agente directamente. Este enfoque funciona bien cuando sabe exactamente qué herramientas necesita o desea aplicar cambios de plantillas.

Esta es una configuración de YAML de ejemplo con varias herramientas:

version: 1.0.0
name: research-assistant
description: Helps with research tasks using code analysis and web search
model:
  id: 'gpt-4o-deployment'
instructions: |
  You're a research assistant helping users gather and analyze information.
  Use Code Interpreter for data analysis and Bing Search for current information.
tools:
  - type: code_interpreter
  - type: bing_grounding
    bing_grounding:
      connection_id: "your-connection-id"
  - type: file_search
    file_search:
      vector_store_ids:
        - "vectorstore-123"

La matriz de herramientas enumera cada herramienta habilitada con su configuración. Algunas herramientas requieren parámetros adicionales, como identificadores de conexión o referencias de almacén de vectores.

Servidores de Protocolo de contexto de modelo (MCP)

El Protocolo de contexto de modelo (MCP) proporciona una manera estandarizada de agregar herramientas personalizadas a los agentes. Los servidores MCP están disponibles a través de la sección Catálogo del catálogo de herramientas y ofrecen interfaces de herramientas reutilizables que funcionan de forma coherente en diferentes implementaciones de agente.

Tipos de servidores MCP

El catálogo de herramientas foundry admite tres tipos de servidores MCP:

  • Servidores MCP remotos : hospedados externamente y a los que se accede a través de la red. Estos son el tipo más común para escenarios de producción.
  • Servidores MCP locales : ejecute en el equipo local durante el desarrollo. Resulta útil para probar herramientas personalizadas antes de realizar la implementación.
  • Servidores MCP personalizados : sus propias implementaciones de servidor MCP adaptadas a necesidades específicas.

Ventajas de los servidores MCP

Los servidores MCP proporcionan varias ventajas:

Protocolo estandarizado : los patrones de comunicación de herramientas coherentes hacen que la integración sea predecible y confiable.

Componentes reutilizables : cree herramientas una vez y úselas en varios agentes y proyectos.

Herramientas controladas por la comunidad: herramientas de acceso creadas por la comunidad a través de registros de MCP, expandiendo funcionalidades sin desarrollo personalizado.

Integración simplificada : las interfaces coherentes reducen la complejidad de la integración y la carga de mantenimiento.

Uso de servidores MCP en VS Code

La extensión Microsoft Foundry admite la integración del servidor MCP:

  1. Examinar los servidores MCP disponibles a través del registro de herramientas de la extensión
  2. Adición de servidores MCP a la configuración del agente
  3. Configuración de parámetros y opciones específicas del servidor
  4. Prueba de la funcionalidad del servidor MCP en el área de juegos integrada
  5. Desplegar agentes con integraciones del servidor MCP en producción

Los servidores MCP amplían las funcionalidades del agente con funciones especializadas y mantienen una experiencia de desarrollo coherente.

Procedimientos recomendados de configuración de herramientas

La administración eficaz de herramientas garantiza un rendimiento confiable del agente:

  • Comience con herramientas integradas antes de crear soluciones personalizadas. Las herramientas integradas se prueban, mantienen y optimizan para la plataforma.
  • Hacer coincidir las herramientas con los requisitos : enumere lo que el agente debe hacer y seleccione las herramientas en consecuencia. No agregue herramientas sin propósitos claros, ya que cada herramienta agrega latencia.
  • Proporcionar instrucciones claras : indique al agente cuándo y cómo usar cada herramienta (por ejemplo, "Usar intérprete de código para los cálculos matemáticos") y cuándo no usarlas.
  • Mantener actualizadas las bases de conocimiento : al usar la búsqueda de archivos, actualice los documentos periódicamente. La información obsoleta conduce a respuestas incorrectas.
  • Probar el comportamiento de la herramienta mediante el entorno de pruebas integrado. Enviar mensajes que deben desencadenar el uso de herramientas, comprobar la invocación correcta y probar escenarios de error.

Los agentes pueden usar varias herramientas juntas para controlar escenarios complejos. Por ejemplo, un agente de investigación podría usar Bing Web Search para recopilar información actual, el intérprete de código para analizar datos y la búsqueda de archivos para hacer referencia a la documentación interna, todo ello orquestado automáticamente en función de la solicitud del usuario.

La ampliación de las funcionalidades del agente con herramientas transforma interfaces de chat sencillas en sistemas de automatización eficaces. Al combinar herramientas integradas con integraciones personalizadas y servidores MCP, puede crear agentes que interactúen sin problemas con los datos, los sistemas y los servicios, a la vez que se mantiene la seguridad y confiabilidad de nivel empresarial.

Puede encontrar más información detallada sobre las herramientas y los servidores MCP más adelante.