Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La mayoría de las empresas no quieren solo bots de chat. Quieren que la automatización sea más rápida y tenga menos errores. Ese deseo puede significar resumir documentos, procesar facturas, administrar incidencias de soporte técnico o publicar entradas de blog. En todos los casos, el objetivo es el mismo: liberar personas y recursos para centrarse en el trabajo de mayor valor descargando tareas repetitivas y predecibles.
Los modelos de lenguaje grande (LLM) presentan un nuevo tipo de automatización con sistemas que pueden comprender datos no estructurados, tomar decisiones y generar contenido. En la práctica, las empresas pueden tener dificultades para pasar más allá de las demostraciones y entrar en producción. Los LLMs pueden desviarse, ser incorrectos y carecer de responsabilidad. Sin visibilidad, aplicación de directivas y orquestación, estos modelos son difíciles de confiar en flujos de trabajo empresariales reales.
Microsoft Foundry está diseñado para cambiarlo. Es una plataforma que combina modelos, herramientas, marcos y gobernanza en un sistema unificado para crear agentes inteligentes. En el centro de este sistema se encuentra Foundry Agent Service, que permite el funcionamiento de los agentes en el desarrollo, la implementación y la producción.
El servicio de agente conecta las partes principales de Foundry, como modelos, herramientas y marcos, en un único entorno de ejecución. Administra conversaciones, organiza llamadas a herramientas, aplica la seguridad del contenido e integra con los sistemas de identidad, redes y observabilidad. Estas funcionalidades le ayudan a crear agentes que estén listos para producción, escalables y seguros.
Al abstraer la complejidad de la infraestructura y aplicar la confianza y la seguridad por diseño, el servicio del agente puede ayudarle a pasar de prototipo a producción con confianza.
Prerrequisitos
- Una suscripción de Azure con permiso para crear y administrar recursos de Foundry.
- Un proyecto de fundición. Si aún no ha creado uno, comience con la configuración del entorno.
- Un modelo implementado que puede usar el agente. La disponibilidad del modelo y de la región puede variar; consulte los modelos que informan a los agentes.
Disponibilidad, regiones y límites
Las funcionalidades del servicio de agente pueden variar en función de la experiencia de Foundry que usa y el modelo y la región que elija.
- Para conocer los límites de servicio, las cuotas y las consideraciones de restricción, consulte Cuotas y límites para el Servicio de Agente.
- Para obtener compatibilidad con modelos y regiones, consulte modelos que informan a los agentes.
Si está creando su primer agente, comience con los enlaces de inicio rápido en Introducción al Servicio de Agente Foundry para asegurarse de que está en la ruta de acceso de API correcta para la experiencia de Foundry.
¿Qué es un agente de IA?
Los agentes toman decisiones, invocan herramientas y participan en flujos de trabajo. Realizan estas tareas a veces de forma independiente y a veces en colaboración con otros agentes o seres humanos. Son fundamentales para la automatización real de procesos.
Los agentes que cree a través de Foundry no son monolitos. Son unidades que se pueden componer. Cada agente tiene un rol específico, está impulsado por el modelo correcto y está equipado con las herramientas adecuadas. Implemente cada agente dentro de un entorno de ejecución seguro, observable y controlable.
Un agente tiene tres componentes principales:
- Modelo (LLM): potencia el razonamiento y la comprensión del lenguaje.
-
Instrucciones: defina los objetivos, el comportamiento y las restricciones del agente. Pueden tener los siguientes tipos:
- Declarativo:
- Basado en avisos: un agente único definido mediante declaración que combina la configuración del modelo, las instrucciones, las herramientas y los mensajes de lenguaje natural para impulsar el comportamiento.
- Flujo de trabajo: flujo de trabajo agéntico que se puede expresar como YAML u otro código para orquestar varios agentes conjuntamente, o para desencadenar una acción según ciertos criterios.
- Hospedado: Los agentes contenedorizados que se crean e implementan en código y se hospedan en Foundry.
- Declarativo:
- Herramientas: permita que el agente recupere conocimiento o tome medidas.
Los agentes reciben entradas no estructuradas, como mensajes de usuario, alertas o mensajes de otros agentes. Generan salidas en forma de resultados de herramientas o mensajes. En el camino, podrían llamar a herramientas para realizar recuperaciones o desencadenar acciones.
¿Cómo funcionan los agentes de Foundry?
Piense en Foundry como una línea de ensamblado para agentes inteligentes. Al igual que cualquier fábrica moderna, Foundry reúne estaciones especializadas que son cada una responsable de dar forma a parte del producto final. En lugar de máquinas y cintas transportadoras, la fábrica de agentes utiliza modelos, herramientas, directivas y orquestación para crear agentes seguros, comprobables y listos para producción. Aquí se muestra cómo funciona la fábrica paso a paso:
1. Modelos
La línea de ensamblaje se inicia al seleccionar un modelo que proporciona al agente su inteligencia. Elija entre un catálogo creciente de modelos de lenguaje grande (LLM), incluidos GPT-4o, GPT-4, GPT-3.5 (Azure OpenAI) y otros como Llama. El modelo es el núcleo de razonamiento del agente que informa sus decisiones.
2. Personalización
Dar forma al modelo para que se ajuste a su caso de uso. Personalice el agente con indicaciones específicas de la optimización, la destilación o el dominio. Codifique el comportamiento del agente, el conocimiento específico del rol y los patrones del rendimiento anterior mediante el uso de datos capturados a partir del contenido real de la conversación y los resultados de las herramientas.
3. Conocimientos y herramientas
Equipe a su agente con herramientas. Estas herramientas permiten al agente acceder a los conocimientos empresariales (como Bing, SharePoint y Azure AI Search) y realizar acciones reales (a través de Azure Logic Apps, Azure Functions, OpenAPI, etc.). Este paso mejora la capacidad del agente para expandir sus funcionalidades.
4. Orquestación
El agente necesita coordinación. Workflows orquestan el ciclo de vida completo, que incluye controlar las llamadas a herramientas, actualizar el estado de la conversación, administrar reintentos y registrar salidas.
5. Observabilidad
Probar y supervisar agentes. Foundry puede capturar registros, seguimientos y evaluaciones en cada paso. Con la visibilidad de nivel de conversación completa y la integración de Application Insights, los equipos pueden inspeccionar cada decisión y mejorar continuamente los agentes a lo largo del tiempo.
6. Confianza
Asegúrese de que los agentes sean adecuados y confiables para la carga de trabajo a la que están asignados. Foundry aplica características de confianza de nivel empresarial, como la identidad a través de Microsoft Entra, el control de acceso basado en roles (RBAC), los filtros de contenido, el cifrado y el aislamiento de red. Puede elegir cómo y dónde se ejecutan sus agentes, utilizando infraestructura administrada por la plataforma o su propia infraestructura.
El resultado es un agente que está listo para producción: confiable, extensible y seguro para implementar en los flujos de trabajo.
¿Por qué usar Foundry Servicio de Agente?
El servicio de agente proporciona una base lista para producción para implementar agentes inteligentes en entornos empresariales. Este es el modo en que se compara entre las funcionalidades clave:
| Capacidad | Servicio del agente |
|---|---|
| Visibilidad de las conversaciones | Acceso total a conversaciones estructuradas, incluidos los mensajes de usuario a agente y agente a agente. Ideal para las interfaces de usuario, la depuración y el entrenamiento. |
| Coordinación con varios agentes | Compatibilidad integrada con la mensajería de agente a agente. |
| Orquestación de herramientas | Ejecución en el lado del servidor y reintento de llamadas a herramientas con registro estructurado. No se requiere orquestación manual. |
| Confianza y seguridad | Filtros de contenido integrados para ayudar a prevenir el uso indebido y mitigar los riesgos de inyección de comandos, incluidos los ataques de inyección entre comandos (XPIA). Todas las salidas están gobernadas por políticas. |
| Integración empresarial | Capacidad de traer su propio almacenamiento, índice de Azure AI Search y red virtual para satisfacer las necesidades de cumplimiento. |
| Observabilidad y depuración | Rastreabilidad completa de conversaciones, invocaciones de herramientas y seguimientos de mensajes; Integración de Application Insights para los datos de uso. |
| Control de identidad y políticas | Basado en Microsoft Entra con compatibilidad completa con RBAC, registros de auditoría y acceso condicional empresarial. |
Seguridad, cumplimiento y privacidad
El servicio de agente está diseñado para cargas de trabajo empresariales en las que necesita controles seguros sobre la identidad, las redes, el control de datos y la seguridad.
- Controles de seguridad: Use filtros de contenido integrados para ayudar a reducir las salidas no seguras y mitigar los riesgos de inyección de mensajes, incluidos los ataques de inyección entre mensajes (XPIA).
- Controles de aislamiento de red y residencia de datos: utilice redes virtuales y sus propios recursos para satisfacer sus requisitos.
- Traiga sus propios recursos: use sus propios recursos de Azure (por ejemplo, almacenamiento, Azure AI Search y Azure Cosmos DB para el estado de conversación) para satisfacer las necesidades operativas y de cumplimiento. Consulte Uso de sus propios recursos.
- Guía de inteligencia artificial responsable: para obtener un conjunto más amplio de recomendaciones y recursos de gobernanza, consulte Inteligencia artificial responsable de Microsoft Foundry.
Empezar con el Servicio Foundry Agent
Para empezar a trabajar con el servicio Agent, cree un proyecto Foundry en la suscripción de Azure.
Si está desarrollando en código, consulte los SDK de Microsoft Foundry para obtener instrucciones y opciones del SDK.
Si es la primera vez que usa el servicio, comience con las guías de configuración y inicio rápido del entorno.
Cree un proyecto con los recursos necesarios. Después de crear un proyecto, implemente un modelo compatible como GPT-4o. Cuando tenga un modelo implementado, puede empezar a realizar llamadas API al servicio del agente mediante los SDK.
Puede encontrar una lista de ejemplos oficiales con el nuevo SDK del agente de Python en GitHub.
BCDR para agentes
Para admitir la resiliencia del servicio, el servicio de agentes se basa en cuentas de Azure Cosmos DB que el cliente aprovisiona para la continuidad del negocio y la recuperación ante desastres (BCDR). Este enfoque ayuda a garantizar que el estado del agente pueda conservarse y recuperarse en caso de una interrupción regional.
Como cliente estándar de Azure, aprovisiona y administra su propia cuenta de Azure Cosmos DB de inquilino único. Se almacena todo el estado del agente en esta cuenta. Puede controlar la copia de seguridad y la recuperación mediante funcionalidades nativas en Azure Cosmos DB.
Si la región primaria deja de estar disponible, el agente se conecta automáticamente a la misma cuenta de Azure Cosmos DB en la región secundaria. Dado que Cosmos DB conserva todo el historial, el agente puede seguir funcionando con una interrupción mínima.
Aprovisione y mantenga la cuenta de Azure Cosmos DB y configure las directivas de copia de seguridad y recuperación adecuadas. Este esfuerzo ayuda a garantizar una continuidad sin problemas si la región primaria deja de estar disponible.
Para obtener instrucciones de configuración, consulte Uso de sus propios recursos y redes virtuales.
Costos
El uso del servicio del agente puede conllevar costos del modelo que implemente y de los recursos de Azure que utilice para el proyecto (por ejemplo, el registro de actividades y los recursos administrados por el cliente que se conecten).
Para comprender y administrar los controladores de costos, consulte Planeamiento y administración de costos.
Solución de problemas
Si está bloqueado para empezar, compruebe estos problemas comunes:
- El modelo no está disponible en su región: consulte los modelos que informan a los agentes.
- Las solicitudes se limitan o producen errores debido a la cuota: consulte Cuotas y límites para el servicio del agente.
- No puede acceder a recursos ni implementaciones: confirme las asignaciones de roles y siga la configuración del entorno.
- Debe depurar llamadas a herramientas o comportamiento del agente: comience con agentes de seguimiento con el SDK y las métricas.