Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
Los agentes se vuelven más poderosos cuando los equipas con herramientas especializadas que amplían sus capacidades principales. Copilot Studio ofrece tres categorías principales de herramientas para agentes:
- Prompts de IA para generar respuestas inteligentes
- Protocolo de Contexto de Modelo (MCP) para integraciones estandarizadas
- Herramienta de uso de ordenadores para automatizar procesos de escritorio
Este artículo explora cómo funciona cada tipo de herramienta, cuándo usarlas y cómo pueden ayudarte a crear agentes más capaces y eficientes. También aprendes sobre las diferencias entre máquinas alojadas y de traer tu propia máquina para escenarios de uso informático, además de orientación para elegir entre los enfoques tradicionales de Automatización Robótica de Procesos (RPA) y Agentes Informáticos (CUA).
Genera una respuesta usando prompts de IA
Los prompts de IA utilizan un conjunto de instrucciones para generar una respuesta a partir de un modelo de IA. Puedes incluir variables para insertar más texto o documentos en estas instrucciones. La salida se proporciona normalmente en texto plano o en formato JSON. Puedes seleccionar cualquier modelo de IA integrado en Copilot Studio o desplegado a través de Microsoft Foundry para generar la respuesta.
Puedes invocar prompts como herramienta de agente o desde dentro de un tema. Todas las preguntas se guardan en una biblioteca de prompts y soportan la gestión del ciclo de vida de la aplicación, el control de acceso basado en roles y el intercambio.
Infórmate más sobre cómo usar prompts para que tu agente realice tareas específicas.
Determina cuándo usar prompts de IA frente a el orquestador
Cada agente construido en Copilot Studio utiliza el orquestador para determinar cómo responder seleccionando herramientas, temas y conocimientos basándose en las instrucciones del sistema, la entrada del usuario y la información contextual. El orquestador es el motor detrás de la orquestación generativa, que planifica acciones y compone respuestas utilizando las herramientas y descripciones del agente.
Aunque las respuestas impulsadas por el orquestador puedan parecer similares a las indicaciones de IA, ambas capacidades cumplen propósitos diferentes. Los prompts de IA son acciones independientes basadas en prompts que otorgan a los creadores un mayor control sobre la configuración del modelo.
Los prompts de IA soportan una gama más amplia de modelos, incluidos los disponibles a través de Microsoft Foundry. También soportan funciones como la puesta a tierra de Dataverse, entradas de archivos e intérprete de código.
El orquestador utiliza una indicación fija del sistema y descripciones de herramientas para elegir los bloques de construcción adecuados para una solicitud determinada. Los creadores no pueden editar el prompt del sistema del orquestador, pero sí pueden influir en cómo se comporta mediante instrucciones del agente.
Los prompts de IA ofrecen control total sobre el formato, las restricciones y la lógica, convirtiéndolos en la elección adecuada para escenarios que requieren resultados finamente ajustados o altamente estructurados. Por ejemplo, si necesitas un control estilístico más allá del formato simple ("escribe un poema rimado en estructura ABAB usando estas palabras exactas"), un prompt es lo más adecuado.
El orquestrador funciona bien para tareas sencillas como extraer un solo nombre del texto. Para extracciones complejas, usa prompts de IA. Por ejemplo, extraer varias entidades de un informe largo y vincularlas a relaciones específicas de dominio (como extraer varios nombres de un informe de seguro e identificar al propietario del servicio de reparación de coches asociado solo a una de las partes del incidente).
La decisión entre indicaciones de orquestador y IA depende del nivel de personalización que requiera. Si necesitas un control preciso sobre el comportamiento o la salida del modelo, elige prompts de IA. Para escenarios en los que el razonamiento general, la selección de herramientas y el formato ligero son suficientes, el orquestador es la elección adecuada.
Integra herramientas de agentes usando MCP
El Protocolo de Contexto del Modelo (MCP) es una interfaz universal que los modelos de IA utilizan para interactuar con herramientas externas, fuentes de datos y entornos de usuario de forma coherente y escalable.
En comparación, los conectores de Power Platform requieren que describas cada acción y sus entradas, y que actualices estas descripciones a medida que se dispongan de nuevas definiciones. La codificación personalizada y la integración para cada herramienta es más compleja y menos escalable.
Utiliza los servidores MCP que proporciona Copilot Studio para servicios de Microsoft como Outlook, Dataverse y GitHub, o servicios de terceros como Salesforce y JIRA. Construye servidores MCP personalizados para servicios donde no existan.
Los beneficios del MCP incluyen:
- Contexto estandarizado para modelos de IA
- Integración fluida con Copilot Studio
- Mejora de la eficiencia de los desarrolladores y la experiencia del usuario
- Gobernanza, supervisión y extensibilidad
Considera las siguientes limitaciones antes de implementar servidores MCP:
- No puedes enriquecer las descripciones de herramientas con más contexto sobre cuándo invocar.
- Los Topics no pueden llamar directamente a los servidores MCP.
Entiende cuándo usar MCP
Puedes lograr los mismos resultados en Copilot Studio mediante varios enfoques de integración. Es importante entender cuándo usar servidores Model Context Protocol (MCP) frente a opciones más sencillas como conectores Power Platform o llamadas directas a la API REST.
Utiliza MCP cuando necesites una forma estandarizada y gestionada centralmente de exponer herramientas y recursos a múltiples agentes sin configuración por cliente. Los servidores MCP publican herramientas y recursos que los agentes pueden descubrir, versionar y usar automáticamente de forma consistente porque el servidor MCP define las descripciones de las herramientas y sus entradas. En cambio, añadir una API directamente requiere que describas manualmente su propósito y definas sus entradas por agente.
MCP es especialmente valioso cuando las APIs upstream cambian con frecuencia. En lugar de actualizar todos los agentes que consumen la API, modificas la definición una vez en el servidor MCP, y todos los agentes usan automáticamente la versión actualizada sin volver a publicar. Si no existe un servidor MCP, o estás prototipando rápidamente, llamar directamente a las APIs es más rápido y evita la sobrecarga de configuración necesaria para introducir todo el ciclo de vida del MCP.
La Orquestación generativa debe estar habilitada para usar MCP. Más información en ¿Cómo funciona el MCP?
Automatiza los procesos de escritorio utilizando la herramienta de uso del ordenador
Al utilizar la herramienta de uso de ordenadores, un agente puede operar un ordenador sin necesidad de scripts de automatización o APIs. En lugar de usar scripts o APIs, configuras el agente usando un prompt. El agente determina cómo alcanzar mejor sus objetivos. Durante el proceso, el agente toma una captura de pantalla en cada paso, la analiza para decidir la siguiente acción, ejecuta esa acción y repite este ciclo hasta que la tarea se completa. Las capturas de pantalla tomadas por el agente y los pasos de razonamiento están disponibles como parte del historial de partidas.
Los escenarios comunes en los que un agente puede beneficiarse de la herramienta de uso informático incluyen:
- Entrada de datos: Para cada fila del archivo CSV entrante, crea la orden de venta en SAP y escribe el ID de pedido generado de nuevo en el archivo.
- Extracción de datos: Accede a cada portal de proveedores, busca en el SKU listado, extrae el precio, el stock y el plazo de entrega, e inserta los resultados con una marca de tiempo en la base de datos.
- En varias aplicaciones: exporta las transacciones del día desde el cliente financiero de escritorio, navega por QuickBooks y registra cada entrada en la cuenta correcta.
Entiende las máquinas alojadas vs. trae tu propia máquina
Los agentes pueden llamar a la herramienta de uso del ordenador en una máquina alojada por Microsoft o en una máquina de traer tu propio ordenador (BYO). Las máquinas alojadas están disponibles para su uso inmediato sin necesidad de configuración o facturación de TI. Pertenecen a un conjunto compartido de PCs Windows 365 Cloud preprovisionados que no están unidos a Entra-Alla al tenant del cliente. Las máquinas BYO deben provisionarse previamente dentro de la propia red virtual del cliente. Debes registrar y gestionar máquinas BYO en Power Automate.
Usa máquinas BYO para escenarios de producción. Tienen soporte para Microsoft Entra ID, están inscritos en Intune y soportan casos de uso tanto web como de automatización de escritorio. Utiliza máquinas alojadas solo para prototipar debido a sus capacidades limitadas. Solo hay un PC en la nube disponible por usuario a la vez, y el uso puede limitarse según la demanda.
Obtenga más información en Configurar dónde se utiliza el equipo.
Automatización Robótica de Procesos (RPA) vs. Agentes que Usan Ordenadores (CUA)
La Automatización Robótica de Procesos (RPA) es la automatización de un ordenador utilizando un script. Puedes aplicarlo a muchos de los mismos escenarios que CUA. Sin embargo, es importante entender las diferencias entre RPA y CUA.
| Aspecto | RPA | CUA |
|---|---|---|
| Tipo de automatización | Basado en reglas | Impulsado por LLM |
| Método de interacción | Árbol de interfaz | Vision |
| Creación | Guion, complejo | Instrucciones en lenguaje natural |
| Toma de decisiones | Reglas predefinidas | Decisiones autónomas basadas en la imagen |
| Flexibilidad | Flexibilidad limitada | Alta flexibilidad |
| Control de errores | Gestión de errores estáticos | Autocorrección basada en retroalimentación visual |
Utiliza RPA cuando:
- Solo se permiten características de Disponibilidad Generalizada (GA).
- La interfaz de usuario es estable. Las pantallas, campos y selectores rara vez cambian.
- Las reglas son claras. Puedes capturar decisiones en reglas.
- La velocidad importa. Alto volumen. Cada segundo cuenta.
- Un equipo de RPA es el propietario. El equipo cuenta con conocimientos previos en desarrollo y gestión de RPA.
Usar CUA cuando:
- Las interfaces de usuario varían o se adaptan mucho. Trabajas con varias aplicaciones y rediseños frecuentes.
- Lo necesitas rápido. El retraso del equipo de RPA está lleno.
- La interfaz de usuario importa. La tarea depende de lo que se vea en pantalla, como gráficos, colores y disposiciones dinámicas.
- Las decisiones son confusas. El agente debe razonar, elegir el siguiente paso o corregirse a sí mismo.