Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Os agentes se tornam mais poderosos quando você os equipa com ferramentas especializadas que ampliam suas capacidades centrais. O Copilot Studio oferece três categorias principais de ferramentas para agentes:
- Prompts de IA para gerar respostas inteligentes
- Protocolo de Contexto de Modelo (MCP) para integrações padronizadas
- Ferramenta de uso de computador para automatizar processos de desktop
Este artigo explora como cada tipo de ferramenta funciona, quando usá-las e como elas podem ajudar a construir agentes mais capazes e eficientes. Você também aprende sobre as diferenças entre máquinas hospedadas e de transporte de suas próprias máquinas para cenários de uso de computadores, além de orientações sobre a escolha entre as abordagens tradicionais de Automação de Processos Robóticos (RPA) e Agentes de Uso de Computador (CUA).
Gere uma resposta usando prompts de IA
Prompts de IA usam um conjunto de instruções para gerar uma resposta a partir de um modelo de IA. Você pode incluir variáveis para inserir mais texto ou documentos nessas instruções. A saída é normalmente fornecida em formato texto simples ou JSON. Você pode selecionar qualquer modelo de IA embutido no Copilot Studio ou implantado pela Microsoft Foundry para gerar a resposta.
Você pode invocar prompts como uma ferramenta de agente ou dentro de um tópico. Todos os prompts são salvos em uma biblioteca de prompts e suportam o gerenciamento do ciclo de vida da aplicação, controle de acesso baseado em funções e compartilhamento.
Saiba mais sobre como usar prompts para fazer seu corretor realizar tarefas específicas.
Determine quando usar prompts de IA em comparação com o orquestrador
Todo agente construído no Copilot Studio usa o orquestrador para determinar como responder, selecionando ferramentas, tópicos e conhecimentos com base nas instruções do sistema, entrada do usuário e informações contextuais. O orquestrador é o motor por trás da orquestração generativa, que planeja ações e compõe respostas usando as ferramentas e descrições do agente.
Embora as respostas guiadas por orquestradores possam parecer semelhantes a prompts de IA, as duas capacidades servem a propósitos diferentes. Prompts de IA são ações independentes baseadas em prompts que dão aos criadores um controle mais profundo sobre a configuração do modelo.
Prompts de IA suportam uma gama mais ampla de modelos, incluindo os disponíveis pela Microsoft Foundry. Eles também suportam recursos como aterramento do Dataverse, entradas de arquivos e interpretador de código.
O orquestrador usa um prompt fixo do sistema e descrições de ferramentas para escolher os blocos de construção corretos para uma determinada solicitação. Os criadores não podem editar o prompt do sistema do orquestrador, mas podem influenciar como ele se comporta por meio das instruções do agente.
Prompts de IA dão controle total sobre a formatação, restrições e lógica, tornando-os a escolha certa para cenários que exigem resultados finamente ajustados ou altamente estruturados. Por exemplo, se você precisa de controle estilístico além da formatação simples ("escreva um poema rimado em estrutura ABAB usando essas exatas palavras"), um prompt é o melhor para você.
O orquestrador funciona bem para tarefas simples, como extrair um único nome de texto. Para extração complexa, use prompts de IA. Por exemplo, puxar múltiplas entidades de um relatório longo e vinculá-las a relacionamentos específicos de domínio (como extrair vários nomes de um relatório de seguro e identificar o proprietário do serviço de reparo de carros associado apenas a uma das partes no incidente).
A decisão entre os prompts do orquestrador e da IA depende do nível de personalização exigido. Se você precisar de controle preciso sobre o comportamento ou saída do modelo, escolha prompts de IA. Para cenários em que raciocínio geral, seleção de ferramentas e formatação leve são suficientes, o orquestrador é a escolha apropriada.
Integre ferramentas de agentes usando MCP
O Protocolo de Contexto do Modelo (MCP) é uma interface universal que modelos de IA usam para interagir com ferramentas externas, fontes de dados e ambientes de usuário de forma consistente e escalável.
Em comparação, os conectores do Power Platform exigem que você descreva cada ação e suas entradas, e que atualize essas descrições conforme novas definições se tornam disponíveis. Codificação personalizada e integração para cada ferramenta é mais complexa e menos escalável.
Use os servidores MCP fornecidos pelo Copilot Studio para serviços da Microsoft como Outlook, Dataverse e GitHub, ou serviços de terceiros como Salesforce e JIRA. Construa servidores MCP personalizados para serviços onde não existem.
Os benefícios do MCP incluem:
- Contexto padronizado para modelos de IA
- Integração perfeita com o Copilot Studio
- Melhoria da eficiência dos desenvolvedores e da experiência do usuário
- Governança, monitoramento e extensibilidade
Considere as seguintes limitações antes de implementar servidores MCP:
- Você não pode enriquecer as descrições das ferramentas com mais contexto sobre quando invocar.
- Tópicos não podem chamar diretamente servidores MCP.
Entenda quando usar o MCP
Você pode alcançar os mesmos resultados no Copilot Studio por meio de várias abordagens de integração. É importante entender quando usar servidores Model Context Protocol (MCP) em comparação com opções mais simples como conectores Power Platform ou chamadas diretas de API REST.
Use o MCP quando precisar de uma forma padronizada e centralizada de expor ferramentas e recursos a múltiplos agentes sem configuração por cliente. Servidores MCP publicam ferramentas e recursos que os agentes podem descobrir, versionar e usar automaticamente de forma consistente porque o servidor MCP define as descrições das ferramentas e suas entradas. Em contraste, adicionar uma API diretamente exige que você descreva manualmente seu propósito e defina suas entradas por agente.
O MCP é especialmente valioso quando APIs upstream mudam com frequência. Em vez de atualizar todos os agentes que consomem a API, você modifica a definição uma vez no servidor MCP, e todos os agentes usam automaticamente a versão atualizada sem republicar. Se não existir servidor MCP, ou se você estiver prototipando rapidamente, chamar APIs diretamente é mais rápido e evita a sobrecarga de configuração necessária para introduzir todo o ciclo de vida do MCP.
A Orquestração Generativa deve ser habilitada para usar MCP. Saiba mais em Como funciona o MCP?
Automatize processos de desktop usando a ferramenta de uso do computador
Usando a ferramenta de uso de computadores, um agente pode operar um computador sem a necessidade de scripts ou APIs de automação. Em vez de usar scripts ou APIs, você configura o agente usando um prompt. O agente determina a melhor forma de alcançar seus objetivos. Durante o processo, o agente tira uma captura de tela em cada etapa, analisa para decidir a próxima ação, executa essa ação e repete esse ciclo até que a tarefa seja concluída. Capturas de tela tiradas pelo agente e passos de raciocínio estão disponíveis como parte do histórico de execução.
Cenários comuns em que um agente pode se beneficiar da ferramenta de uso do computador incluem:
- Entrada de dados: Para cada linha do arquivo CSV recebido, crie o pedido de venda no SAP e escreva o ID do pedido gerado de volta no arquivo.
- Extração de dados: Acesse cada portal de fornecedores, pesquise o SKU listado, extraia o preço, o estoque e o prazo de entrega, e insira os resultados com um carimbo de data no banco de donos.
- Em vários aplicativos: Exporte as transações do dia do cliente financeiro desktop, navegue pelo QuickBooks e registre cada entrada na conta correta.
Entenda máquinas hospedadas vs. traga sua própria máquina
Os agentes podem chamar a ferramenta de uso do computador em uma máquina hospedada pela Microsoft ou em uma máquina de transporte de sua própria máquina (BYO). Máquinas hospedadas estão disponíveis para uso imediato sem necessidade de configuração ou faturamento de TI. Eles pertencem a um pool compartilhado de PCs com Windows 365 Cloud pré-provisionados que não são conectados ao Entra ao tenant do cliente. As máquinas BYO devem ser provisionadas previamente dentro da própria rede virtual do cliente. Você deve registrar e gerenciar máquinas BYO no Power Automate.
Use máquinas BYO para cenários de produção. Eles têm suporte ao Microsoft Entra ID, são registrados no Intune e suportam casos de uso tanto para automação web quanto para desktop. Use máquinas hospedadas apenas para prototipagem devido às suas capacidades limitadas. Apenas um PC em nuvem está disponível por usuário por vez, e o uso pode ser limitado conforme a demanda.
Saiba mais em Configurar onde o uso do computador ocorre.
Automação Robótica de Processos (RPA) vs. Agentes Usuários de Computador (CUA)
Automação Robótica de Processos (RPA) é a automação de um computador usando um script. Você pode aplicar isso em muitos dos mesmos cenários do CUA. No entanto, é importante entender as diferenças entre RPA e CUA.
| Aspecto | RPA | CUA |
|---|---|---|
| Tipo de automação | Baseado em regras | Orientado por LLM |
| Método de interação | Árvore UI | Visão |
| Criação | Roteiro, complexo | Instruções em linguagem natural |
| Tomada de decisão | Regras pré-definidas | Decisões autônomas baseadas em visuais |
| Flexibilidade | Flexibilidade limitada | Alta flexibilidade |
| Tratamento de erros | Tratamento de erros estáticos | Autocorreção baseada em feedback visual |
Use RPA quando:
- Apenas recursos de Disponibilidade Geral (GA) são permitidos.
- A interface do usuário é estável. As telas, campos e seletores raramente mudam.
- As regras são claras. Você pode capturar decisões em regras.
- Velocidade importa. Alto volume. Cada segundo conta.
- Uma equipe de RPA é dona dele. A equipe possui conhecimento prévio em desenvolvimento e gestão de RPA.
Use a CUA quando:
- As interfaces de usuário mudam ou variam amplamente. Você trabalha com vários aplicativos e redesigns frequentes.
- Você precisa rápido. O atraso da equipe de RPA está cheio.
- A interface do usuário importa. A tarefa depende do que está visível na tela, como gráficos, cores e layouts dinâmicos.
- As decisões são confusas. O agente deve raciocinar, escolher o próximo passo ou se autocorrigir.