Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A maioria das empresas não quer apenas chatbots. Eles querem automação mais rápida e com menos erros. Essa vontade pode significar resumir documentos, processar faturas, gerenciar chamados de suporte ou publicar posts em blogs. Em todos os casos, a meta é a mesma: liberar pessoas e recursos para se concentrarem no trabalho de maior valor descarregando tarefas repetitivas e previsíveis.
Os LLMs (grandes modelos de linguagem) introduzem um novo tipo de automação com sistemas que podem entender dados não estruturados, tomar decisões e gerar conteúdo. Na prática, as empresas podem ter dificuldade em ir além das demonstrações e entrar em produção. Os LLMs podem descompassar, estar incorretas e não ter responsabilidade. Sem visibilidade, imposição de políticas e orquestração, esses modelos são difíceis de confiar em fluxos de trabalho de negócios reais.
O Microsoft Foundry foi projetado para alterar isso. É uma plataforma que combina modelos, ferramentas, estruturas e governança em um sistema unificado para a criação de agentes inteligentes. No centro deste sistema está o Foundry Agent Service, que permite a operação de agentes durante o desenvolvimento, implantação e produção.
O Serviço de Agente conecta as partes principais da Foundry, como modelos, ferramentas e estruturas, em um único runtime. Ele gerencia conversas, orquestra invocações de ferramentas, impõe a segurança de conteúdo e integra-se a sistemas de identidade, redes, e observabilidade. Esses recursos ajudam você a criar agentes seguros, escalonáveis e prontos para produção.
Ao abstrair a complexidade da infraestrutura e integrar confiança e segurança desde o design, o Serviço do Agente pode ajudá-lo a passar do protótipo para a produção com confiança.
Pré-requisitos
- Uma assinatura do Azure com permissão para criar e gerenciar recursos do Foundry.
- Um projeto do Foundry. Se você ainda não criou um, comece com a configuração do ambiente.
- Um modelo implantado que seu agente pode usar. A disponibilidade do modelo e da região pode variar; ver modelos que informam os agentes.
Disponibilidade, regiões e limites
Os recursos do Serviço de Agente podem variar com base na experiência Foundry que você está usando, assim como no modelo e na região escolhidos.
- Para limites de serviço, cotas e considerações sobre restrições, consulte Cotas e limites para o Serviço de Agente.
- Para obter suporte a modelos e regiões, consulte modelos que informam os agentes.
Se você estiver criando seu primeiro agente, comece com os links de início rápido no Serviço do Foundry Agent para garantir que você esteja no caminho certo da API para sua experiência de Foundry.
O que é um agente de IA?
Os agentes tomam decisões, invocam ferramentas e participam de fluxos de trabalho. Eles executam essas tarefas às vezes de forma independente e, às vezes, em colaboração com outros agentes ou humanos. Eles são fundamentais para a automação de processos reais.
Os agentes criados por meio da Foundry não são monólitos. São unidades composáveis. Cada agente tem uma função específica, é alimentado pelo modelo certo e é equipado com as ferramentas certas. Você implanta cada agente em um runtime seguro, observável e governável.
Um agente tem três componentes principais:
- Modelo (LLM): capacita o raciocínio e a compreensão da linguagem.
-
Instruções: defina as metas, o comportamento e as restrições do agente. Eles podem ter os seguintes tipos:
- Declarativo:
- Baseado em prompts: um único agente definido declarativamente que combina configuração de modelo, instrução, ferramentas e prompts de linguagem natural para orientar o comportamento.
- Fluxo de trabalho: um fluxo de trabalho agêncico que pode ser expresso como um YAML ou outro tipo de código para orquestrar múltiplos agentes ou para disparar uma ação com base em determinados critérios.
- Hospedado: agentes em contêineres criados e implantados no código e hospedados pela Foundry.
- Declarativo:
- Ferramentas: permitir que o agente recupere conhecimento ou execute uma ação.
Os agentes recebem entradas não estruturadas, como prompts de usuário, alertas ou mensagens de outros agentes. Elas produzem saídas na forma de resultados ou mensagens da ferramenta. Ao longo do caminho, eles podem chamar ferramentas para executar extração de dados ou acionar ações.
Como funcionam os agentes no Foundry?
Pense no Foundry como uma linha de montagem para agentes inteligentes. Como qualquer fábrica moderna, a Foundry reúne estações especializadas que são responsáveis por moldar parte do produto final. Em vez de máquinas e correias transportadoras, a fábrica de agentes usa modelos, ferramentas, políticas e orquestração para criar agentes seguros, testáveis e prontos para produção. Veja como a fábrica funciona passo a passo:
1. Modelos
A linha de montagem é iniciada quando você seleciona um modelo que confere inteligência ao seu agente. Escolha entre um catálogo crescente de LLMs (grandes modelos de linguagem), incluindo GPT-4o, GPT-4, GPT-3.5 (Azure OpenAI) e outros como Llama. O modelo é o núcleo de raciocínio do agente que informa suas decisões.
2. Personalização
Modele o modelo para se ajustar ao seu caso de uso. Personalize seu agente com ajuste fino, destilação ou solicitações específicas do domínio. Codificar o comportamento do agente, o conhecimento específico da função e os padrões de desempenho anterior usando dados capturados de conteúdo de conversa real e resultados da ferramenta.
3. Conhecimento e ferramentas
Equipe seu agente com ferramentas. Essas ferramentas permitem que o agente acesse o conhecimento corporativo (como Bing, SharePoint e Azure AI Search) e execute ações reais (por meio de Aplicativos Lógicos do Azure, Azure Functions, OpenAPI e muito mais). Esta etapa aprimora a capacidade do agente de expandir suas funcionalidades.
4. Orquestração
O agente precisa de coordenação. Os fluxos de trabalho orquestram o ciclo de vida completo, como lidar com chamadas de ferramenta, atualizar o estado da conversa, gerenciar novas tentativas e registrar saídas em log.
5. Observabilidade
Testar e monitorar agentes. A foundry pode capturar logs, rastreamentos e avaliações em cada etapa. Com visibilidade completa no nível da conversa e integração do Application Insights, as equipes podem inspecionar cada decisão e melhorar continuamente os agentes ao longo do tempo.
6. Confiança
Verifique se os agentes são adequados e confiáveis para a carga de trabalho à qual estão atribuídos. A Foundry aplica recursos de confiança de nível empresarial, incluindo identidade via Microsoft Entra, RBAC (controle de acesso baseado em função), filtros de conteúdo, criptografia e isolamento de rede. Você escolhe como e onde seus agentes são executados usando a infraestrutura gerenciada pela plataforma ou a infraestrutura "traga seu próprio".
O resultado é um agente pronto para produção: confiável, extensível e seguro para implantar em seus fluxos de trabalho.
Por que usar o Serviço do Foundry Agent?
O Serviço de Agente fornece uma base pronta para produção para implantar agentes inteligentes em ambientes empresariais. Veja como ele se compara em relação às principais capacidades.
| Capability | Serviço de Agente |
|---|---|
| Visibilidade das conversas | Acesso total a conversas estruturadas, incluindo mensagens de usuário para agente e agente para agente. Ideal para interfaces de usuário, depuração e treinamento. |
| Coordenação de vários agentes | Suporte interno para mensagens de agente para agente. |
| Orquestração de ferramentas | Execução do lado do servidor e repetição de chamadas de ferramentas com log estruturado. Nenhuma orquestração manual é necessária. |
| Confiança e segurança | Filtros de conteúdo integrados para ajudar a evitar o uso indevido e mitigar os riscos de injeção de solicitação, incluindo ataques de injeção cruzada de solicitação (XPIA). Todas as saídas são governadas pela política. |
| Integração empresarial | Capacidade de trazer seu próprio armazenamento, índice do Azure AI Search e rede virtual para atender às necessidades de conformidade. |
| Observabilidade e depuração | Rastreabilidade completa de conversas, invocações de ferramentas e rastreamentos de mensagens; Integração do Application Insights para dados de uso. |
| Controle de identidade e política | Criado no Microsoft Entra com suporte total para RBAC, logs de auditoria e acessos condicionais corporativos. |
Segurança, privacidade e conformidade
O Serviço de Agente foi projetado para cargas de trabalho corporativas em que você precisa de controles fortes sobre identidade, rede, manipulação de dados e segurança.
- Controles de segurança: Use filtros de conteúdo integrados para ajudar a minimizar saídas não seguras e mitigar os riscos de injeção de prompt, incluindo ataques de injeção de prompt cruzado (XPIA).
- Isolamento de rede e controles de residência de dados: use redes virtuais e traga seus próprios recursos para atender às suas necessidades.
- Traga seus próprios recursos: use seus próprios recursos do Azure (por exemplo, armazenamento, Azure AI Search e Azure Cosmos DB para estado de conversa) para atender às necessidades operacionais e de conformidade. Consulte Usar seus próprios recursos.
- Diretrizes responsáveis de IA: para obter um conjunto mais amplo de recomendações e recursos de governança, consulte AI Responsável para Microsoft Foundry.
Comece com o Foundry Agent Service
Para começar a usar o Serviço de Agente, crie um projeto do Foundry em sua assinatura do Azure.
Se você estiver desenvolvendo em código, consulte os SDKs do Microsoft Foundry para opções de SDK e diretrizes.
Se for sua primeira vez usando o serviço, comece com a configuração do ambiente e guias de início rápido .
Crie um projeto com os recursos necessários. Depois de criar um projeto, implante um modelo compatível, como GPT-4o. Quando você tem um modelo implantado, pode começar a fazer chamadas de API para o Serviço de Agente usando os SDKs.
Você pode encontrar uma lista de exemplos oficiais com o novo SDK do agente do Python no GitHub.
BCDR para agentes
Para dar suporte à resiliência do serviço, o Serviço de Agente conta com contas do Azure Cosmos DB provisionadas pelo cliente para BCDR (continuidade dos negócios e recuperação de desastre). Essa abordagem ajuda a garantir que o estado do agente possa ser preservado e recuperado no caso de uma interrupção regional.
Como cliente do Azure Standard, você provisiona e gerencia sua própria conta do Azure Cosmos DB de locatário único. Você armazena todo o estado do agente nesta conta. Você controla o backup e a recuperação por meio de recursos nativos no Azure Cosmos DB.
Se a região primária ficar indisponível, o agente se conectará automaticamente à mesma conta do Azure Cosmos DB na região secundária. Como o Cosmos DB preserva todo o histórico, o agente pode continuar a operação com interrupção mínima.
Provisione e mantenha sua conta do Azure Cosmos DB e configure as políticas de backup e recuperação apropriadas. Esse esforço ajuda a garantir a continuidade perfeita se a região primária ficar indisponível.
Para obter diretrizes de configuração, consulte Usar seus próprios recursos e redes virtuais.
Custos
O uso do Serviço de Agente pode acarretar custos tanto do modelo que você implanta quanto dos recursos do Azure usados para o seu projeto, como logs e quaisquer recursos gerenciados pelo cliente que você conectar.
Para entender e gerenciar drivers de custo, consulte Planejar e gerenciar custos.
Resolução de problemas
Se você estiver bloqueado para começar, verifique estes problemas comuns:
- O modelo não está disponível em sua região: consulte modelos que informam os agentes.
- As solicitações são restritas ou falham devido à cota: Consulte Cotas e limites para o Serviço de Agente.
- Você não pode acessar recursos ou implantações: confirme suas atribuições de função e siga a configuração do ambiente.
- Você precisa depurar chamadas de ferramenta ou comportamento do agente: comece com os agentes de rastreamento com o SDK e as métricas.