Modelos de aplicativos de IA

Esta seção da documentação apresenta os modelos de aplicativo de IA e artigos relacionados que usam esses modelos para demonstrar como executar as principais tarefas do desenvolvedor. Os modelos de aplicativo de IA fornecem implementações de referência regulares e fáceis de implantar que ajudam a garantir um ponto de partida de alta qualidade para os aplicativos de IA.

Há duas categorias de modelos de aplicativo de IA, blocos de construção e soluções de ponta a ponta. As seções a seguir apresentam alguns dos principais modelos em cada categoria para a linguagem de programação selecionada na parte superior deste artigo.

Para navegar por uma lista abrangente, incluindo esses e outros modelos de C#, consulte os modelos de aplicativo de IA na galeria de Modelos de Aplicativo de IA.

Para procurar uma lista abrangente, incluindo esses e outros modelos de Python, consulte os modelos de aplicativo de IA na galeria AI App Template.

Para procurar uma lista abrangente, incluindo esses e outros modelos de Java, consulte os modelos de aplicativo de IA na galeria AI App Template.

Para procurar uma lista abrangente, incluindo esses e outros modelos JavaScript/TypeScript, consulte os modelos de aplicativo de IA na galeria de Modelos de Aplicativo de IA.

Blocos de construção

Blocos de construção são amostras em escala menor que focam em cenários e tarefas específicos. A maioria dos blocos de construção demonstra a funcionalidade que usa a solução de ponta a ponta para um aplicativo de chat que usa seus próprios dados.

Bloco de construção	Descrição
Balanceamento de carga com Azure Container Apps	Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de token e modelo do Azure OpenAI. Essa abordagem usa Azure Container Apps para criar três pontos de extremidade Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.

Bloco de construção	Descrição
Configurar a segurança do documento para o aplicativo de chat	Ao criar um aplicativo de chat usando o padrão RAG com seus próprios dados, certifique-se de que cada usuário receba uma resposta com base em suas permissões. Um usuário autorizado deve ter acesso às respostas contidas nos documentos do aplicativo de chat. Um usuário não autorizado não deve ter acesso a respostas de documentos protegidos que não tem autorização para ver.
Avaliar respostas do aplicativo de chat	Saiba como avaliar as respostas de um aplicativo de chat em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade fundamental). Sempre que você alterar seu aplicativo de chat de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Azure Container Apps	Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de modelo e token do Azure OpenAI. Essa abordagem usa Azure Container Apps para criar três pontos de extremidade Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um desses três pontos de extremidade.
Balanceamento de carga com o Gerenciamento de API	Saiba como adicionar balanceamento de carga ao seu aplicativo e estender o aplicativo de chat além dos limites de cota de modelo e token da Azure OpenAI. Essa abordagem usa o Azure API Management para criar três pontos de extremidade do Azure OpenAI, além de um contêiner principal para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Carrege o aplicativo de chat Python com o Locust	Aprenda o processo para executar testes de carga em um aplicativo de chat Python usando o padrão RAG com o Locust, uma ferramenta popular de teste de carga de software livre. O objetivo principal do teste de carga é garantir que a carga esperada em seu aplicativo de chat não exceda a cota atual Azure TPM (Transações OpenAI por Minuto). Ao simular o comportamento do usuário sob carga pesada, você pode identificar possíveis gargalos e problemas de escalabilidade em seu aplicativo.
Proteger seu aplicativo de IA com autenticação sem chave	Aprenda o processo para proteger seu aplicativo de chat Python Azure OpenAI com autenticação sem chave. As solicitações de aplicativo para a maioria dos serviços Azure devem ser autenticadas com conexões sem chave ou sem senha. A autenticação sem chave oferece benefícios aprimorados de gerenciamento e segurança sobre a chave da conta porque não há chave (ou connection string) para armazenar.

Bloco de construção	Descrição
Balanceamento de carga com Azure Container Apps	Saiba como adicionar balanceamento de carga ao seu aplicativo para expandir o aplicativo além dos limites de cota de token e modelo do Azure OpenAI. Essa abordagem utiliza o Azure Container Apps para criar três pontos de extremidade do Azure OpenAI, além de um contêiner principal para direcionar o tráfego de entrada para um dos três pontos de extremidade.

Bloco de construção	Descrição
Avaliar respostas do aplicativo de chat	Saiba como avaliar as respostas de um aplicativo de chat em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade fundamental). Sempre que você alterar seu aplicativo de chat de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Azure Container Apps	Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de tokens e modelos do Azure OpenAI. Essa abordagem usa Azure Container Apps para criar três pontos de extremidade Azure OpenAI, assim como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Balanceamento de carga com o Gerenciamento de API	Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o app de bate-papo além dos limites de cota de token e modelo do Azure OpenAI. Essa abordagem utiliza o Azure API Management para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner principal para direcionar o tráfego de entrada para um dos três pontos de extremidade.

Soluções de ponta a ponta

Soluções de ponta a ponta são amostras de referência abrangentes, incluindo documentação, código-fonte e implantação, permitindo que você use e expanda para seus próprios propósitos.

Converse com seus dados usando Azure OpenAI e Azure AI Search com .NET

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão de Geração Aumentada por Recuperação (RAG), executado no Azure. Ele usa a Pesquisa AI do Azure para recuperação e os grandes modelos de linguagem do Azure OpenAI para experiências de estilo ChatGPT e Q&A.

Para começar a usar esse modelo, consulte Comece com o chat usando sua própria amostra de dados para .NET. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório azure-search-openai-demo-csharp GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps Azure Functions	Azure OpenAI Azure Computer Vision (Visão Computacional do Azure) Azure Form Recognizer Azure AI Search Azure Storage	GPT 3.5 Turbo GPT 4.0

Copilot de chat de varejo Contoso com .NET e Semantic Kernel

Este modelo implementa a Contoso Outdoors, uma loja conceitual especializada em equipamentos para atividades ao ar livre para entusiastas de caminhadas e acampamentos. Essa loja virtual aumenta o envolvimento do cliente e o suporte de vendas por meio de um agente de chat inteligente. Esse agente é alimentado pelo padrão RAG (Geração Aumentada Recuperativa) no Microsoft Azure AI Stack, enriquecido com suporte ao Semantic Kernel e ao Prompty.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório contoso-chat-csharp-prompty GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps	Azure OpenAI Microsoft Entra ID Identidade Gerenciada do Azure Azure Monitor Azure AI Search Microsoft Foundry Azure SQL Azure Storage	GPT 3.5 Turbo GPT 4.0

Automatização de processos com conversão da fala para texto e sumarização usando .NET e GPT 3.5 Turbo

Esse modelo é uma solução de automação de processos que recebe problemas relatados por trabalhadores de campo e chão de fábrica em uma empresa chamada Contoso Manufacturing, uma empresa de fabricação que fabrica baterias de carros. Os problemas são compartilhados pelos trabalhadores ao vivo por meio de entrada de microfone ou pré-gravados como arquivos de áudio. A solução traduz a entrada de áudio de fala em texto e, em seguida, usa um LLM e Prompty ou Promptflow para resumir o problema e retornar os resultados em um formato especificado pela solução.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório summarization-openai-csharp-prompty GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps	Conversão de Fala em Texto Resumo Azure OpenAI	GPT 3.5 Turbo

Converse com seus dados usando Azure OpenAI e Azure AI Search com Python

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão de Geração Aumentada por Recuperação (RAG), executado no Azure. Ele usa Azure AI Search para recuperação e modelos de linguagem grandes da Azure OpenAI para experiências do estilo ChatGPT e de perguntas e respostas (Q&A).

Para começar a usar esse modelo, consulte Inicie o chat usando sua própria amostra de dados para Python. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório azure-search-openai-demo GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps	Azure OpenAI Azure AI Search Armazenamento de Blobs do Azure Azure Monitor Azure Document Intelligence	GPT 3.5 Turbo GPT 4 GPT 4o GPT-4.0 mini

Este modelo é uma solução multiagente de escrita criativa para ajudar os usuários a escrever artigos. Ele demonstra como criar e trabalhar com agentes de IA controlados por Azure OpenAI.

Ele inclui:

Um aplicativo Flask que recebe um artigo e instruções de um usuário.
Um agente de pesquisa que usa a API de Pesquisa do Bing para pesquisar o artigo.
Um agente de produto que usa Azure AI Search para fazer uma pesquisa de similaridade semântica para produtos relacionados de um repositório de vetores.
Um agente redator para combinar a pesquisa e as informações do produto em um artigo útil.
Um agente editor para refinar o artigo apresentado ao usuário.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório agent-openai-python-prompty GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Registry Azure Kubernetes	Azure OpenAI Pesquisa do Bing Identidade Gerenciada do Azure Azure Monitor Azure AI Search Microsoft Foundry	GPT 3.5 Turbo GPT 4.0 DALL-E

Copilot de Chat de Varejo da Contoso com a Foundry

Este modelo implementa o Chat da Contoso - uma solução de copilot de varejo para Contoso Outdoor que usa um padrão de design de geração aumentada de recuperação para basear respostas de chatbot nos dados do produto e do cliente do varejista. Os clientes podem fazer perguntas no site em linguagem natural e obter respostas relevantes com possíveis recomendações com base em seu histórico de compras - com práticas responsáveis de IA para garantir a qualidade e a segurança da resposta.

Este modelo ilustra o GenAIOps (fluxo de trabalho de ponta a ponta) para a criação de um copilot baseado em RAG code-first com Azure IA e Prompty. Ao explorar e implantar este exemplo, aprenda a:

Idear e iterar rapidamente em protótipos de aplicativo usando Prompty
Implantar e usar modelos Azure OpenAI para chat, inserções e avaliação
Utilize o Azure AI Search (índices) e o Azure Cosmos DB (bancos de dados) para seus dados
Avalie a qualidade das respostas do chat usando fluxos de avaliação assistidos por IA
Hospedar o aplicativo como um ponto de extremidade FastAPI implantado em Azure Container Apps
Provisionar e implantar a solução usando a CLI do desenvolvedor do Azure
Apoie as práticas de IA responsável com segurança e avaliações de conteúdo

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório contoso-chat GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps	Azure OpenAI Azure AI Search Fundição Pronto Azure Cosmos DB	GPT 3.5 Turbo GPT 4.0 Runtime de Integração Gerenciado (MIR)

Automação de processos com conversão de fala em texto e resumo com o Foundry

Este modelo cria um aplicativo baseado na Web que permite que os trabalhadores de uma empresa chamada Contoso Manufacturing relatem problemas por meio de texto ou fala. A entrada de áudio é traduzida em texto e depois resumida para destacar informações importantes e o relatório é enviado ao departamento apropriado.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório summarization-openai-python-promptflow GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps	Fundição Serviço de Conversão de Fala em Texto Pronto INTEGRATION RUNTIME Gerenciado (MIR)	GPT 3.5 Turbo

Assistente de Análise de API Copilot com Python e Foundry

Este modelo é uma API do Assistente para conversar com dados tabulares e realizar análises em linguagem natural.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório assistant-data-openai-python-promptflow GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
serviço de Aprendizado de Máquina	Azure AI Search Fundição Runtime de Integração Gerenciado (MIR) Azure OpenAI	GPT 3.5 Turbo GPT 4

Converse com seus dados usando Azure OpenAI e Azure AI Search com Java

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão Retrieval-Augmented Generation (RAG) em execução no Azure. Ele usa a Pesquisa AI do Azure para recuperação e os grandes modelos de linguagem do Azure OpenAI para experiências de estilo ChatGPT e Q&A.

Para começar a usar este modelo, consulte Como começar com o chat usando sua própria amostra de dados para Java. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório azure-search-openai-demo-java GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure App Service Azure Container Apps Azure Kubernetes Service	Azure OpenAI Azure AI Search Azure Document Intelligence Azure Storage Azure App Insights Azure Service Bus Azure Event Grid	gpt-35-turbo

Assistente Bancário Multiagente com Java e Semantic Kernel

Este projeto é uma Prova de Conceito (PoC) para explorar o âmbito inovador da IA generativa dentro do contexto de arquiteturas multiagente. Aproveitando Java e a estrutura de orquestração de IA do Microsoft Semantic Kernel, nosso objetivo é criar um aplicativo Web de chat para demonstrar a viabilidade e a confiabilidade do uso de agentes de IA generativos para transformar a experiência do usuário de cliques na Web em conversas em linguagem natural, maximizando a reutilização dos dados de carga de trabalho e apIs existentes.

O principal caso de uso gira em torno de um assistente pessoal bancário projetado para revolucionar a maneira como os usuários interagem com suas informações de conta bancária, histórico de transações e funcionalidades de pagamento. Utilizando o poder da IA gerativa dentro de uma arquitetura de vários agentes, esse assistente tem como objetivo fornecer uma interface de conversa direta por meio da qual os usuários podem acessar e gerenciar seus dados financeiros sem esforço.

Os exemplos de faturas são incluídos na pasta de dados para facilitar a exploração do recurso de pagamentos. O agente de pagamento equipado com ferramentas de OCR (reconhecimento óptico de caracteres) (Azure Document Intelligence) conduz a conversa com o usuário para extrair os dados da fatura e iniciar o processo de pagamento. Outros dados falsos da conta - como transações, métodos de pagamento e saldo da conta - também estão disponíveis para serem consultados pelo usuário. Todos os dados e serviços são expostos como APIs REST externas e consumidos pelos agentes para fornecer ao usuário as informações solicitadas.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório agent-openai-java-banking-assistant GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps	Azure OpenAI Azure Document Intelligence Azure Storage Azure Monitor	gpt-4o gpt-4o-mini

Conversar com seus dados usando Azure OpenAI e Azure AI Search com JavaScript

Para começar a usar esse modelo, consulte Introdução ao chat usando sua própria amostra de dados para JavaScript. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório azure-search-openai-javascript GitHub.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Container Apps Azure Static Web Apps	Azure OpenAI Azure AI Search Azure Storage Azure Monitor	text-embedding-ada-002

front-end de chat do Azure OpenAI

Este template é um componente web de chat m™nimo do OpenAI que pode ser integrado a qualquer implementação de back-end, atuando como cliente.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório azure-openai-chat-frontend GitHub.

Vídeo demonstrando o aplicativo de front-end de chat JavaScript.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Static Web Apps	Azure AI Search Azure OpenAI	GPT 3.5 Turbo GPT4

Chat de IA sem servidor com RAG usando LangChain.js

O template é um chatbot de IA sem servidor com Geração Aumentada de Recuperação usando LangChain.js e Azure, que utiliza um conjunto de documentos empresariais para fornecer respostas a consultas de usuários. Ele usa uma empresa fictícia chamada Contoso Real Estate, e a experiência permite que seus clientes façam perguntas de suporte sobre o uso de seus produtos. Os dados de amostra incluem um conjunto de documentos que descrevem seus termos de serviço, política de privacidade e um guia de suporte.

Para saber como implantar e executar este modelo, consulte Introdução ao Chat de IA sem servidor com RAG usando LangChain.js. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório serverless-chat-langchainjs GitHub.

Saiba como implantar e executar este modelo de referência javaScript.

Este modelo demonstra o uso desses recursos.

Azure solução de hospedagem	Tecnologias	Modelos de IA
Azure Static Web Apps Azure Functions	Azure AI Search Azure OpenAI Azure Cosmos DB Azure Storage Identidade Gerenciada do Azure	GPT4 Mistral Ollama

Comentários

Esta página foi útil?

Last updated on 2026-03-12

Modelos de aplicativos de IA

Blocos de construção

Soluções de ponta a ponta

Converse com seus dados usando Azure OpenAI e Azure AI Search com .NET

Copilot de chat de varejo Contoso com .NET e Semantic Kernel

Automatização de processos com conversão da fala para texto e sumarização usando .NET e GPT 3.5 Turbo

Converse com seus dados usando Azure OpenAI e Azure AI Search com Python

Copilot de Escrita Criativa Multi-Modal com DALL-E

Copilot de Chat de Varejo da Contoso com a Foundry

Automação de processos com conversão de fala em texto e resumo com o Foundry

Assistente de Análise de API Copilot com Python e Foundry

Converse com seus dados usando Azure OpenAI e Azure AI Search com Java

Assistente Bancário Multiagente com Java e Semantic Kernel

Conversar com seus dados usando Azure OpenAI e Azure AI Search com JavaScript

front-end de chat do Azure OpenAI

Chat de IA sem servidor com RAG usando LangChain.js

Comentários

Recursos adicionais