Partilhar via


Modelos de aplicativos de IA

Esta seção da documentação apresenta os modelos de aplicativo de IA e artigos relacionados que usam esses modelos para demonstrar como executar tarefas importantes do desenvolvedor. Os modelos de aplicativos de IA fornecem implementações de referência bem mantidas e fáceis de implantar que ajudam a garantir um ponto de partida de alta qualidade para seus aplicativos de IA.

Há duas categorias de modelos de aplicativos de IA, blocos de construção e soluções de ponta a ponta. As seções a seguir apresentam alguns dos principais modelos em cada categoria para a linguagem de programação que você selecionou na parte superior deste artigo. Para navegar por uma lista mais abrangente, incluindo esses e outros modelos, consulte os modelos de aplicativo de IA na galeria da CLI do Desenvolvedor do Azure.

Blocos de criação

Os blocos de construção são exemplos de menor escala que se concentram em cenários e tarefas específicos. A maioria dos blocos de construção demonstra a funcionalidade que aproveita a solução completa para um aplicativo de bate-papo que usa seus próprios dados.

Bloco de construção Description
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Bloco de construção Description
Configurar a segurança de documentos para o aplicativo de chat Ao criar um aplicativo de bate-papo usando o padrão RAG com seus próprios dados, certifique-se de que cada usuário receba uma resposta com base em suas permissões. Um usuário autorizado deve ter acesso às respostas contidas nos documentos do aplicativo de bate-papo. Um utilizador não autorizado não deve ter acesso a respostas de documentos seguros que não tenha autorização para ver.
Avaliar as respostas do aplicativo de bate-papo Saiba como avaliar as respostas de um aplicativo de bate-papo em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade básica). Sempre que você alterar seu aplicativo de bate-papo de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Balanceamento de carga com gerenciamento de API Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Teste de carga do aplicativo de bate-papo Python com Locust Aprenda o processo para executar o teste de carga em um aplicativo de chat Python usando o padrão RAG com Locust, uma ferramenta popular de teste de carga de código aberto. O objetivo principal do teste de carga é garantir que a carga esperada em seu aplicativo de chat não exceda a cota atual do Azure OpenAI Transactions Per Minute (TPM). Ao simular o comportamento do usuário sob carga pesada, você pode identificar possíveis gargalos e problemas de escalabilidade em seu aplicativo.
Bloco de construção Description
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Bloco de construção Description
Avaliar as respostas do aplicativo de bate-papo Saiba como avaliar as respostas de um aplicativo de bate-papo em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade básica). Sempre que você alterar seu aplicativo de bate-papo de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Balanceamento de carga com gerenciamento de API Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.

Soluções end-to-end

As soluções de ponta a ponta são exemplos de referência abrangentes, incluindo documentação, código-fonte e implantação, para permitir que você pegue e estenda para seus próprios fins.

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com .NET

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para .NET. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo-csharp .

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para .NET.

Captura de tela do aplicativo de bate-papo .NET no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Funções do Azure
Azure OpenAI
Azure Computer Vision
Reconhecedor de Formato do Azure
Pesquisa de IA do Azure
Armazenamento do Azure
GPT 3.5 Turbo
GPT 4,0

Copiloto de varejo de bate-papo da Contoso com .NET e Kernel Semântico

Este modelo implementa a Contoso Outdoors, uma loja conceitual especializada em equipamentos ao ar livre para entusiastas de caminhadas e camping. Esta loja virtual melhora o envolvimento do cliente e o suporte de vendas através de um agente de chat inteligente. Este agente é alimentado pelo padrão Retrieval Augmented Generation (RAG) dentro do Microsoft Azure AI Stack, enriquecido com suporte a Kernel Semântico e Prompty.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub contoso-chat-csharp-prompty .

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para o aplicativo de caminhadas.

Screenshot da loja de entusiastas de caminhadas e campismo .NET.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Azure OpenAI
Microsoft Entra ID
Identidade Gerida do Azure
Azure Monitor
Pesquisa de IA do Azure
Azure AI Studio
SQL do Azure
Armazenamento do Azure
GPT 3.5 Turbo
GPT 4,0

Automação de processos com fala para texto e sumarização com .NET e GPT 3.5 Turbo

Este modelo é uma solução de automação de processos que recebe problemas relatados por trabalhadores de campo e chão de fábrica em uma empresa chamada Contoso Manufacturing, uma empresa de fabricação que fabrica baterias de carros. Os problemas são compartilhados pelos trabalhadores ao vivo através da entrada do microfone ou pré-gravados como arquivos de áudio. A solução traduz a entrada de áudio de fala para texto e, em seguida, usa um LLM e Prompty ou Promptflow para resumir o problema e retornar os resultados em um formato especificado pela solução.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub summarization-openai-csharp-prompty .

Captura de tela do aplicativo Web .NET com bate-papo lateral para conversão de fala em texto e resumo para a Contoso Manufacturing.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps Conversão de Voz em Texto
Resumo
Azure OpenAI
GPT 3.5 Turbo

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com Python

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para Python. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo .

Captura de tela do aplicativo de bate-papo no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço de Aplicações do Azure Azure OpenAI
Pesquisa Bing
Identidade Gerida do Azure
Azure Monitor
Pesquisa de IA do Azure
Azure AI Studio
GPT 3.5 Turbo
GPT 4,0
DALL-E

Copiloto de Escrita Criativa Multimodal com DALL-E

Este modelo é uma solução multiagente de escrita criativa para ajudar os usuários a escrever artigos. Ele demonstra como criar e trabalhar com agentes de IA orientados pelo Azure OpenAI. Ele inclui um aplicativo Flask que usa um tópico e instruções de um usuário e, em seguida, chama um agente de pesquisa que usa a API de Pesquisa do Bing para pesquisar o tópico, um agente de produto que usa a Pesquisa de IA do Azure para fazer uma pesquisa de semelhança semântica para produtos relacionados de um repositório de vetores, um agente de gravador para combinar a pesquisa e as informações do produto em um artigo útil, e um agente editor para refinar o artigo que finalmente é apresentado ao usuário.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub agent-openai-python-prompty .

Diagrama arquitetónico da aplicação copiloto de escrita criativa multi-modal python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container registery
Azure Kubernetes
Azure OpenAI
Pesquisa Bing
Identidade Gerida do Azure
Azure Monitor
Pesquisa de IA do Azure
Azure AI Studio
GPT 3.5 Turbo
GPT 4,0
DALL-E

Copiloto de varejo de bate-papo da Contoso com o AI Studio

Este modelo é uma solução de chat de vendas e suporte ao cliente. Ele demonstra como criar um aplicativo LLM (Large Language Model) com uma arquitetura RAG (Retrieval Augmented Generation) usando o Azure AI Studio e o Prompt Flow.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub contoso-chat .

Captura de tela do aplicativo de chat com fluxo de prompt no editor visual para o copiloto de varejo de bate-papo da Contoso.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Azure OpenAI
Pesquisa de IA do Azure
Azure AI Studio
Azure Cosmos DB
GPT 3.5 Turbo
GPT 4,0
Tempo de execução de integração gerenciada (MIR)

Automação de processos com fala para texto e sumarização com AI Studio

Este modelo é uma solução de automação de processos que recebe problemas relatados por trabalhadores de campo e chão de fábrica em uma empresa chamada Contoso Manufacturing, uma empresa de fabricação que fabrica baterias de carros. Os problemas são compartilhados pelos trabalhadores ao vivo através da entrada do microfone, pré-gravados como arquivos de áudio ou como entrada de texto. A solução traduz a entrada de áudio de fala para texto e, em seguida, usa os relatórios de texto como entrada para um LLM e Prompty/Promptflow para resumir o problema e retornar os resultados em um formato especificado pela solução.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub summarization-openai-python-prompflow .

Diagrama arquitetônico para automação de processos com fala para texto e sumarização com AI Studio for Python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps Azure AI Studio
Serviço de Fala para Texto
Fluxo de Prompt
Tempo de execução de integração gerenciada (MIR)
GPT 3.5 Turbo

Este modelo é um aplicativo que usa Prompty, Langchain e Elasticsearch para criar um agente de pesquisa de modelo de linguagem grande (LLM). Este agente com tecnologia Retrieval Augmented Generation (RAG) é capaz de responder às perguntas do usuário com base nos dados fornecidos, integrando a recuperação de informações em tempo real com respostas generativas.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub agent-python-openai-prompty-langchain .

Diagrama de arquitetura para um aplicativo usando a ferramenta Prompty, Langchain e Elasticsearch para criar um agente de pesquisa de modelo de linguagem grande (LLM) com chamada de função para Python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço do Machine Learning Azure AI Studio
Pesquisa elástica
Microsoft Entra ID
Identidade Gerida do Azure
Azure Monitor
Storage do Azure
Azure AI Studio
Tempo de execução de integração gerenciada (MIR)
GPT 3.5 Turbo

Chamada de função com Prompty, LangChain e Pinecone

Este modelo utiliza a nova ferramenta Prompty, Langchain e Pinecone para criar um agente de pesquisa de modelo de linguagem grande (LLM). Este agente com tecnologia Retrieval Augmented Generation (RAG) é capaz de responder às perguntas do usuário com base nos dados fornecidos, integrando a recuperação de informações em tempo real com respostas generativas.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub agent-openai-python-prompty-langchain-pinecone .

Diagrama de arquitetura para um aplicativo de agente OpenAI usando o Prompty, Langchain e Pinecone com Python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps Pinecone
Microsoft Entra ID
Identidade gerenciada pela Microsoft
Azure Monitor
Storage do Azure
GPT 3.5 Turbo

Copiloto Assistente de Análise de API com Python e Azure AI Studio

Este modelo é uma API do Assistente para conversar com dados tabulares e realizar análises em linguagem natural. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub assistant-data-openai-python-promptflow .

Diagrama de arquitetura para uma API do Assistente para conversar com dados tabulares e executar análises em linguagem natural.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço do Machine Learning Pesquisa de IA do Azure
Azure AI Studio
Tempo de execução de integração gerenciada (MIR)
Azure OpenAI
GPT 3.5 Turbo
GPT 4

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com Java

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para Java. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo-java .

Diagrama mostrando a arquitetura do cliente para o aplicativo back-end em Java.

Captura de tela do aplicativo de bate-papo Java no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço de Aplicações do Azure
Azure Container Apps
Azure Kubernetes Service
Azure OpenAI
Pesquisa de IA do Azure
Armazenamento do Azure
Azure Monitor

Converse com seus dados usando o Azure OpenAI e o Azure AI Search com JavaScript

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para JavaScript. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-javascript .

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end.

Captura de tela do aplicativo de bate-papo no navegador mostrando várias sugestões para entrada de bate-papo e a caixa de texto do bate-papo para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Azure Container Apps
Aplicações Web Estáticas do Azure
Azure OpenAI
Pesquisa de IA do Azure
Armazenamento do Azure
Azure Monitor
incorporação de texto-ada-002

Frontend de chat do Azure OpenAI

Este modelo é um componente web de bate-papo OpenAI mínimo que pode ser conectado a qualquer implementação de back-end como cliente.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-openai-chat-frontend .

Vídeo demonstrando o aplicativo de frontend de bate-papo JavaScript.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicações Web Estáticas do Azure Pesquisa de IA do Azure
Azure OpenAI
GPT 3.5 Turbo
GPT4

Bate-papo de IA sem servidor com RAG usando LangChain.js

O modelo é um chatbot de IA sem servidor com Geração Aumentada de Recuperação usando LangChain.js e Azure que usa um conjunto de documentos corporativos para gerar respostas às consultas dos usuários. Ele usa uma empresa fictícia chamada Contoso Real Estate, e a experiência permite que seus clientes façam perguntas de suporte sobre o uso de seus produtos. Os dados de exemplo incluem um conjunto de documentos que descreve seus termos de serviço, política de privacidade e um guia de suporte.

Para saber como implantar e executar esse modelo, consulte Introdução ao bate-papo de IA sem servidor com o RAG usando o LangChain.js. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub serverless-chat-langchainjs .

Saiba como implantar e executar este modelo de referência JavaScript.

Diagrama mostrando a arquitetura da API sem servidor usando LangChainjs para integração com o Serviço OpenAI do Azure e o Azure AI Search.

Vídeo do navegador de demonstração do aplicativo de bate-papo JavaScript usando RAG e Langchain.js

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicações Web Estáticas do Azure
Funções do Azure
Pesquisa de IA do Azure
Azure OpenAI
Azure Cosmos DB
Armazenamento do Azure
Identidade Gerida do Azure
GPT4
Mistral
Ollama