Condividi tramite


Modelli di app per intelligenza artificiale

Questa sezione della documentazione presenta i modelli di app di intelligenza artificiale e gli articoli correlati che usano questi modelli per illustrare come eseguire attività di sviluppo chiave. I modelli di app di intelligenza artificiale offrono implementazioni di riferimento ben gestite e facili da distribuire per garantire un punto di partenza di alta qualità per le app di intelligenza artificiale.

Esistono due categorie di modelli di app di intelligenza artificiale, blocchi predefiniti e soluzioni end-to-end. Le sezioni seguenti introducono alcuni dei modelli chiave in ogni categoria per il linguaggio di programmazione selezionato nella parte superiore di questo articolo. Per esplorare un elenco più completo, inclusi questi e altri modelli, vedere i modelli di app per intelligenza artificiale nella raccolta dell'interfaccia della riga di comando per sviluppatori di Azure.

Blocchi predefiniti

I blocchi predefiniti sono esempi su scala ridotta incentrati su scenari e attività specifici. La maggior parte dei blocchi predefiniti illustra le funzionalità che sfruttano la soluzione end-to-end per un'app di chat che usa i propri dati.

Blocco predefinito Descrizione
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Blocco predefinito Descrizione
Configurare la sicurezza dei documenti per l'app chat Quando si compila un'applicazione di chat usando il modello RAG con i propri dati, assicurarsi che ogni utente riceva una risposta in base alle relative autorizzazioni. Un utente autorizzato deve avere accesso alle risposte contenute nei documenti dell'app di chat. Un utente non autorizzato non deve avere accesso alle risposte da documenti protetti che non hanno l'autorizzazione per visualizzare.
Valutare le risposte alle app di chat Informazioni su come valutare le risposte di un'app di chat su un set di risposte corrette o ideali (note come verità di base). Ogni volta che si modifica l'applicazione di chat in modo che influisca sulle risposte, eseguire una valutazione per confrontare le modifiche. Questa applicazione demo offre strumenti che è possibile usare oggi per semplificare l'esecuzione delle valutazioni.
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Bilanciamento del carico con Gestione API Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa Azure Gestione API per creare tre endpoint OpenAI di Azure, nonché un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Testare il carico dell'app di chat Python con Locust Informazioni sul processo per eseguire test di carico in un'applicazione di chat Python usando il modello RAG con Locust, uno strumento di test di carico open source diffuso. L'obiettivo principale del test di carico è garantire che il carico previsto nell'applicazione di chat non superi la quota corrente di transazioni OpenAI di Azure al minuto (TPM). Simulando il comportamento dell'utente con carico elevato, è possibile identificare potenziali colli di bottiglia e problemi di scalabilità nell'applicazione.
Blocco predefinito Descrizione
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Blocco predefinito Descrizione
Valutare le risposte alle app di chat Informazioni su come valutare le risposte di un'app di chat su un set di risposte corrette o ideali (note come verità di base). Ogni volta che si modifica l'applicazione di chat in modo che influisca sulle risposte, eseguire una valutazione per confrontare le modifiche. Questa applicazione demo offre strumenti che è possibile usare oggi per semplificare l'esecuzione delle valutazioni.
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Bilanciamento del carico con Gestione API Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa Azure Gestione API per creare tre endpoint OpenAI di Azure, nonché un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.

Soluzioni end-to-end

Le soluzioni end-to-end sono esempi di riferimento completi che includono documentazione, codice sorgente e distribuzione per consentire l'esecuzione e l'estensione per scopi personalizzati.

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con .NET

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per .NET. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-demo-csharp .

Diagramma che mostra l'architettura dall'app client all'app back-end per .NET.

Screenshot dell'app di chat .NET nel browser che mostra diversi suggerimenti per l'input della chat e la casella di testo della chat per immettere una domanda.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
Funzioni di Azure
OpenAI di Azure
Visione artificiale di Azure
Riconoscimento modulo di Azure
Azure AI Search
Archiviazione di Azure
GPT 3.5 Turbo
GPT 4.0

Contoso chat retail Copilot con .NET e Semantic Kernel

Questo modello implementa Contoso Outdoors, un negozio concettuale specializzato in attrezzatura all'aperto per gli appassionati di escursioni e campeggio. Questo negozio virtuale migliora l'engagement dei clienti e il supporto per le vendite tramite un agente di chat intelligente. Questo agente è basato sul modello Di generazione aumentata di recupero (RAG) all'interno di Microsoft Azure AI Stack, arricchito con il kernel semantico e il supporto prompty.

Per accedere al codice sorgente e leggere dettagli approfonditi sul modello, vedere il repository GitHub contoso-chat-csharp-prompty .

Diagramma che mostra l'architettura dall'app client all'app back-end per le escursioni.

Screenshot del negozio di escursionismo e campeggio .NET.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
OpenAI di Azure
Microsoft Entra ID
Identità gestita di Azure
Monitoraggio di Azure
Azure AI Search
Studio AI della piattaforma Azure
SQL di Azure
Archiviazione di Azure
GPT 3.5 Turbo
GPT 4.0

Automazione dei processi con sintesi vocale e riepilogo con .NET e GPT 3.5 Turbo

Questo modello è una soluzione di automazione dei processi che riceve problemi segnalati dai lavoratori del settore e dell'officina presso una società denominata Contoso Manufacturing, una società di produzione che produce batterie per auto. I problemi sono condivisi dai lavoratori tramite l'input del microfono o preregistrati come file audio. La soluzione converte l'input audio dal parlato al testo e quindi usa un LLM e Prompty o Promptflow per riepilogare il problema e restituire i risultati in un formato specificato dalla soluzione.

Per accedere al codice sorgente e leggere dettagli approfonditi sul modello, vedere il repository GitHub summarization-openai-csharp-prompty .

Screenshot dell'app Web .NET con chat sul lato per la sintesi vocale e il riepilogo per Contoso Manufacturing.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure Riconoscimento vocale
Riepilogo
OpenAI di Azure
GPT 3.5 Turbo

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con Python

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando un esempio di dati personalizzato per Python. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-demo .

Screenshot dell'app di chat nel browser che mostra diversi suggerimenti per l'inserimento in chat e la casella di testo della chat per inserire una domanda.

Diagramma che mostra l'architettura dal client all'app back-end

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Servizio app di Azure OpenAI di Azure
Ricerca Bing
Identità gestita di Azure
Monitoraggio di Azure
Azure AI Search
Studio AI della piattaforma Azure
GPT 3.5 Turbo
GPT 4.0
DALL-E

Copilota per la scrittura creativa multi modale con DALL-E

Questo modello è una soluzione creativa che scrive più agenti per aiutare gli utenti a scrivere articoli. Illustra come creare e usare agenti di intelligenza artificiale basati su Azure OpenAI. Include un'app Flask che accetta un argomento e un'istruzione da un utente, quindi chiama un agente di ricerca che usa l'API Ricerca Bing per ricercare l'argomento, un agente prodotto che usa Ricerca di intelligenza artificiale di Azure per eseguire una ricerca semantica di prodotti correlati da un archivio vettoriale, un agente writer per combinare la ricerca e le informazioni sul prodotto in un articolo utile, e un agente dell'editor per perfezionare l'articolo che viene infine presentato all'utente.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub agent-openai-python-prompty .

Diagramma dell'architettura della creatività multi modale python che scrive l'applicazione copilota.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Registro Azure Container
Azure Kubernetes
OpenAI di Azure
Ricerca Bing
Identità gestita di Azure
Monitoraggio di Azure
Azure AI Search
Studio AI della piattaforma Azure
GPT 3.5 Turbo
GPT 4.0
DALL-E

Contoso Chat Retail Copilot con AI Studio

Questo modello è una soluzione di chat di vendita e supporto clienti. Viene illustrato come creare un'applicazione LLM (Large Language Model) con un'architettura RAG (Retrieval Augmented Generation) usando Azure AI Studio e Prompt Flow.

Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub contoso-chat .

Screenshot dell'app di chat con flusso di richiesta nell'editor visivo per il copilot di chat di Contoso.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
OpenAI di Azure
Azure AI Search
Studio AI della piattaforma Azure
Azure Cosmos DB
GPT 3.5 Turbo
GPT 4.0
Runtime di integrazione gestita (MIR)

Automazione dei processi con sintesi vocale e riepilogo con AI Studio

Questo modello è una soluzione di automazione dei processi che riceve problemi segnalati dai lavoratori del settore e dell'officina presso una società denominata Contoso Manufacturing, una società di produzione che produce batterie per auto. I problemi vengono condivisi dai lavoratori tramite l'input del microfono, preregistrati come file audio o come input di testo. La soluzione converte l'input audio dal parlato al testo e quindi usa i report di testo come input per un flusso LLM e Prompty/Prompty per riepilogare il problema e restituire i risultati in un formato specificato dalla soluzione.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub di riepilogoation-openai-python-prompflow .

Diagramma dell'architettura per l'automazione dei processi con riconoscimento vocale e riepilogo con AI Studio per Python.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure Studio AI della piattaforma Azure
Servizio Di riconoscimento vocale
Flusso prompt
Runtime di integrazione gestita (MIR)
GPT 3.5 Turbo

Questo modello è un'applicazione che usa Prompty, Langchain e Elasticsearch per creare un agente di ricerca LLM (Large Language Model). Questo agente con tecnologia Di generazione aumentata di recupero è in grado di rispondere alle domande degli utenti in base ai dati forniti integrando il recupero delle informazioni in tempo reale con risposte generative.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub agent-python-openai-prompty-langchain .

Diagramma dell'architettura per un'app che usa lo strumento Prompty, Langchain e Elasticsearch per creare un agente di ricerca LLM (Large Language Model) con la chiamata di funzione per Python.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Servizio Machine Learning Studio AI della piattaforma Azure
Ricerca elastica
Microsoft Entra ID
Identità gestita di Azure
Monitoraggio di Azure
Archiviazione di Azure
Studio AI della piattaforma Azure
Runtime di integrazione gestita (MIR)
GPT 3.5 Turbo

Chiamata di funzione con Prompty, LangChain e Pinecone

Questo modello usa il nuovo strumento Prompty, Langchain e Pinecone per creare un agente di ricerca LLM (Large Language Model). Questo agente con tecnologia Di generazione aumentata di recupero è in grado di rispondere alle domande degli utenti in base ai dati forniti integrando il recupero delle informazioni in tempo reale con risposte generative.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository gitHub agent-openai-python-prompty-langchain-pinecone .

Diagramma dell'architettura per un'app agente OpenAI usando Prompty, Langchain e Pinecone con Python.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure Pinecone
Microsoft Entra ID
Identità gestita da Microsoft
Monitoraggio di Azure
Archiviazione di Azure
GPT 3.5 Turbo

Assistente api Analytics Copilot con Python e Azure AI Studio

Questo modello è un'API Assistente per chattare con dati tabulari ed eseguire analisi in linguaggio naturale. Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub assistant-data-openai-python-promptflow .

Diagramma dell'architettura per un'API assistente per chattare con dati tabulari ed eseguire analisi in linguaggio naturale.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Servizio Machine Learning Azure AI Search
Studio AI della piattaforma Azure
Runtime di integrazione gestita (MIR)
OpenAI di Azure
GPT 3.5 Turbo
GPT 4

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con Java

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per Java. Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub azure-search-openai-demo-java .

Diagramma che mostra l'architettura dal client all'app back-end in Java.

Screenshot dell'app Chat Java nel browser che mostra diversi suggerimenti per l'input della chat e la casella di testo della chat per immettere una domanda.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Servizio app di Azure
App contenitore di Azure
Servizio Azure Kubernetes
OpenAI di Azure
Azure AI Search
Archiviazione di Azure
Monitoraggio di Azure

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con JavaScript

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per JavaScript. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-javascript .

Diagramma che mostra l'architettura dal client all'app back-end.

Screenshot dell'app di chat nel browser che mostra diversi suggerimenti per l'inserimento in chat e la casella di testo della chat per inserire una domanda.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
App Web statiche di Azure
OpenAI di Azure
Azure AI Search
Archiviazione di Azure
Monitoraggio di Azure
text-embedding-ada-002

Front-end di chat OpenAI di Azure

Questo modello è un componente Web di chat OpenAI minimo che può essere associato a qualsiasi implementazione back-end come client.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub azure-openai-chat-frontend .

Video che illustra l'applicazione front-end di chat JavaScript.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App Web statiche di Azure Azure AI Search
OpenAI di Azure
GPT 3.5 Turbo
GPT4

Chat di intelligenza artificiale serverless con RAG con LangChain.js

Il modello è un chatbot di intelligenza artificiale serverless con La generazione aumentata di recupero usando LangChain.js e Azure che usa un set di documenti aziendali per generare risposte alle query utente. Usa una società fittizia denominata Contoso Real Estate e l'esperienza consente ai clienti di porre domande di supporto sull'utilizzo dei suoi prodotti. I dati di esempio includono un set di documenti che descrivono le condizioni per il servizio, l'informativa sulla privacy e una guida al supporto.

Per informazioni su come distribuire ed eseguire questo modello, vedere Introduzione a Serverless AI Chat con RAG usando LangChain.js. Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub serverless-chat-langchainjs .

Informazioni su come distribuire ed eseguire questo modello di riferimento JavaScript.

Diagramma che mostra l'architettura per l'API serverless usando LangChainjs per l'integrazione con il servizio Azure OpenAI e Ricerca di intelligenza artificiale di Azure.

Video del browser della dimostrazione dell'app di chat JavaScript con RAG e Langchain.js

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App Web statiche di Azure
Funzioni di Azure
Azure AI Search
OpenAI di Azure
Azure Cosmos DB
Archiviazione di Azure
Identità gestita di Azure
GPT4
Mistral
Ollama