Condividi tramite


Modelli di app per intelligenza artificiale

Questa sezione della documentazione presenta i modelli di app di intelligenza artificiale e gli articoli correlati che usano questi modelli per illustrare come eseguire attività di sviluppo chiave. I modelli di app di intelligenza artificiale offrono implementazioni di riferimento ben gestite e facili da distribuire per garantire un punto di partenza di alta qualità per le app di intelligenza artificiale.

Esistono due categorie di modelli di app di intelligenza artificiale, ovvero blocchi predefiniti e soluzioni end-to-end. Le sezioni seguenti introducono alcuni dei modelli chiave in ogni categoria per il linguaggio di programmazione selezionato nella parte superiore di questo articolo. Per esplorare un elenco più completo, inclusi questi e altri modelli, vedere i modelli di app di intelligenza artificiale nella raccolta di modelli di app per intelligenza artificiale.

Blocchi predefiniti

I blocchi predefiniti sono esempi su scala ridotta incentrati su scenari e attività specifici. La maggior parte dei blocchi predefiniti illustra le funzionalità che sfruttano la soluzione end-to-end per un'app di chat che usa i propri dati.

Blocco predefinito Descrizione
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Blocco predefinito Descrizione
Configurare la sicurezza dei documenti per l'app chat Quando si compila un'applicazione di chat usando il modello RAG con i propri dati, assicurarsi che ogni utente riceva una risposta in base alle relative autorizzazioni. Un utente autorizzato deve avere accesso alle risposte contenute nei documenti dell'app di chat. Un utente non autorizzato non deve avere accesso alle risposte da documenti protetti che non hanno l'autorizzazione per visualizzare.
Valutare le risposte alle app di chat Informazioni su come valutare le risposte di un'app di chat su un set di risposte corrette o ideali (note come verità di base). Ogni volta che si modifica l'applicazione di chat in modo che influisca sulle risposte, eseguire una valutazione per confrontare le modifiche. Questa applicazione demo offre strumenti che è possibile usare oggi per semplificare l'esecuzione delle valutazioni.
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Bilanciamento del carico con Gestione API Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa Azure Gestione API per creare tre endpoint OpenAI di Azure, nonché un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Testare il carico dell'app di chat Python con Locust Informazioni sul processo per eseguire test di carico in un'applicazione di chat Python usando il modello RAG con Locust, uno strumento di test di carico open source diffuso. L'obiettivo principale del test di carico è garantire che il carico previsto nell'applicazione di chat non superi la quota corrente di transazioni OpenAI di Azure al minuto (TPM). Simulando il comportamento dell'utente con carico elevato, è possibile identificare potenziali colli di bottiglia e problemi di scalabilità nell'applicazione.
Proteggere l'app di intelligenza artificiale con l'autenticazione senza chiave Informazioni sul processo per proteggere l'applicazione di chat Python OpenAI di Azure con l'autenticazione senza chiave. Le richieste dell'applicazione alla maggior parte dei servizi di Azure devono essere autenticate con connessioni senza chiave o senza password. L'autenticazione senza chiave offre vantaggi di gestione e sicurezza migliorati rispetto alla chiave dell'account perché non è presente alcuna chiave (o stringa di connessione) da archiviare.
Blocco predefinito Descrizione
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Blocco predefinito Descrizione
Valutare le risposte alle app di chat Informazioni su come valutare le risposte di un'app di chat su un set di risposte corrette o ideali (note come verità di base). Ogni volta che si modifica l'applicazione di chat in modo che influisca sulle risposte, eseguire una valutazione per confrontare le modifiche. Questa applicazione demo offre strumenti che è possibile usare oggi per semplificare l'esecuzione delle valutazioni.
Bilanciare il carico con le app di Azure Container Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.
Bilanciamento del carico con Gestione API Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa Azure Gestione API per creare tre endpoint OpenAI di Azure, nonché un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint.

Soluzioni end-to-end

Le soluzioni end-to-end sono esempi di riferimento completi, tra cui la documentazione, il codice sorgente e la distribuzione per consentire l'esecuzione e l'estensione per scopi personalizzati.

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con .NET

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per .NET. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-demo-csharp .

Diagramma che mostra l'architettura dall'app client all'app back-end per .NET.

Screenshot dell'app di chat .NET nel browser che mostra diversi suggerimenti per l'input della chat e la casella di testo della chat per immettere una domanda.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
Funzioni di Azure
OpenAI di Azure
Visione artificiale di Azure
Riconoscimento modulo di Azure
Azure AI Search
Archiviazione di Azure
GPT 3.5 Turbo
GPT 4.0

Contoso chat retail Copilot con .NET e Semantic Kernel

Questo modello implementa Contoso Outdoors, un negozio concettuale specializzato in attrezzatura all'aperto per gli appassionati di escursioni e campeggio. Questo negozio virtuale migliora l'engagement dei clienti e il supporto per le vendite tramite un agente di chat intelligente. Questo agente è basato sul modello Di generazione aumentata di recupero (RAG) all'interno di Microsoft Azure AI Stack, arricchito con il kernel semantico e il supporto prompty.

Per accedere al codice sorgente e leggere dettagli approfonditi sul modello, vedere il repository GitHub contoso-chat-csharp-prompty .

Diagramma che mostra l'architettura dall'app client all'app back-end per le escursioni.

Screenshot del negozio di escursionismo e campeggio .NET.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
OpenAI di Azure
Microsoft Entra ID
Identità gestita di Azure
Monitoraggio di Azure
Azure AI Search
Studio AI della piattaforma Azure
SQL di Azure
Archiviazione di Azure
GPT 3.5 Turbo
GPT 4.0

Automazione dei processi con sintesi vocale e riepilogo con .NET e GPT 3.5 Turbo

Questo modello è una soluzione di automazione dei processi che riceve problemi segnalati dai lavoratori del settore e dell'officina presso una società denominata Contoso Manufacturing, una società di produzione che produce batterie per auto. I problemi sono condivisi dai lavoratori tramite l'input del microfono o preregistrati come file audio. La soluzione converte l'input audio dal parlato al testo e quindi usa un LLM e Prompty o Promptflow per riepilogare il problema e restituire i risultati in un formato specificato dalla soluzione.

Per accedere al codice sorgente e leggere dettagli approfonditi sul modello, vedere il repository GitHub summarization-openai-csharp-prompty .

Screenshot dell'app Web .NET con chat sul lato per la sintesi vocale e il riepilogo per Contoso Manufacturing.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure Riconoscimento vocale
Riepilogo
OpenAI di Azure
GPT 3.5 Turbo

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con Python

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli di linguaggio OpenAI di Azure per offrire esperienze di domande e risposte (Q&A) in stile ChatGPT.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando un esempio di dati personalizzato per Python. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-demo .

Screenshot dell'app di chat nel browser che mostra diversi suggerimenti per l'inserimento in chat e la casella di testo della chat per inserire una domanda.

Diagramma che mostra l'architettura dal client all'app back-end.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure OpenAI di Azure
Azure AI Search
Archiviazione BLOB di Azure
Monitoraggio di Azure
Intelligence sui documenti di Azure
GPT 3.5 Turbo
GPT 4
GPT 4o
GPT 4o-mini

Copilota per la scrittura creativa multi modale con DALL-E

Questo modello è una soluzione creativa che scrive più agenti per aiutare gli utenti a scrivere articoli. Illustra come creare e usare agenti di intelligenza artificiale basati su Azure OpenAI.

Comprende:

  1. Un'app Flask che accetta un articolo e un'istruzione da un utente.
  2. Agente di ricerca che usa l'API Ricerca Bing per cercare l'articolo.
  3. Agente del prodotto che usa Ricerca intelligenza artificiale di Azure per eseguire una ricerca semantica di somiglianza per i prodotti correlati da un archivio vettoriale.
  4. Agente scrittore per combinare le informazioni di ricerca e prodotto in un articolo utile.
  5. Agente dell'editor per perfezionare l'articolo presentato all'utente.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub agent-openai-python-prompty .

Diagramma dell'architettura della creatività multi modale python che scrive l'applicazione copilota.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Registro Azure Container
Azure Kubernetes
OpenAI di Azure
Ricerca Bing
Identità gestita di Azure
Monitoraggio di Azure
Azure AI Search
Studio AI della piattaforma Azure
GPT 3.5 Turbo
GPT 4.0
DALL-E

Contoso Chat Retail Copilot con AI Studio

Questo modello implementa Contoso Chat - una soluzione di copilota al dettaglio per Contoso Outdoor che usa un modello di progettazione di generazione aumentata di recupero per mettere a punto le risposte del chatbot nei dati dei prodotti e dei clienti del rivenditore. I clienti possono porre domande dal sito Web in linguaggio naturale e ottenere risposte pertinenti con potenziali raccomandazioni in base alla cronologia degli acquisti, con procedure di IA responsabili per garantire la qualità e la sicurezza delle risposte.

Questo modello illustra il flusso di lavoro end-to-end (GenAIOps) per la creazione di un codice copilot basato su RAG con Azure AI e Prompty. Esplorando e distribuendo questo esempio, vedere:

  1. Ideare ed eseguire rapidamente l'iterazione sui prototipi di app usando Prompty
  2. Distribuire e usare modelli OpenAI di Azure per chat, incorporamenti e valutazione
  3. Usare Ricerca di intelligenza artificiale di Azure (indici) e Azure Cosmos DB (database) per i dati
  4. Valutare le risposte di chat per la qualità usando i flussi di valutazione assistita dall'intelligenza artificiale
  5. Ospitare l'applicazione come endpoint FastAPI distribuito in App Contenitore di Azure
  6. Effettuare il provisioning e distribuire la soluzione usando l'interfaccia della riga di comando per sviluppatori di Azure
  7. Supportare le procedure di IA responsabile con la sicurezza e le valutazioni dei contenuti

Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub contoso-chat .

Diagramma che mostra l'architettura dall'app client all'app back-end per le escursioni.

Screenshot dell'app di chat con flusso di richiesta nell'editor visivo per il copilot di chat di Contoso.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
OpenAI di Azure
Azure AI Search
Studio AI della piattaforma Azure
Richiesta
Azure Cosmos DB
GPT 3.5 Turbo
GPT 4.0
Runtime di integrazione gestita (MIR)

Automazione dei processi con sintesi vocale e riepilogo con AI Studio

Questo modello crea un'app basata sul Web che consente ai lavoratori di una società denominata Contoso Manufacturing di segnalare i problemi tramite testo o riconoscimento vocale. L'input audio viene tradotto in testo e quindi riepilogato per evidenziare informazioni importanti e il report viene inviato al reparto appropriato.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub di riepilogoation-openai-python-promptflow .

Diagramma dell'architettura per l'automazione dei processi con riconoscimento vocale e riepilogo con AI Studio per Python.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure Studio AI della piattaforma Azure
Servizio Di riconoscimento vocale
Richiesta
Runtime di integrazione gestita (MIR)
GPT 3.5 Turbo

Copilota di analisi di API Assistente con Python e Studio AI della piattaforma Azure

Questo modello è un'API Assistente per chattare con dati tabulari ed eseguire analisi in linguaggio naturale.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub assistant-data-openai-python-promptflow .

Diagramma dell'architettura per un'API assistente per chattare con dati tabulari ed eseguire analisi in linguaggio naturale.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Servizio Machine Learning Azure AI Search
Studio AI della piattaforma Azure
Runtime di integrazione gestita (MIR)
OpenAI di Azure
GPT 3.5 Turbo
GPT 4

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con Java

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per Java. Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub azure-search-openai-demo-java .

Diagramma che mostra l'architettura dal client all'app back-end in Java.

Screenshot dell'app Chat Java nel browser che mostra diversi suggerimenti per l'input della chat e la casella di testo della chat per immettere una domanda.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
Servizio app di Azure
App contenitore di Azure
Servizio Azure Kubernetes
OpenAI di Azure
Azure AI Search
Archiviazione di Azure
Monitoraggio di Azure

Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con JavaScript

Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.

Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per JavaScript. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-javascript .

Diagramma che mostra l'architettura dal client all'app back-end.

Screenshot dell'app di chat nel browser che mostra diversi suggerimenti per l'inserimento in chat e la casella di testo della chat per inserire una domanda.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App contenitore di Azure
App Web statiche di Azure
OpenAI di Azure
Azure AI Search
Archiviazione di Azure
Monitoraggio di Azure
text-embedding-ada-002

Front-end di chat OpenAI di Azure

Questo modello è un componente Web di chat OpenAI minimo che può essere associato a qualsiasi implementazione back-end come client.

Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub azure-openai-chat-frontend .

Video che illustra l'applicazione front-end di chat JavaScript.

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App Web statiche di Azure Azure AI Search
OpenAI di Azure
GPT 3.5 Turbo
GPT4

Chat di intelligenza artificiale serverless con RAG con LangChain.js

Il modello è un chatbot di intelligenza artificiale serverless con La generazione aumentata di recupero usando LangChain.js e Azure che usa un set di documenti aziendali per generare risposte alle query utente. Usa una società fittizia denominata Contoso Real Estate e l'esperienza consente ai clienti di porre domande di supporto sull'utilizzo dei suoi prodotti. I dati di esempio includono un set di documenti che descrivono le condizioni per il servizio, l'informativa sulla privacy e una guida al supporto.

Per informazioni su come distribuire ed eseguire questo modello, vedere Introduzione a Serverless AI Chat con RAG usando LangChain.js. Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub serverless-chat-langchainjs .

Informazioni su come distribuire ed eseguire questo modello di riferimento JavaScript.

Diagramma che mostra l'architettura per l'API serverless usando LangChainjs per l'integrazione con il servizio Azure OpenAI e Ricerca di intelligenza artificiale di Azure.

Video del browser della dimostrazione dell'app di chat JavaScript con RAG e Langchain.js

Questo modello illustra l'uso di queste funzionalità.

Soluzione di hosting di Azure Tecnologie Modelli di intelligenza artificiale
App Web statiche di Azure
Funzioni di Azure
Azure AI Search
OpenAI di Azure
Azure Cosmos DB
Archiviazione di Azure
Identità gestita di Azure
GPT4
Mistral
Ollama