Modelli di app per intelligenza artificiale
Questa sezione della documentazione presenta i modelli di app di intelligenza artificiale e gli articoli correlati che usano questi modelli per illustrare come eseguire attività di sviluppo chiave. I modelli di app di intelligenza artificiale offrono implementazioni di riferimento ben gestite e facili da distribuire per garantire un punto di partenza di alta qualità per le app di intelligenza artificiale.
Esistono due categorie di modelli di app di intelligenza artificiale, ovvero blocchi predefiniti e soluzioni end-to-end. Le sezioni seguenti introducono alcuni dei modelli chiave in ogni categoria per il linguaggio di programmazione selezionato nella parte superiore di questo articolo. Per esplorare un elenco più completo, inclusi questi e altri modelli, vedere i modelli di app di intelligenza artificiale nella raccolta di modelli di app per intelligenza artificiale.
Blocchi predefiniti
I blocchi predefiniti sono esempi su scala ridotta incentrati su scenari e attività specifici. La maggior parte dei blocchi predefiniti illustra le funzionalità che sfruttano la soluzione end-to-end per un'app di chat che usa i propri dati.
Blocco predefinito | Descrizione |
---|---|
Bilanciare il carico con le app di Azure Container | Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint. |
Blocco predefinito | Descrizione |
---|---|
Configurare la sicurezza dei documenti per l'app chat | Quando si compila un'applicazione di chat usando il modello RAG con i propri dati, assicurarsi che ogni utente riceva una risposta in base alle relative autorizzazioni. Un utente autorizzato deve avere accesso alle risposte contenute nei documenti dell'app di chat. Un utente non autorizzato non deve avere accesso alle risposte da documenti protetti che non hanno l'autorizzazione per visualizzare. |
Valutare le risposte alle app di chat | Informazioni su come valutare le risposte di un'app di chat su un set di risposte corrette o ideali (note come verità di base). Ogni volta che si modifica l'applicazione di chat in modo che influisca sulle risposte, eseguire una valutazione per confrontare le modifiche. Questa applicazione demo offre strumenti che è possibile usare oggi per semplificare l'esecuzione delle valutazioni. |
Bilanciare il carico con le app di Azure Container | Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint. |
Bilanciamento del carico con Gestione API | Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa Azure Gestione API per creare tre endpoint OpenAI di Azure, nonché un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint. |
Testare il carico dell'app di chat Python con Locust | Informazioni sul processo per eseguire test di carico in un'applicazione di chat Python usando il modello RAG con Locust, uno strumento di test di carico open source diffuso. L'obiettivo principale del test di carico è garantire che il carico previsto nell'applicazione di chat non superi la quota corrente di transazioni OpenAI di Azure al minuto (TPM). Simulando il comportamento dell'utente con carico elevato, è possibile identificare potenziali colli di bottiglia e problemi di scalabilità nell'applicazione. |
Proteggere l'app di intelligenza artificiale con l'autenticazione senza chiave | Informazioni sul processo per proteggere l'applicazione di chat Python OpenAI di Azure con l'autenticazione senza chiave. Le richieste dell'applicazione alla maggior parte dei servizi di Azure devono essere autenticate con connessioni senza chiave o senza password. L'autenticazione senza chiave offre vantaggi di gestione e sicurezza migliorati rispetto alla chiave dell'account perché non è presente alcuna chiave (o stringa di connessione) da archiviare. |
Blocco predefinito | Descrizione |
---|---|
Bilanciare il carico con le app di Azure Container | Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint. |
Blocco predefinito | Descrizione |
---|---|
Valutare le risposte alle app di chat | Informazioni su come valutare le risposte di un'app di chat su un set di risposte corrette o ideali (note come verità di base). Ogni volta che si modifica l'applicazione di chat in modo che influisca sulle risposte, eseguire una valutazione per confrontare le modifiche. Questa applicazione demo offre strumenti che è possibile usare oggi per semplificare l'esecuzione delle valutazioni. |
Bilanciare il carico con le app di Azure Container | Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa App contenitore di Azure per creare tre endpoint Azure OpenAI e un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint. |
Bilanciamento del carico con Gestione API | Informazioni su come aggiungere il bilanciamento del carico all'applicazione per estendere l'app di chat oltre i limiti del token e delle quote del modello di Azure OpenAI. Questo approccio usa Azure Gestione API per creare tre endpoint OpenAI di Azure, nonché un contenitore primario per indirizzare il traffico in ingresso a uno dei tre endpoint. |
Soluzioni end-to-end
Le soluzioni end-to-end sono esempi di riferimento completi, tra cui la documentazione, il codice sorgente e la distribuzione per consentire l'esecuzione e l'estensione per scopi personalizzati.
Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con .NET
Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.
Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per .NET. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-demo-csharp .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App contenitore di Azure Funzioni di Azure |
OpenAI di Azure Visione artificiale di Azure Riconoscimento modulo di Azure Azure AI Search Archiviazione di Azure |
GPT 3.5 Turbo GPT 4.0 |
Contoso chat retail Copilot con .NET e Semantic Kernel
Questo modello implementa Contoso Outdoors, un negozio concettuale specializzato in attrezzatura all'aperto per gli appassionati di escursioni e campeggio. Questo negozio virtuale migliora l'engagement dei clienti e il supporto per le vendite tramite un agente di chat intelligente. Questo agente è basato sul modello Di generazione aumentata di recupero (RAG) all'interno di Microsoft Azure AI Stack, arricchito con il kernel semantico e il supporto prompty.
Per accedere al codice sorgente e leggere dettagli approfonditi sul modello, vedere il repository GitHub contoso-chat-csharp-prompty .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App contenitore di Azure |
OpenAI di Azure Microsoft Entra ID Identità gestita di Azure Monitoraggio di Azure Azure AI Search Studio AI della piattaforma Azure SQL di Azure Archiviazione di Azure |
GPT 3.5 Turbo GPT 4.0 |
Automazione dei processi con sintesi vocale e riepilogo con .NET e GPT 3.5 Turbo
Questo modello è una soluzione di automazione dei processi che riceve problemi segnalati dai lavoratori del settore e dell'officina presso una società denominata Contoso Manufacturing, una società di produzione che produce batterie per auto. I problemi sono condivisi dai lavoratori tramite l'input del microfono o preregistrati come file audio. La soluzione converte l'input audio dal parlato al testo e quindi usa un LLM e Prompty o Promptflow per riepilogare il problema e restituire i risultati in un formato specificato dalla soluzione.
Per accedere al codice sorgente e leggere dettagli approfonditi sul modello, vedere il repository GitHub summarization-openai-csharp-prompty .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App contenitore di Azure | Riconoscimento vocale Riepilogo OpenAI di Azure |
GPT 3.5 Turbo |
Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con Python
Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli di linguaggio OpenAI di Azure per offrire esperienze di domande e risposte (Q&A) in stile ChatGPT.
Per iniziare a usare questo modello, vedere Introduzione alla chat usando un esempio di dati personalizzato per Python. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-demo .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App contenitore di Azure | OpenAI di Azure Azure AI Search Archiviazione BLOB di Azure Monitoraggio di Azure Intelligence sui documenti di Azure |
GPT 3.5 Turbo GPT 4 GPT 4o GPT 4o-mini |
Copilota per la scrittura creativa multi modale con DALL-E
Questo modello è una soluzione creativa che scrive più agenti per aiutare gli utenti a scrivere articoli. Illustra come creare e usare agenti di intelligenza artificiale basati su Azure OpenAI.
Comprende:
- Un'app Flask che accetta un articolo e un'istruzione da un utente.
- Agente di ricerca che usa l'API Ricerca Bing per cercare l'articolo.
- Agente del prodotto che usa Ricerca intelligenza artificiale di Azure per eseguire una ricerca semantica di somiglianza per i prodotti correlati da un archivio vettoriale.
- Agente scrittore per combinare le informazioni di ricerca e prodotto in un articolo utile.
- Agente dell'editor per perfezionare l'articolo presentato all'utente.
Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub agent-openai-python-prompty .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
Registro Azure Container Azure Kubernetes |
OpenAI di Azure Ricerca Bing Identità gestita di Azure Monitoraggio di Azure Azure AI Search Studio AI della piattaforma Azure |
GPT 3.5 Turbo GPT 4.0 DALL-E |
Contoso Chat Retail Copilot con AI Studio
Questo modello implementa Contoso Chat - una soluzione di copilota al dettaglio per Contoso Outdoor che usa un modello di progettazione di generazione aumentata di recupero per mettere a punto le risposte del chatbot nei dati dei prodotti e dei clienti del rivenditore. I clienti possono porre domande dal sito Web in linguaggio naturale e ottenere risposte pertinenti con potenziali raccomandazioni in base alla cronologia degli acquisti, con procedure di IA responsabili per garantire la qualità e la sicurezza delle risposte.
Questo modello illustra il flusso di lavoro end-to-end (GenAIOps) per la creazione di un codice copilot basato su RAG con Azure AI e Prompty. Esplorando e distribuendo questo esempio, vedere:
- Ideare ed eseguire rapidamente l'iterazione sui prototipi di app usando Prompty
- Distribuire e usare modelli OpenAI di Azure per chat, incorporamenti e valutazione
- Usare Ricerca di intelligenza artificiale di Azure (indici) e Azure Cosmos DB (database) per i dati
- Valutare le risposte di chat per la qualità usando i flussi di valutazione assistita dall'intelligenza artificiale
- Ospitare l'applicazione come endpoint FastAPI distribuito in App Contenitore di Azure
- Effettuare il provisioning e distribuire la soluzione usando l'interfaccia della riga di comando per sviluppatori di Azure
- Supportare le procedure di IA responsabile con la sicurezza e le valutazioni dei contenuti
Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub contoso-chat .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App contenitore di Azure |
OpenAI di Azure Azure AI Search Studio AI della piattaforma Azure Richiesta Azure Cosmos DB |
GPT 3.5 Turbo GPT 4.0 Runtime di integrazione gestita (MIR) |
Automazione dei processi con sintesi vocale e riepilogo con AI Studio
Questo modello crea un'app basata sul Web che consente ai lavoratori di una società denominata Contoso Manufacturing di segnalare i problemi tramite testo o riconoscimento vocale. L'input audio viene tradotto in testo e quindi riepilogato per evidenziare informazioni importanti e il report viene inviato al reparto appropriato.
Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub di riepilogoation-openai-python-promptflow .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App contenitore di Azure | Studio AI della piattaforma Azure Servizio Di riconoscimento vocale Richiesta Runtime di integrazione gestita (MIR) |
GPT 3.5 Turbo |
Copilota di analisi di API Assistente con Python e Studio AI della piattaforma Azure
Questo modello è un'API Assistente per chattare con dati tabulari ed eseguire analisi in linguaggio naturale.
Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub assistant-data-openai-python-promptflow .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
Servizio Machine Learning | Azure AI Search Studio AI della piattaforma Azure Runtime di integrazione gestita (MIR) OpenAI di Azure |
GPT 3.5 Turbo GPT 4 |
Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con Java
Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.
Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per Java. Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub azure-search-openai-demo-java .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
Servizio app di Azure App contenitore di Azure Servizio Azure Kubernetes |
OpenAI di Azure Azure AI Search Archiviazione di Azure Monitoraggio di Azure |
Chattare con i dati usando Azure OpenAI e Ricerca di intelligenza artificiale di Azure con JavaScript
Questo modello è una soluzione end-to-end completa che illustra il modello Di generazione aumentata (RAG) di recupero in esecuzione in Azure. Usa Ricerca di intelligenza artificiale di Azure per il recupero e i modelli linguistici Di Azure OpenAI per sfruttare le esperienze di chatGPT e Q&A.
Per iniziare a usare questo modello, vedere Introduzione alla chat usando il proprio esempio di dati per JavaScript. Per accedere al codice sorgente e leggere informazioni dettagliate sul modello, vedere il repository GitHub azure-search-openai-javascript .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App contenitore di Azure App Web statiche di Azure |
OpenAI di Azure Azure AI Search Archiviazione di Azure Monitoraggio di Azure |
text-embedding-ada-002 |
Front-end di chat OpenAI di Azure
Questo modello è un componente Web di chat OpenAI minimo che può essere associato a qualsiasi implementazione back-end come client.
Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub azure-openai-chat-frontend .
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App Web statiche di Azure | Azure AI Search OpenAI di Azure |
GPT 3.5 Turbo GPT4 |
Chat di intelligenza artificiale serverless con RAG con LangChain.js
Il modello è un chatbot di intelligenza artificiale serverless con La generazione aumentata di recupero usando LangChain.js e Azure che usa un set di documenti aziendali per generare risposte alle query utente. Usa una società fittizia denominata Contoso Real Estate e l'esperienza consente ai clienti di porre domande di supporto sull'utilizzo dei suoi prodotti. I dati di esempio includono un set di documenti che descrivono le condizioni per il servizio, l'informativa sulla privacy e una guida al supporto.
Per informazioni su come distribuire ed eseguire questo modello, vedere Introduzione a Serverless AI Chat con RAG usando LangChain.js. Per accedere al codice sorgente e leggere i dettagli approfonditi sul modello, vedere il repository GitHub serverless-chat-langchainjs .
Informazioni su come distribuire ed eseguire questo modello di riferimento JavaScript.
Questo modello illustra l'uso di queste funzionalità.
Soluzione di hosting di Azure | Tecnologie | Modelli di intelligenza artificiale |
---|---|---|
App Web statiche di Azure Funzioni di Azure |
Azure AI Search OpenAI di Azure Azure Cosmos DB Archiviazione di Azure Identità gestita di Azure |
GPT4 Mistral Ollama |