Condividi tramite


Selezionare Azure soluzioni PaaS per l'intelligenza artificiale

Questo articolo illustra come selezionare le risorse per Azure soluzioni PaaS (Ai Platform as a Service). La tabella seguente riepiloga i principali Azure soluzioni PaaS di intelligenza artificiale e criteri decisionali chiave.

Servizi di intelligenza artificiale Tipo di intelligenza artificiale Descrizione Competenze richieste
Microsoft Foundry Intelligenza artificiale generativa e intelligenza artificiale non generativa Una piattaforma per la creazione e la distribuzione di applicazioni di intelligenza artificiale generative e nongenerative Competenze per sviluppatori e data science
Strumenti per fonderia Intelligenza artificiale generativa e intelligenza artificiale non generativa Vari servizi che forniscono modelli di intelligenza artificiale predefiniti e non generativi Competenze per sviluppatori
Azure OpenAI Intelligenza artificiale generativa Un servizio per l'accesso ai modelli OpenAI Competenze per sviluppatori e data science
Azure Machine Learning Apprendimento automatico Un servizio per il training e la distribuzione di modelli di Machine Learning Competenze per sviluppatori e competenze avanzate di data science

Selezionare le risorse per carichi di lavoro generativi di intelligenza artificiale

L'intelligenza artificiale generativa usa più risorse per elaborare i dati di input e produrre output significativi. Per creare applicazioni efficaci, come quelle che utilizzano la *retrieval-augmented generation (RAG)*, selezionare risorse che rafforzano i modelli di intelligenza artificiale e forniscono risultati accurati.

Diagramma che mostra i componenti di base di un carico di lavoro di intelligenza artificiale generativa.

Flusso di lavoro generativo per intelligenza artificiale

Il flusso di lavoro seguente corrisponde al diagramma precedente:

  1. L'app di intelligenza artificiale riceve una query utente.
  2. Un agente di orchestrazione, ad esempio il servizio agente Foundry o Microsoft Agent Framework, gestisce il flusso di dati.
  3. Un meccanismo di ricerca e recupero trova i dati di base.
  4. Il meccanismo invia i dati di base a una piattaforma di intelligenza artificiale generativa.
  5. La piattaforma di intelligenza artificiale generativa crea una risposta usando la query dell'utente e i dati di base.

Selezione delle risorse di intelligenza artificiale generative

Seguire questa procedura per creare carichi di lavoro RAG generativi:

  1. Selezionare una piattaforma di intelligenza artificiale generativa. Usare Foundry o Azure OpenAI per distribuire e gestire modelli di intelligenza artificiale generativi. Foundry offre una piattaforma code-first con strumenti predefiniti per lo sviluppo, la distribuzione e l'orchestrazione. Scegliere Azure OpenAI se è sufficiente accedere ai modelli OpenAI.

  2. Selezionare un tipo di calcolo di intelligenza artificiale. Foundry richiede istanze di calcolo per funzionalità specifiche. Scegliere un tipo di calcolo adatto alle esigenze di prestazioni e budget.

  3. Selezionare un orchestratore. Usare agenti di orchestrazione come Foundry Agent Service o Microsoft Agent Framework per gestire il flusso di dati e le interazioni. Se il carico di lavoro utilizza più agenti, assicurarsi che il sistema di orchestrazione supporti i modelli di orchestrazione degli agenti di intelligenza artificiale necessari.

  4. Selezionare un meccanismo di ricerca e recupero delle informazioni. Per fondare modelli di intelligenza artificiale generativi, creare un database a indice o vettoriale per i dati pertinenti. Usare Azure AI Search per compilare indici tradizionali e vettoriali da varie origini data, applicare data chunking e usare i tipi di query multiple. Per i database strutturati, prendere in considerazione Azure Cosmos DB, Database di Azure per PostgreSQL o Azure Redis gestito.

  5. Selezionare un'origine dati per i dati di base. Archiviare i dati di base in Archiviazione BLOB di Azure per immagini, audio, video o set di dati di grandi dimensioni. È anche possibile usare i database supportati dai database di ricerca di intelligenza artificiale o vettoriali.

  6. Selezionare una piattaforma di calcolo. Usare l'albero delle decisioni Azure compute per scegliere la piattaforma appropriata per il carico di lavoro.

Selezionare le risorse per carichi di lavoro di intelligenza artificiale non generici

I carichi di lavoro di intelligenza artificiale non generici usano piattaforme, risorse di calcolo, origini dati e strumenti di elaborazione dati per supportare le attività di Machine Learning. Selezionare le risorse che consentono di creare carichi di lavoro di intelligenza artificiale con soluzioni predefinite o personalizzate.

Diagramma che mostra i componenti di base di un carico di lavoro di intelligenza artificiale non generico.

Flusso di lavoro di intelligenza artificiale non generico

Il flusso di lavoro seguente corrisponde al diagramma precedente:

  1. L'app di intelligenza artificiale inserisce i dati in ingresso.
  2. Un meccanismo di elaborazione dati facoltativo estrae o trasforma i dati.
  3. Un endpoint del modello di intelligenza artificiale analizza i dati.
  4. È possibile usare i dati per il training o l'ottimizzazione dei modelli di intelligenza artificiale.

Selezione di risorse di intelligenza artificiale non generica

Seguire questa procedura per creare carichi di lavoro di intelligenza artificiale non generativi:

  1. Selezionare una piattaforma di intelligenza artificiale non generica. Usare gli strumenti Foundry o Machine Learning in base alle proprie esigenze. Gli strumenti foundry offrono modelli predefiniti che semplificano la distribuzione e riducono la necessità di competenze avanzate di data science. Machine Learning consente di sviluppare modelli personalizzati con i dati e di integrarli nei carichi di lavoro.

  2. Selezionare un tipo di calcolo di intelligenza artificiale. Machine Learning richiede risorse compute per eseguire processi o endpoint host. Scegliere un tipo di calcolo adatto alle esigenze di prestazioni e budget. Gli Strumenti Foundry non richiedono risorse computazionali.

  3. Selezionare un'origine dati. Usare le origini data supportate per ospitare i dati di training per Machine Learning. Molti strumenti Foundry non richiedono dati di ottimizzazione. Alcuni strumenti foundry, ad esempio Visione personalizzata di Azure AI , consentono di caricare i file locali nell'archiviazione gestita.

  4. Selezionare una piattaforma di calcolo. Usare l'albero delle decisioni Azure compute per scegliere la piattaforma appropriata per il carico di lavoro.

  5. Selezionare un servizio di elaborazione dati (facoltativo). Usare Funzioni di Azure per l'elaborazione serverless dei dati. Usare Griglia di eventi di Azure per attivare le pipeline di elaborazione dati.

Passaggi successivi