Esplorare il catalogo dei modelli

Completato

Il catalogo dei modelli foundry funge da hub centrale per l'individuazione e il confronto dei modelli di intelligenza artificiale. Con oltre 1.900 modelli disponibili da diversi provider, sono necessari modi efficaci per filtrare e trovare modelli che soddisfano i requisiti specifici.

Il catalogo dei modelli include due ampie categorie di modello:

  • Modelli Foundry venduti direttamente da Azure

    Questi modelli vengono fatturati direttamente tramite la sottoscrizione di Azure e includono modelli OpenAI di Azure, nonché modelli di Microsoft e altri provider.

  • Modelli Foundry da partner e dalla community

    Questi modelli vengono forniti da partner attendibili e dalla community; ognuno con le proprie licenze e prezzi.

Ricerca di modelli nel catalogo dei modelli

L'interfaccia utente del catalogo dei modelli nel portale foundry offre un modo semplice per cercare il modello appropriato per le proprie esigenze. Ogni modello ha una scheda modello che mostra le informazioni chiave; tra cui provider, funzionalità, metriche di benchmark, considerazioni sull'intelligenza artificiale responsabile e opzioni di distribuzione.

Screenshot del catalogo dei modelli nel portale di Microsoft Foundry.

È possibile cercare modelli per parola chiave ed è possibile filtrare in base agli attributi seguenti:

  • Raccolta: i modelli sono organizzati in raccolte, ad esempio modelli forniti direttamente in Azure o modelli nel repository Hugging Face.
  • Funzionalità: capacità specifiche del modello, tra cui ragionamento (risoluzione dei problemi complessi), chiamata di strumenti (integrazione di API e funzioni) o elaborazione bidirezionale (testo, immagini, audio).
  • Origine: provider di modelli, tra cui Azure OpenAI, Microsoft, Cohere, Mistral, Meta, Anthropic e altri.
  • Attività di inferenza: attività specifiche come generazione di testo, riepilogo, traduzione, generazione di immagini, sintesi vocale o altre attività comuni di intelligenza artificiale.
  • Metodi di ottimizzazione: tecniche supportate per l'ottimizzazione di un modello.
  • Settore: modelli addestrati su set di dati specifici del settore. Questi modelli specializzati spesso superano i modelli per utilizzo generico nei rispettivi domini.

Informazioni sui tipi di modello di intelligenza artificiale generativi

Durante l'esplorazione del catalogo, si riscontrano diverse categorie di modelli progettati per diversi casi d'uso. In termini generali, è possibile classificare i modelli linguistici come:

  • Modelli di linguaggio di grandi dimensioni come GPT-5, Mistral Large e Llama 3 70B progettati per attività che richiedono un ragionamento approfondito, una generazione di contenuto complessa e una conoscenza approfondita del contesto. Questi modelli sono eccellenti nelle applicazioni sofisticate, ma richiedono più risorse di calcolo.
  • Modelli di linguaggio piccoli (SLM) come Phi-4, modelli OSS Mistral e Llama 3 8B, che offrono efficienza e convenienza nel gestire le attività comuni di elaborazione del linguaggio naturale. Sono ideali per scenari in cui la velocità e i costi sono più importanti rispetto alla gestione delle attività di ragionamento più complesse. Le SLM possono essere eseguite su dispositivi edge o hardware di fascia inferiore.

Modelli di completamento e di ragionamento per le chat

La maggior parte dei modelli linguistici nel catalogo sono modelli di completamento chat progettati per generare risposte di testo coerenti e contestualmente appropriate. Questi modelli alimentano le interfacce conversazionali e le applicazioni di generazione di contenuti.

Per scenari che richiedono prestazioni più elevate in attività complesse come matematica, codifica, scienza, strategia e logistica, i modelli di ragionamento come Claude Opus 4.6 offrono funzionalità avanzate di risoluzione dei problemi. Questi modelli possono suddividere i problemi complessi e mostrare il loro processo di ragionamento.

Modelli specializzati

Il catalogo include anche modelli specifici dell'attività:

L'incorporamento di modelli come Ada e Cohere converte il testo in rappresentazioni numeriche. Questi modelli consentono la ricerca semantica, i sistemi di raccomandazione e gli scenari rag (Retrieval Augmented Generation) in cui è necessario trovare informazioni pertinenti in base al significato anziché alle corrispondenze esatte delle parole chiave.

I modelli di generazione di immagini come GPT-image-1 creano immagini da descrizioni di testo. Usarli per generare materiali di marketing, illustrazioni o modelli di simulazione.

I modelli di generazione di video come Sora 2 creano contenuto video da descrizioni di testo.

I modelli di analisi delle immagini come GPT-4.1 possono accettare input bidirezionali , tra cui testo e immagini; e generare l'output del linguaggio naturale in base a richieste che includono immagini per l'analisi.

I modelli di sintesi vocale come GPT-4o-tts possono convertire l'input basato su testo in sintesi vocale.

Modelli di conversione da voce a testo come GPT-4o-transcribe possono convertire dati audio contenenti parlato in trascrizioni di testo.

Modelli regionali e specifici del dominio

Alcuni modelli sono ottimizzati per lingue, aree o settori specifici. Quando sono necessarie prestazioni specializzate in un particolare dominio o linguaggio, questi modelli spesso superano le alternative per utilizzo generico. Alcuni esempi includono modelli addestrati su letteratura medica, documenti legali o corpora linguistici specifici.