Foundry Models venduto direttamente da Azure

Microsoft Foundry Models nel catalogo dei modelli comprende due categorie principali, ovvero Foundry Models vendute direttamente da Azure e Foundry Models di partner e community. Questo articolo elenca una selezione di modelli Foundry venduti direttamente da Azure, insieme alle relative funzionalità, deployment tipi e aree di disponibilità, esclusi i modelli deprecati e ritirati. I modelli Foundry venduti direttamente da Azure sono detti anche Direct da modelli Azure o Azure Modelli diretti.

I modelli venduti direttamente da Azure includono tutti i modelli OpenAI Azure e specifici modelli selezionati dai principali provider. Questi modelli vengono fatturati tramite la sottoscrizione Azure, coperti da contratti di servizio Azure e supportati da Microsoft. Per visualizzare un elenco dei modelli Foundry supportati dal servizio agente Foundry, vedere Modelli supportati dal servizio Agent e per un elenco dei modelli Foundry dei partner, vedere Foundry Models from partner and community (Modelli foundry da partner e community).

Mancia

Usare le schede nella parte superiore di questa pagina per passare da Azure modelli OpenAI e Other model collections da provider come Cohere, DeepSeek, Meta, Mistral AI e xAI.

Azure OpenAI nei modelli Microsoft Foundry

Azure OpenAI è basato su un set diversificato di modelli con funzionalità e punti di prezzo diversi. La disponibilità del modello varia in base all'area e al cloud. Per Azure per enti pubblici disponibilità del modello, vedere Azure OpenAI in Azure per enti pubblici.

Modelli	Descrizione
Serie GPT-5.5	NUOVO`gpt-5.5`
Serie GPT-5.4	NEW`gpt-5.4-mini`, `gpt-5.4-nano`, `gpt-5.4`, `gpt-5.4-pro`
Serie GPT-5.3	`gpt-5.3-chat`, `gpt-5.3-codex`
Serie GPT-5.2	`gpt-5.2-codex`, `gpt-5.2`, `gpt-5.2-chat`anteprima
Serie GPT-5.1	`gpt-5.1`, `gpt-5.1-chat`Anteprima, `gpt-5.1-codex`, `gpt-5.1-codex-mini`
Sora	NUOVO sora-2
Serie GPT-5	`gpt-5`, `gpt-5-mini`, `gpt-5-nano`, anteprima `gpt-5-chat`
gpt-oss	modelli di ragionamento open-weight
codex-mini	Versione ottimizzata di `o4-mini`.
Serie GPT-4.1	`gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`
computer-use-preview	Modello sperimentale sottoposto a training per l'uso con lo strumento d'uso del computer dell'API Risposte.
Modelli serie o	Modelli di ragionamento con risoluzione avanzata dei problemi e maggiore attenzione e capacità.
GPT-4o, GPT-4o mini e GPT-4 Turbo	In grado di Azure modelli OpenAI conversionii, che possono accettare sia testo che immagini come input.
Incorporamenti	Set di modelli in grado di convertire il testo in formato vettoriale numerico per facilitare la somiglianza del testo.
Generazione di immagini	Serie di modelli che possono generare immagini originali dal linguaggio naturale.
`Video generation`	Modello in grado di generare scene video originali dalle istruzioni di testo.
Audio	Serie di modelli per la sintesi vocale, la traduzione e la sintesi vocale. I modelli audio GPT-4o supportano il riconoscimento vocale a bassa latenza, le interazioni vocali in uscita o la generazione di audio.

GPT-5.5

Modello	Regione
`gpt-5.5`	Standard globale: Stati Uniti orientali 2 Svezia centrale Stati Uniti centro-meridionali Polonia centrale Datazone Standard: Stati Uniti orientali 2 Stati Uniti centro-meridionali Polonia centrale Svezia centrale

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-5.5` (2026-04-24)	- Ragionamento - API Risposte. - API Completamento chat. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Uso del computer - Riepilogo completo delle funzionalità.	1.050.000 br> Input: 922.000 Output: 128.000	128,000	Dicembre 2025

Nota

Alcuni livelli di quota richiedono richieste di quota per gpt-5.5 poter distribuire questo modello. Per impostazione predefinita, le sottoscrizioni di livello 5 e 6 hanno una quota.

GPT-5.4

Modello	Regione
`gpt-5.4`	Vedere la tabella dei modelli
`gpt-5.4-pro`	Vedere la tabella dei modelli
`gpt-5.4-mini`	Vedere la tabella dei modelli
`gpt-5.4-nano`	Vedere la tabella dei modelli

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-5.4` (2026-03-05)	- Ragionamento - API Risposte. - API Completamento chat. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Uso del computer - Riepilogo completo delle funzionalità.	1,050,000	128,000	Agosto 2025
`gpt-5.4-pro` (2026-03-05)	- Ragionamento - API Risposte. - Elaborazione del testo e dell'immagine. - Funzioni e strumenti - Riepilogo completo delle funzionalità.	1,050,000	128,000	Agosto 2025
`gpt-5.4-mini` (2026-03-17)	- Ragionamento - API Risposte. - API Completamento chat. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Uso del computer - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	Agosto 2025
`gpt-5.4-nano` (2026-03-17)	- Ragionamento - API Risposte. - API Completamento chat. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	Agosto 2025

GPT-5.3

Modello	Regione
`gpt-5.3-codex`	Vedere la tabella dei modelli
`gpt-5.3-chat`	Stati Uniti orientali 2 e Svezia centrale (standard globale)

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-5.3-codex` (2026-02-24)	- Ragionamento - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità. - Ottimizzato per l'estensione Codex CLI & Codex VS Code	400,000 Input: 272.000 Output: 128.000	128,000	Agosto 2025
`gpt-5.3-chat` (2026-03-03) Anteprima	- API Completamento chat. - API Risposte. - Output strutturati - Funzioni, strumenti e chiamate di strumenti paralleli.	128,000 Input: 111.616 Output: 16.384	16,384	Agosto 2025

GPT-5.2

Disponibilità dell'area

Modello	Regione
`gpt-5.2`	Vedere la tabella dei modelli.
`gpt-5.2-chat` Anteprima	Vedere la tabella dei modelli.
`gpt-5.2-codex`	Vedere la tabella dei modelli

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-5.2-codex` (2026-01-14)	- Ragionamento - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità. - Ottimizzato per l'estensione Codex CLI & Codex VS Code	400,000 Input: 272.000 Output: 128.000	128,000
`gpt-5.2` (2025-12-11)	- Ragionamento - API Completamento chat. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	Agosto 2025
`gpt-5.2-chat` (2025-12-11) Anteprima	- API Completamento chat. - API Risposte. - Output strutturati - Funzioni, strumenti e chiamate di strumenti paralleli.	128,000 Input: 111.616 Output: 16.384	16,384	Agosto 2025
`gpt-5.2-chat` (2026-02-10) Anteprima	- API Completamento chat. - API Risposte. - Output strutturati - Funzioni, strumenti e chiamate di strumenti paralleli.	128,000 Input: 111.616 Output: 16.384	16,384	Agosto 2025

Attenzione

Non è consigliabile usare modelli di anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate a versioni di anteprima future o alla versione stabile più recente disponibile a livello generale. I modelli designati in anteprima non seguono lo standard Azure ciclo di vita del modello OpenAI.

GPT-5.1

Disponibilità dell'area

Modello	Regione
`gpt-5.1`	Vedere la tabella dei modelli.
`gpt-5.1-chat` Anteprima	Vedere la tabella dei modelli.
`gpt-5.1-codex`	Vedere la tabella dei modelli.
`gpt-5.1-codex-mini`	Vedere la tabella dei modelli.
`gpt-5.1-codex-max`	Vedere la tabella dei modelli.

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-5.1` (2025-11-13)	- Ragionamento - API Completamento chat. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	30 settembre 2024
`gpt-5.1-chat` (2025-11-13) Anteprima	- Ragionamento - API Completamento chat. - API Risposte. - Output strutturati - Funzioni, strumenti e chiamate di strumenti paralleli.	128,000 Input: 111.616 Output: 16.384	16,384	30 settembre 2024
`gpt-5.1-codex` (2025-11-13)	- API delle risposte . - Elaborazione di testo e immagini - Output strutturati. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità - Ottimizzato per l'estensione Codex CLI & Codex VS Code	400,000 Input: 272.000 Output: 128.000	128,000	30 settembre 2024
`gpt-5.1-codex-mini` (2025-11-13)	- API delle risposte . - Elaborazione di testo e immagini - Output strutturati. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità - Ottimizzato per l'estensione Codex CLI & Codex VS Code	400,000 Input: 272.000 Output: 128.000	128,000	30 settembre 2024
`gpt-5.1-codex-max` (2025-12-04)	- API delle risposte . - Elaborazione di testo e immagini - Output strutturati. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità - Ottimizzato per l'estensione Codex CLI & Codex VS Code	400,000 Input: 272.000 Output: 128.000	128,000	30 settembre 2024

Attenzione

Importante

gpt-5.1 reasoning_effort il valore predefinito è none. Quando si esegue l'aggiornamento da modelli di ragionamento precedenti a gpt-5.1, tenere presente che potrebbe essere necessario aggiornare il codice per passare in modo esplicito un reasoning_effort livello se si vuole che si verifichi un ragionamento.
gpt-5.1-chat aggiunge funzionalità di ragionamento predefinite. Analogamente ad altri modelli di ragionamento , non supporta parametri come temperature. Se si esegue l'aggiornamento da tramite gpt-5-chat (che non è un modello di ragionamento) per gpt-5.1-chat assicurarsi di rimuovere eventuali parametri personalizzati come temperature dal codice che non sono supportati dai modelli di ragionamento.
gpt-5.1-codex-max aggiunge il supporto per l'impostazione reasoning_effort su xhigh. Il ragionamento non none è supportato con gpt-5.1-codex-max.

GPT-5

Disponibilità dell'area

Modello	Regione
`gpt-5` (2025-08-07)	Vedere la tabella dei modelli.
`gpt-5-mini` (2025-08-07)	Vedere la tabella dei modelli.
`gpt-5-nano` (2025-08-07)	Vedere la tabella dei modelli.
`gpt-5-chat` (2025-08-07) Anteprima	Vedere la tabella dei modelli.
`gpt-5-chat`(10-10-03) (anteprima 2025)	Vedere la tabella dei modelli.
`gpt-5-codex` (2025-09-11)	Vedere la tabella dei modelli.
`gpt-5-pro` (2025-10-06)	Vedere la tabella dei modelli.

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-5` (2025-08-07)	- Ragionamento - API Completamento chat. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	30 settembre 2024
`gpt-5-mini` (2025-08-07)	- Ragionamento - API Completamento chat. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	31 maggio 2024
`gpt-5-nano` (2025-08-07)	- Ragionamento - API Completamento chat. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	31 maggio 2024
`gpt-5-chat` (2025-08-07) Anteprima	- API Completamento chat. - API Risposte. - Input: Testo/Immagine - Output: solo testo	128,000	16,384	30 settembre 2024
`gpt-5-chat` (2025-10-03) Anteprima¹	- API Completamento chat. - API Risposte. - Input: Testo/Immagine - Output: solo testo	128,000	16,384	30 settembre 2024
`gpt-5-codex` (2025-09-11)	- API delle risposte . - Input: Testo/Immagine - Output: solo testo - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. - Riepilogo completo delle funzionalità - Ottimizzato per l'estensione Codex CLI & Codex VS Code	400,000 Input: 272.000 Output: 128.000	128,000	-
`gpt-5-pro` (2025-10-06)	- Ragionamento - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni e strumenti - Riepilogo completo delle funzionalità.	400,000 Input: 272.000 Output: 128.000	128,000	30 settembre 2024

Nota

¹gpt-5-chat versione 2025-10-03 introduce un miglioramento significativo incentrato sull'intelligenza emotiva e sulle capacità di salute mentale. Questo aggiornamento integra set di dati specializzati e strategie di risposta perfezionate per migliorare la capacità del modello di:

Comprendere e interpretare il contesto emotivo in modo più accurato, consentendo interazioni sfumate ed empatiche.
Fornire risposte di supporto e responsabilità nelle conversazioni correlate alla salute mentale, garantendo sensibilità e conformità alle procedure consigliate.

Questi miglioramenti mirano a rendere GPT-5-chat più consapevole del contesto, incentrato sull'uomo e affidabile negli scenari in cui il tono emotivo e le considerazioni sul benessere sono fondamentali.

Attenzione

gpt-oss

Disponibilità dell'area

Modello	Regione
`gpt-oss-120b`	Tutte le aree Azure OpenAI

Funzionalità

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-oss-120b` (Anteprima)	- Solo testo in/text out - API Completamento chat - Streaming - Chiamata di funzioni - Output strutturati -Ragionamento - Disponibile per la distribuzione¹ e tramite calcolo gestito	131,072	131,072	31 maggio 2024
`gpt-oss-20b` (Anteprima)	- Solo testo in/text out - API Completamento chat - Streaming - Chiamata di funzioni - Output strutturati -Ragionamento - Disponibile tramite calcolo gestito e foundry local	131,072	131,072	31 maggio 2024

¹ A differenza di altri modelli OpenAI Azure gpt-oss-120b richiede un progetto Foundry per distribuire il modello.

Distribuire con il codice

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Serie GPT-4.1

Disponibilità dell'area

Modello	Regione
`gpt-4.1` (2025-04-14)	Vedere la tabella dei modelli.
`gpt-4.1-nano` (2025-04-14)	Vedere la tabella dei modelli.
`gpt-4.1-mini` (2025-04-14)	Vedere la tabella dei modelli.

Funzionalità

Importante

Un problema noto riguarda tutti i modelli serie GPT 4.1. Le definizioni di chiamate di funzione o strumenti di grandi dimensioni che superano 300.000 token genereranno errori, anche se non è stato raggiunto il limite di contesto di 1 milione di token dei modelli.

Gli errori possono variare in base alle caratteristiche della chiamata API e del payload sottostante.

Ecco i messaggi di errore per l'API Completamento chat:

Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}
Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Ecco il messaggio di errore per l'API Risposte:

Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`gpt-4.1` (2025-04-14)	- Input di testo e immagine - Output di testo - API di completamento della chat - API Risposte - Streaming - Chiamata di funzioni - Output strutturati (completamenti della chat)	- 1,047,576 - 300.000 (distribuzioni gestite standard e con provisioning) - 128.000 (distribuzioni batch)	32,768	31 maggio 2024
`gpt-4.1-nano` (2025-04-14)	- Input di testo e immagine - Output di testo - API di completamento della chat - API Risposte - Streaming - Chiamata di funzioni - Output strutturati (completamenti della chat)	- 1,047,576 - 300.000 (distribuzioni gestite standard e con provisioning) - 128.000 (distribuzioni batch)	32,768	31 maggio 2024
`gpt-4.1-mini` (2025-04-14)	- Input di testo e immagine - Output di testo - API di completamento della chat - API Risposte - Streaming - Chiamata di funzioni - Output strutturati (completamenti della chat)	- 1,047,576 - 300.000 (distribuzioni gestite standard e con provisioning) - 128.000 (distribuzioni batch)	32,768	31 maggio 2024

computer-use-preview

Modello sperimentale sottoposto a training per l'uso con lo strumento d'uso del computer dell'API Risposte .

Può essere usato con librerie di terze parti per consentire al modello di controllare l'input del mouse e della tastiera, recuperando il contesto dagli screenshot dell'ambiente corrente.

Attenzione

La registrazione è necessaria per accedere computer-use-previewa . L'accesso viene concesso in base ai criteri di idoneità di Microsoft. I clienti che hanno accesso ad altri modelli di accesso limitato devono comunque richiedere l'accesso per questo modello.

Per richiedere l'accesso, passare all'applicazione modello dicomputer-use-preview accesso limitato. Quando viene concesso l'accesso, è necessario creare una distribuzione per il modello.

Disponibilità dell'area

Modello	Regione
`computer-use-preview`	Vedere la tabella dei modelli.

Funzionalità

ID modello	Descrizione	Finestra di contesto	Numero massimo di token di output	Dati di training (fino a)
`computer-use-preview` (2025-03-11)	Modello specializzato da usare con lo strumento d'uso del computer dell'API Risposte -Strumenti - Streaming - Testo (input/output) - Immagine (input)	8,192	1,024	Ottobre 2023

Modelli serie o

I modelli di serie o OpenAI Azure sono progettati per affrontare le attività di ragionamento e risoluzione dei problemi con maggiore attenzione e capacità. Questi modelli dedicano più tempo all'elaborazione e alla comprensione della richiesta dell'utente, rendendoli estremamente forti in aree come scienza, codifica e matematica, rispetto alle iterazioni precedenti.

ID modello	Descrizione	Richiesta massima (token)	Dati di training (fino a)
`codex-mini` (2025-05-16)	Versione ottimizzata di `o4-mini`. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni e strumenti. Riepilogo completo delle funzionalità.	Input: 200.000 Output: 100.000	31 maggio 2024
`o3-pro` (2025-06-10)	- API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni e strumenti. Riepilogo completo delle funzionalità.	Input: 200.000 Output: 100.000	31 maggio 2024
`o4-mini` (2025-04-16)	- Nuovo modello di ragionamento, che offre capacità di ragionamento avanzate. - API Completamento chat. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni e strumenti. Riepilogo completo delle funzionalità.	Input: 200.000 Output: 100.000	31 maggio 2024
`o3` (2025-04-16)	- Nuovo modello di ragionamento, che offre capacità di ragionamento avanzate. - API Completamento chat. - API Risposte. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni, strumenti e chiamate di strumenti paralleli. Riepilogo completo delle funzionalità.	Input: 200.000 Output: 100.000	31 maggio 2024
`o3-mini` (2025-01-31)	- Capacità di ragionamento migliorate. - Output strutturati. - Elaborazione solo testo. - Funzioni e strumenti.	Input: 200.000 Output: 100.000	Ottobre 2023
`o1` (2024-12-17)	- Capacità di ragionamento migliorate. - Output strutturati. - Elaborazione del testo e dell'immagine. - Funzioni e strumenti.	Input: 200.000 Output: 100.000	Ottobre 2023
`o1-preview` (2024-09-12)	Versione di anteprima precedente.	Input: 128.000 Output: 32.768	Ottobre 2023
`o1-mini` (2024-09-12)	Un'opzione più veloce e più conveniente nella serie o1, ideale per le attività di codifica che richiedono velocità e un consumo di risorse inferiore. - Distribuzione standard globale disponibile per impostazione predefinita. - Le distribuzioni standard (a livello di area) sono attualmente disponibili solo per i clienti selezionati che hanno ricevuto l'accesso come parte della `o1-preview` versione con accesso limitato.	Input: 128.000 Output: 65.536	Ottobre 2023

Per altre informazioni sui modelli avanzati di serie o, vedere Introduzione ai modelli di ragionamento.

Disponibilità dell'area

Modello	Regione
`codex-mini`	Stati Uniti orientali 2 e Svezia centrale (Standard globale).
`o3-pro`	Stati Uniti orientali 2 e Svezia centrale (Standard globale).
`o4-mini`	Vedere la tabella dei modelli.
`o3`	Vedere la tabella dei modelli.
`o3-mini`	Vedere la tabella dei modelli.
`o1`	Vedere la tabella dei modelli.
`o1-preview`	Vedere la tabella dei modelli. Questo modello è disponibile solo per i clienti a cui è stato concesso l'accesso come parte dell'accesso limitato originale.
`o1-mini`	Vedere la tabella dei modelli.

GPT-4o e GPT-4 Turbo

GPT-4o integra testo e immagini in un singolo modello, che consente di gestire più tipi di dati contemporaneamente. Questo approcciomultidimensionale migliora l'accuratezza e la velocità di risposta nelle interazioni tra computer umani. GPT-4o corrisponde alle attività GPT-4 Turbo in testo inglese e codifica, offrendo prestazioni superiori nelle attività e nelle attività di visione non in lingua inglese, impostando nuovi benchmark per le funzionalità di intelligenza artificiale.

Modelli GPT-4 e GPT-4 Turbo

Questi modelli possono essere usati solo con l'API Completamento chat.

Vedere Model versions per informazioni su come Azure OpenAI gestisce gli aggiornamenti delle versioni del modello. Vedere Uso dei modelli per informazioni su come visualizzare e configurare le impostazioni della versione del modello delle distribuzioni GPT-4.

ID modello	Descrizione	Richiesta massima (token)	Dati di training (fino a)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	- Output strutturati. - Elaborazione del testo e dell'immagine. - Modalità JSON. - Chiamata di funzione parallela. - Maggiore precisione e velocità di risposta. - Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Vision. - Prestazioni superiori nelle lingue non inglesi e nelle attività di visione. - Miglioramento della capacità di scrittura creativa.	Input: 128.000 Output: 16.384	Ottobre 2023
`gpt-4o` (2024-08-06) GPT-4o (Omni)	- Output strutturati. - Elaborazione del testo e dell'immagine. - Modalità JSON. - Chiamata di funzione parallela. - Maggiore precisione e velocità di risposta. - Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Vision. - Prestazioni superiori nelle lingue non inglesi e nelle attività di visione.	Input: 128.000 Output: 16.384	Ottobre 2023
`gpt-4o-mini` (2024-07-18) GPT-4o mini	- Modello veloce, economico e in grado di supportare la sostituzione dei modelli della serie GPT-3.5 Turbo. - Elaborazione del testo e dell'immagine. - Modalità JSON. - Chiamata di funzione parallela.	Input: 128.000 Output: 16.384	Ottobre 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	- Elaborazione del testo e dell'immagine. - Modalità JSON. - Chiamata di funzione parallela. - Maggiore precisione e velocità di risposta. - Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Vision. - Prestazioni superiori nelle lingue non inglesi e nelle attività di visione.	Input: 128.000 Output: 4.096	Ottobre 2023
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo con Visione	Nuovo modello disponibile a livello generale. - Sostituzione di tutti i modelli di anteprima GPT-4 precedenti (`vision-preview`, `1106-Preview`, `0125-Preview`). - La disponibilità delle funzionalità è attualmente diversa, a seconda del metodo di input e del tipo di distribuzione.	Input: 128.000 Output: 4.096	Dicembre 2023

Attenzione

Incorporamenti

text-embedding-3-large è il modello di incorporamento più recente e più idoneo. Non è possibile eseguire l'aggiornamento tra modelli di incorporamento. Per passare dall'uso text-embedding-ada-002 a text-embedding-3-large, è necessario generare nuovi incorporamenti.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

OpenAI segnala che i test mostrano che i modelli di incorporamento di terze generazioni e di grandi dimensioni offrono prestazioni medie di recupero multi-linguaggio migliori con il benchmark MIRACL . Mantengono comunque le prestazioni per le attività in inglese con il benchmark MTEB .

Benchmark di valutazione	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
MIRACL average	31.4	44.0	54.9
Media MTEB	61.0	62.3	64.6

I modelli di incorporamento di terza generazione supportano la riduzione delle dimensioni dell'incorporamento tramite un nuovo dimensions parametro. In genere, gli incorporamenti di dimensioni maggiori sono più costosi dal punto di vista di calcolo, memoria e archiviazione. Quando è possibile regolare il numero di dimensioni, si ottiene un maggiore controllo sui costi e sulle prestazioni complessivi. Il parametro dimensions non è supportato in tutte le versioni della libreria Python OpenAI 1.x. Per sfruttare i vantaggi di questo parametro, è consigliabile eseguire l'aggiornamento alla versione più recente: pip install openai --upgrade.

Il test di benchmark MTEB di OpenAI ha rilevato che anche quando le dimensioni del modello di terza generazione sono ridotte a meno delle 1.536 dimensioni di text-embeddings-ada-002, le prestazioni rimangono leggermente migliori.

Modelli di generazione di immagini

I modelli di generazione di immagini generano immagini da richieste di testo fornite dall'utente. I modelli di serie GPT-image-1 includono gpt-image-1, gpt-image-1-minie gpt-image-1.5.

Disponibilità dell'area

Modello	Regione
`gpt-image-1`	Vedere la tabella Models
`gpt-image-1-mini`	Vedere la tabella dei modelli
`gpt-image-1.5`	Vedere la tabella dei modelli
`gpt-image-2`	Vedere la tabella dei modelli

Modelli di generazione di video

Sora è un modello di intelligenza artificiale di OpenAI che può creare scene video realistiche e fantasiose dalle istruzioni di testo. Sora è in anteprima.

Disponibilità dell'area

Modello	Regione
`sora`	Vedere la tabella dei modelli
`sora-2`	Vedere la tabella dei modelli

Modelli audio

I modelli audio in Azure OpenAI sono disponibili tramite le API realtime, completions e audio.

Modelli audio GPT-4o

I modelli audio GPT-4o fanno parte della famiglia di modelli GPT-4o e supportano interazioni vocali o audio a bassa latenza.

Attenzione

Le informazioni dettagliate sul numero massimo di token di richiesta e i dati di training sono disponibili nella tabella seguente:

ID modello	Descrizione	Richiesta massima (token)	Dati di training (fino a)
`gpt-4o-mini-audio-preview` (2024-12-17) Anteprima	Modello audio per la generazione di audio e testo.	Input: 128.000 Output: 16.384	Settembre 2023
`gpt-4o-audio-preview` (2024-12-17)	Modello audio per la generazione di audio e testo.	Input: 128.000 Output: 16.384	Settembre 2023
`gpt-4o-realtime-preview` (2025-06-03)	Modello audio per l'elaborazione audio in tempo reale.	Input: 32.000 Output: 4.096	Ottobre 2023
`gpt-4o-realtime-preview` (2024-12-17)	Modello audio per l'elaborazione audio in tempo reale.	Input: 16.000 Output: 4.096	Ottobre 2023
`gpt-4o-mini-realtime-preview` (2024-12-17) Anteprima	Modello audio per l'elaborazione audio in tempo reale.	Input: 128.000 Output: 4.096	Ottobre 2023
`gpt-audio`(2025-08-28) `gpt-audio-mini`(2025-10-06)	Modello audio per la generazione di audio e testo.	Input: 128.00 Output: 16.384	Ottobre 2023
`gpt-realtime` (2025-08-28) (GA) `gpt-realtime-mini` (2025-10-06) `gpt-realtime-mini` (2025-12-15)	Modello audio per l'elaborazione audio in tempo reale.	Input: 32.00 Output: 4.096	Ottobre 2023
`gpt-audio-1.5` (2026-02-23)	Modello audio per la generazione di audio e testo.	Input: 128.00 Output: 16.384	Settembre 2024
`gpt-realtime-1.5` (2026-02-23)	Modello audio per l'elaborazione audio in tempo reale.	Input: 32.00 Output: 4.096	Settembre 2024

Per confrontare la disponibilità di modelli audio GPT-4o in tutte le aree, vedere la tabella dei modelli.

Audio API

I modelli audio tramite l'API possono essere usati per la /audio sintesi vocale, la traduzione e la sintesi vocale.

Modelli di riconoscimento vocale

ID modello	Descrizione	Richiesta massima (dimensioni file audio)
`whisper`	Modello di riconoscimento vocale generico.	25 MB
`gpt-4o-transcribe` (2025-03-20) Anteprima	Modello di riconoscimento vocale basato su GPT-4o.	25 MB
`gpt-4o-mini-transcribe` (2025-03-20) Anteprima	Modello di riconoscimento vocale basato su GPT-4o mini.	25 MB
`gpt-4o-transcribe-diarize` (2025-10-15) Anteprima	Modello di riconoscimento vocale con riconoscimento vocale automatico.	25 MB
`gpt-4o-mini-transcribe` (2025-12-15) Anteprima	Modello di riconoscimento vocale con riconoscimento vocale automatico. Miglioramento dell'accuratezza e dell'affidabilità della trascrizione.	25 MB

Modelli di traduzione vocale

ID modello	Descrizione	Richiesta massima (dimensioni file audio)
`whisper`	Modello di riconoscimento vocale generico.	25 MB

Modelli di sintesi vocale (anteprima)

ID modello	Descrizione
`tts` Anteprima	Modello di sintesi vocale ottimizzato per la velocità.
`tts-hd` Anteprima	Modello di sintesi vocale ottimizzato per la qualità.
`gpt-4o-mini-tts` (2025-03-20)	Modello di sintesi vocale basato su GPT-4o mini. È possibile guidare la voce a parlare in uno stile o un tono specifico.
`gpt-4o-mini-tts` (2025-12-15)	Modello di sintesi vocale basato su GPT-4o mini. È possibile guidare la voce a parlare in uno stile o un tono specifico.

Tabella di riepilogo dei modelli e disponibilità dell'area

Modelli per tipo di distribuzione

Azure OpenAI offre ai clienti scelte sulla struttura di hosting che si adattano ai modelli di business e di utilizzo. Il servizio offre due tipi principali di distribuzione:

Standard: dispone di un'opzione di distribuzione globale, che instrada il traffico a livello globale per offrire una velocità effettiva più elevata.
Provisioned: offre anche un'opzione di distribuzione globale che consente ai clienti di acquistare e distribuire unità elaborate con provisioning nell'infrastruttura globale Azure.

Tutte le distribuzioni possono eseguire esattamente le stesse operazioni di inferenza, ma la fatturazione, la scalabilità e le prestazioni sono sostanzialmente diverse. Per altre informazioni sui tipi di distribuzione OpenAI Azure, vedere la guida ai tipi di distribuzione Deployment.

Modello	Versione	brasilesouth	canadacentral	canadaeast	centralus	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.5	2026-04-24	-	-	-	-	-	✅	-	✅	-	-
gpt-image-2	2026-04-21	-	-	-	-	-	✅	-	-	-	✅
gpt-5.4-mini	2026-03-17	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.4-nano	2026-03-17	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.4-pro	2026-03-05	-	-	-	-	-	✅	-	✅	-	-
gpt-5.3-chat	2026-03-03	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-audio-1.5	2026-02-23	-	-	-	✅	-	✅	-	-	-	-
gpt-realtime-1.5	2026-02-23	-	✅	-	✅	-	✅	-	-	-	-
gpt-5.2-chat	2026-02-10	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2-chat	2025-12-11	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-image-1.5	2025-12-16	-	-	-	-	-	✅	-	-	-	✅
gpt-4o-mini-transcribe	2025-12-15	-	✅	-	✅	-	✅	-	-	-	-
gpt-4o-mini-transcribe	2025-03-20	-	✅	-	✅	-	✅	-	-	-	-
gpt-4o-mini-tts	2025-12-15	-	-	-	-	-	✅	-	-	-	-
gpt-4o-mini-tts	2025-03-20	-	-	-	-	-	✅	-	-	-	-
gpt-audio-mini	2025-12-15	-	-	-	✅	-	✅	-	-	-	-
gpt-audio-mini	2025-10-06	-	-	-	✅	-	✅	-	-	-	-
gpt-realtime-mini	2025-12-15	-	✅	-	✅	-	✅	-	-	-	-
gpt-realtime-mini	2025-10-06	-	✅	-	✅	-	✅	-	-	-	-
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex-max	2025-12-04	-	-	-	-	-	✅	-	-	-	-
model-router	2025-11-18	-	-	-	-	-	✅	-	-	-	-
model-router	2025-08-07	-	-	-	-	-	✅	-	-	-	-
model-router	2025-05-19	-	-	-	-	-	✅	-	-	-	-
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-chat	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex-mini	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-transcribe-diarize	2025-10-15	-	✅	-	✅	-	✅	-	-	-	-
gpt-5-pro	2025-10-06	✅	✅	✅	✅	✅	✅	✅	✅	✅	-
gpt-image-1-mini	2025-10-06	-	-	-	-	-	✅	-	-	-	✅
sora-2	2025-10-06	-	-	-	-	-	✅	-	-	-	-
gpt-5-chat	2025-10-03	✅	✅	✅	✅	✅	✅	✅	✅	✅	-
gpt-5-chat	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	✅	-
gpt-5-codex	2025-09-15	✅	✅	✅	✅	✅	✅	✅	✅	✅	-
gpt-audio	2025-08-28	-	-	-	✅	-	✅	-	-	-	-
gpt-realtime	2025-08-28	-	✅	-	✅	-	✅	-	-	-	-
gpt-5	2025-08-07	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5-nano	2025-08-07	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
o3-deep-research	2025-06-26	-	-	-	-	-	-	-	-	✅	-
o3-pro	2025-06-10	-	-	-	✅	-	✅	-	-	-	-
codex-mini	2025-05-16	-	-	-	✅	-	✅	-	-	-	-
o3	2025-04-16	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-image-1	2025-04-15	-	-	-	-	-	✅	-	-	-	✅
gpt-4.1	2025-04-14	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-trascrivere	2025-03-20	-	✅	-	✅	-	✅	-	-	-	-
computer-use-preview	2025-03-11	-	-	-	-	-	✅	-	-	-	-
o3-mini	2025-01-31	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
o1	2024-12-17	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
text-embedding-ada-002	2	✅	-	✅	-	✅	✅	✅	✅	✅	✅
text-embedding-3-large	1	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
text-embedding-3-small	1	✅	-	✅	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	brasilesouth	canadacentral	canadaeast	centralus	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.5	2026-04-24	-	-	-	-	✅	-	✅	-	-	-
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o1	2024-12-17	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	brasilesouth	canadaeast	centralus	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	centralus	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.5	2026-04-24	-	-	✅	-	✅	-	-
gpt-5.4-mini	2026-03-17	✅	✅	✅	✅	✅	✅	✅
gpt-5.4-nano	2026-03-17	✅	✅	✅	✅	✅	✅	✅
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅	✅	✅	✅	✅	✅
gpt-image-1.5	2025-12-16	-	-	✅	-	-	-	✅
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅	✅	✅
model-router	2025-11-18	-	-	✅	-	-	-	-
model-router	2025-08-07	-	-	✅	-	-	-	-
model-router	2025-05-19	-	-	✅	-	-	-	-
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅	✅	✅
gpt-5-nano	2025-08-07	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅
o1	2024-12-17	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅
text-embedding-ada-002	2	✅	✅	✅	✅	✅	✅	✅
text-embedding-3-large	1	✅	✅	✅	✅	✅	✅	✅
text-embedding-3-small	1	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.5	2026-04-24	✅	-	✅	-	-	-
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅	✅
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅
o1	2024-12-17	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅

Modello	Versione	centralus	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	brasilesouth	canadaeast	centralus	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.1	2025-11-13	-	-	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	-	-	-	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	-	-	-	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	-	✅	-	✅	✅	✅	✅	✅	✅
o1	2024-12-17	-	-	-	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	-	-	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	-	-	-	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	-	-	-	✅	✅	✅	✅	✅	✅
text-embedding-ada-002	2	✅	✅	-	✅	✅	✅	✅	✅	✅
text-embedding-ada-002	1	-	-	-	✅	-	-	✅	-	-
text-embedding-3-large	1	-	✅	-	✅	✅	-	-	-	✅
text-embedding-3-small	1	-	✅	-	✅	✅	-	-	✅	-
tts	001	-	-	-	-	-	✅	-	-	✅
tts-hd	001	-	-	-	-	-	✅	-	-	✅
Sussurro	001	-	-	-	-	✅	✅	-	-	-

Modello	Versione	brasilesouth	canadacentral	canadaeast	centralus	eastus	eastus2	northcentralus	southcentralus	westus	westus3
gpt-5.5	2026-04-24	-	-	-	-	✅	-	-	-	-	-
gpt-5.2	2025-12-11	-	-	✅	-	-	-	-	-	✅	✅
gpt-5.1	2025-11-13	-	-	✅	-	-	-	-	-	-	✅
gpt-5	2025-08-07	-	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	-	-	✅	-	-	✅	-	-	-	✅
o3	2025-04-16	-	-	-	-	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	-	-	-	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	-	-	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	-	-	-	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	-	-	-	-	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	-	-	✅	-	-	✅	-	✅	-	-
gpt-4o	2024-11-20	✅	-	✅	✅	✅	✅	✅	-	✅	✅
gpt-4o	2024-08-06	✅	-	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	-	✅	✅	✅	✅	✅	✅

Modello	Versione	francecentral	germaniawestcentral	italynorth	norvegiaeast	poloniacentral	spagnacentral	sveziacentral	svizzeranorth	svizzerawest	uksouth	westeurope
gpt-5.5	2026-04-24	-	-	-	-	✅	-	✅	-	-	-	-
gpt-image-2	2026-04-21	-	-	-	-	✅	-	✅	-	-	-	-
gpt-5.4-mini	2026-03-17	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.4-nano	2026-03-17	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.4-pro	2026-03-05	-	-	-	-	✅	-	✅	-	-	-	-
gpt-5.3-chat	2026-03-03	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-audio-1.5	2026-02-23	-	-	-	-	-	-	✅	-	-	-	-
gpt-realtime-1.5	2026-02-23	✅	-	-	-	-	-	✅	-	-	-	-
gpt-5.2-chat	2026-02-10	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2-chat	2025-12-11	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-image-1.5	2025-12-16	-	-	-	-	✅	-	✅	-	-	-	-
gpt-4o-mini-transcribe	2025-12-15	✅	-	-	-	-	-	✅	-	-	-	-
gpt-4o-mini-transcribe	2025-03-20	✅	-	-	-	-	-	✅	-	-	-	-
gpt-audio-mini	2025-12-15	-	-	-	-	-	-	✅	-	-	-	-
gpt-audio-mini	2025-10-06	-	-	-	-	-	-	✅	-	-	-	-
gpt-realtime-mini	2025-12-15	✅	-	-	-	-	-	✅	-	-	-	-
gpt-realtime-mini	2025-10-06	✅	-	-	-	-	-	✅	-	-	-	-
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex-max	2025-12-04	-	-	-	-	-	-	✅	-	-	-	-
model-router	2025-11-18	-	-	-	-	-	-	✅	-	-	-	-
model-router	2025-08-07	-	-	-	-	-	-	✅	-	-	-	-
model-router	2025-05-19	-	-	-	-	-	-	✅	-	-	-	-
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-chat	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex-mini	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-transcribe-diarize	2025-10-15	✅	-	-	-	-	-	✅	-	-	-	-
gpt-5-pro	2025-10-06	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-image-1-mini	2025-10-06	-	-	-	-	✅	-	✅	-	-	-	-
sora-2	2025-10-06	-	-	-	-	-	-	✅	-	-	-	-
gpt-5-chat	2025-10-03	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5-chat	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5-codex	2025-09-15	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-audio	2025-08-28	-	-	-	-	-	-	✅	-	-	-	-
gpt-realtime	2025-08-28	✅	-	-	-	-	-	✅	-	-	-	-
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-5-nano	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
o3-deep-research	2025-06-26	-	-	-	✅	-	-	-	-	-	-	-
o3-pro	2025-06-10	-	-	-	-	-	-	✅	-	-	-	-
codex-mini	2025-05-16	-	-	-	-	-	-	✅	-	-	-	-
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-image-1	2025-04-15	-	-	-	-	✅	-	✅	-	-	-	-
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-4o-trascrivere	2025-03-20	✅	-	-	-	-	-	✅	-	-	-	-
computer-use-preview	2025-03-11	-	-	-	-	-	-	✅	-	-	-	-
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
o1	2024-12-17	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
gpt-4o	2024-08-06	✅	✅	-	✅	✅	✅	✅	✅	-	✅	✅
gpt-4o	2024-05-13	✅	✅	-	✅	✅	✅	✅	✅	-	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
text-embedding-ada-002	2	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
text-embedding-3-large	1	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅
text-embedding-3-small	1	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅

Modello	Versione	francecentral	germaniawestcentral	italynorth	norvegiaeast	poloniacentral	spagnacentral	sveziacentral	svizzeranorth	svizzerawest	uksouth	westeurope
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
o1	2024-12-17	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	francecentral	germaniawestcentral	norvegiaeast	poloniacentral	sveziacentral	svizzeranorth	uksouth	westeurope
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	francecentral	germaniawestcentral	italynorth	poloniacentral	spagnacentral	sveziacentral	westeurope
gpt-5.5	2026-04-24	-	-	-	✅	-	✅	-
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅	✅
gpt-image-1.5	2025-12-16	-	-	-	✅	-	✅	-
model-router	2025-11-18	-	-	-	-	-	✅	-
model-router	2025-08-07	-	-	-	-	-	✅	-
model-router	2025-05-19	-	-	-	-	-	✅	-
gpt-5.1	2025-11-13	✅	-	-	-	-	✅	-
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅	✅	✅
gpt-5-nano	2025-08-07	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅	✅	✅
o1	2024-12-17	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	-	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	-	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅	✅	✅
text-embedding-ada-002	2	✅	✅	✅	✅	✅	✅	✅
text-embedding-3-large	1	✅	✅	✅	✅	✅	✅	✅
text-embedding-3-small	1	✅	✅	✅	✅	✅	✅	✅

Modello	Versione	francecentral	germaniawestcentral	italynorth	poloniacentral	spagnacentral	sveziacentral	westeurope
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅	✅	✅
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅	✅	✅
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	-	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	-	✅	✅	✅	✅
o1	2024-12-17	✅	✅	-	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	-	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	-	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	-	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	-	✅	✅	✅	✅

Modello	Versione	francecentral	germaniawestcentral	poloniacentral	sveziacentral	westeurope
o3	2025-04-16	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅

Modello	Versione	francecentral	germaniawestcentral	norvegiaeast	poloniacentral	spagnacentral	sveziacentral	svizzeranorth	uksouth	westeurope
gpt-5.1	2025-11-13	-	-	-	-	-	✅	-	-	-
o4-mini	2025-04-16	-	-	-	-	-	✅	-	-	-
gpt-4.1	2025-04-14	-	-	-	-	-	✅	✅	-	-
gpt-4.1-mini	2025-04-14	✅	-	-	-	-	✅	✅	✅	✅
o1	2024-12-17	-	-	-	-	-	✅	-	-	-
gpt-4o	2024-11-20	✅	-	✅	-	-	✅	✅	✅	-
gpt-4o	2024-08-06	-	-	-	-	-	✅	-	-	-
gpt-4o	2024-05-13	-	-	-	-	-	✅	-	-	-
gpt-4o-mini	2024-07-18	-	-	-	-	-	✅	-	-	-
text-embedding-ada-002	2	✅	-	✅	-	-	✅	✅	✅	✅
text-embedding-3-large	1	✅	✅	✅	✅	✅	✅	✅	✅	-
text-embedding-3-small	1	-	-	-	-	-	-	✅	-	-
tts	001	-	-	-	-	-	✅	-	-	-
tts-hd	001	-	-	-	-	-	✅	-	-	-
Sussurro	001	-	-	✅	-	-	✅	✅	-	✅

Modello	Versione	francecentral	germaniawestcentral	norvegiaeast	poloniacentral	spagnacentral	sveziacentral	svizzeranorth	svizzerawest	uksouth	westeurope
gpt-5.2	2025-12-11	-	-	-	-	-	-	-	-	✅	-
gpt-5.1	2025-11-13	-	-	-	-	-	-	✅	-	✅	-
gpt-5	2025-08-07	-	-	-	-	-	-	-	-	✅	-
gpt-5-mini	2025-08-07	-	-	-	-	-	-	-	-	✅	-
o3	2025-04-16	-	-	-	-	-	-	-	-	-	✅
o4-mini	2025-04-16	-	-	-	-	-	-	-	-	-	✅
gpt-4.1	2025-04-14	-	✅	-	-	-	✅	✅	-	✅	-
gpt-4.1-mini	2025-04-14	-	-	-	-	-	✅	✅	-	✅	-
gpt-4.1-nano	2025-04-14	-	-	-	-	-	✅	-	-	-	-
o3-mini	2025-01-31	-	-	-	-	-	✅	✅	-	-	-
o1	2024-12-17	-	-	-	-	-	-	-	-	✅	-
gpt-4o	2024-11-20	-	✅	-	✅	-	✅	✅	-	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	-	✅	✅	✅	✅	✅	-
gpt-4o	2024-05-13	✅	✅	✅	✅	✅	✅	✅	-	✅	-
gpt-4o-mini	2024-07-18	✅	-	✅	-	✅	✅	✅	✅	✅	-

Modello	Versione	australiaeast	japaneast	koreacentral	sudestasia	southindia
gpt-5.4-mini	2026-03-17	✅	✅	✅	✅	✅
gpt-5.4-nano	2026-03-17	✅	✅	✅	✅	✅
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅
gpt-5.3-chat	2026-03-03	✅	✅	✅	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅	✅	✅	✅
gpt-realtime-1.5	2026-02-23	-	-	-	-	✅
gpt-5.2-chat	2026-02-10	✅	✅	✅	✅	✅
gpt-5.2-chat	2025-12-11	✅	✅	✅	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅	✅	✅	✅
gpt-4o-mini-transcribe	2025-12-15	-	-	-	-	✅
gpt-4o-mini-transcribe	2025-03-20	-	-	-	-	✅
gpt-realtime-mini	2025-12-15	-	-	-	-	✅
gpt-realtime-mini	2025-10-06	-	-	-	-	✅
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅
gpt-5.1-chat	2025-11-13	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅
gpt-5.1-codex-mini	2025-11-13	✅	✅	✅	✅	✅
gpt-4o-transcribe-diarize	2025-10-15	-	-	-	-	✅
gpt-5-pro	2025-10-06	✅	✅	✅	✅	✅
gpt-5-chat	2025-10-03	✅	✅	✅	✅	✅
gpt-5-chat	2025-08-07	✅	✅	✅	✅	✅
gpt-5-codex	2025-09-15	✅	✅	✅	✅	✅
gpt-realtime	2025-08-28	-	-	-	-	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅
gpt-5-nano	2025-08-07	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅
gpt-4o-trascrivere	2025-03-20	-	-	-	-	✅
computer-use-preview	2025-03-11	-	-	-	-	✅
computer-use-preview	2025-02-11	-	-	-	-	✅
o3-mini	2025-01-31	✅	✅	✅	-	✅
o1	2024-12-17	✅	✅	✅	-	✅
gpt-4o	2024-11-20	✅	✅	✅	-	✅
gpt-4o	2024-08-06	✅	✅	✅	-	✅
gpt-4o	2024-05-13	✅	✅	✅	-	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	-	✅
text-embedding-ada-002	2	✅	✅	✅	-	✅
text-embedding-3-large	1	✅	✅	✅	-	✅
text-embedding-3-small	1	✅	✅	✅	-	✅

Modello	Versione	australiaeast	japaneast	koreacentral	sudestasia	southindia
gpt-5.4	2026-03-05	✅	✅	✅	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅	✅	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅	✅	✅	✅
gpt-5.2	2025-12-11	✅	✅	✅	✅	✅
gpt-5.1	2025-11-13	✅	✅	✅	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅	✅
gpt-5-mini	2025-08-07	✅	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅	✅
o1	2024-12-17	✅	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅

Modello	Versione	australiaeast	japaneast	koreacentral	southindia
gpt-5.1	2025-11-13	✅	✅	✅	✅
gpt-5	2025-08-07	✅	✅	✅	✅
o3	2025-04-16	✅	✅	✅	✅
o4-mini	2025-04-16	✅	✅	✅	✅
gpt-4.1	2025-04-14	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅	✅	✅
o3-mini	2025-01-31	✅	✅	✅	✅
gpt-4o	2024-11-20	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅

Modello	Versione	australiaeast	japaneast	koreacentral	sudestasia	southindia
gpt-4.1-mini	2025-04-14	✅	✅	-	-	✅
gpt-4o	2024-11-20	✅	✅	-	-	✅
text-embedding-ada-002	2	✅	✅	-	-	✅
text-embedding-3-large	1	✅	✅	✅	✅	✅
text-embedding-3-small	1	✅	✅	-	-	-
Sussurro	001	-	-	-	-	✅

Modello	Versione	australiaeast	japaneast	koreacentral	sudestasia	southindia
gpt-5.4	2026-03-05	✅	✅	-	-	-
gpt-5.2	2025-12-11	✅	✅	✅	-	-
gpt-5.1	2025-11-13	✅	-	-	-	✅
gpt-5	2025-08-07	✅	✅	✅	-	✅
gpt-5-mini	2025-08-07	✅	✅	✅	-	✅
o3	2025-04-16	✅	-	-	-	-
o4-mini	2025-04-16	-	✅	-	-	-
gpt-4.1	2025-04-14	✅	✅	✅	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅	✅	-	✅
o3-mini	2025-01-31	✅	✅	✅	-	✅
o1	2024-12-17	-	✅	-	-	-
gpt-4o	2024-11-20	✅	✅	✅	✅	✅
gpt-4o	2024-08-06	✅	✅	✅	✅	✅
gpt-4o	2024-05-13	✅	✅	✅	-	✅
gpt-4o-mini	2024-07-18	✅	✅	✅	✅	✅

Modello	Versione	southafricanorth	uaenorth
gpt-image-2	2026-04-21	-	✅
gpt-5.4-mini	2026-03-17	✅	✅
gpt-5.4-nano	2026-03-17	✅	✅
gpt-5.4	2026-03-05	✅	✅
gpt-5.3-chat	2026-03-03	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅
gpt-5.2-chat	2026-02-10	✅	✅
gpt-5.2-chat	2025-12-11	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅
gpt-image-1.5	2025-12-16	-	✅
gpt-5.2	2025-12-11	✅	✅
gpt-5.1	2025-11-13	✅	✅
gpt-5.1-chat	2025-11-13	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅
gpt-5.1-codex-mini	2025-11-13	✅	✅
gpt-5-pro	2025-10-06	✅	✅
gpt-image-1-mini	2025-10-06	-	✅
gpt-5-chat	2025-10-03	✅	✅
gpt-5-chat	2025-08-07	✅	✅
gpt-5-codex	2025-09-15	✅	✅
gpt-5	2025-08-07	✅	✅
gpt-5-mini	2025-08-07	✅	✅
gpt-5-nano	2025-08-07	✅	✅
o3	2025-04-16	✅	✅
o4-mini	2025-04-16	✅	✅
gpt-image-1	2025-04-15	-	✅
gpt-4.1	2025-04-14	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅
o3-mini	2025-01-31	✅	✅
o1	2024-12-17	✅	✅
gpt-4o	2024-11-20	✅	✅
gpt-4o	2024-08-06	✅	✅
gpt-4o	2024-05-13	✅	✅
gpt-4o-mini	2024-07-18	✅	✅
text-embedding-ada-002	2	✅	✅
text-embedding-3-large	1	✅	✅
text-embedding-3-small	1	✅	✅

Modello	Versione	southafricanorth	uaenorth
gpt-5.4	2026-03-05	✅	✅
gpt-5.3-codex	2026-02-24	✅	✅
gpt-5.2-codex	2026-01-14	✅	✅
gpt-5.2	2025-12-11	✅	✅
gpt-5.1	2025-11-13	✅	✅
gpt-5.1-codex	2025-11-13	✅	✅
gpt-5	2025-08-07	✅	✅
gpt-5-mini	2025-08-07	✅	✅
o3	2025-04-16	✅	✅
o4-mini	2025-04-16	✅	✅
gpt-4.1	2025-04-14	✅	✅
gpt-4.1-mini	2025-04-14	✅	✅
gpt-4.1-nano	2025-04-14	✅	✅
o3-mini	2025-01-31	✅	✅
o1	2024-12-17	✅	✅
gpt-4o	2024-11-20	✅	✅
gpt-4o	2024-08-06	✅	✅
gpt-4o	2024-05-13	✅	✅
gpt-4o-mini	2024-07-18	✅	✅

Modello	Versione	southafricanorth
gpt-5.1	2025-11-13	✅
gpt-5	2025-08-07	✅
o3	2025-04-16	✅
o4-mini	2025-04-16	✅
gpt-4.1	2025-04-14	✅
gpt-4.1-mini	2025-04-14	✅
gpt-4.1-nano	2025-04-14	✅
o3-mini	2025-01-31	✅
gpt-4o	2024-11-20	✅
gpt-4o	2024-08-06	✅
gpt-4o	2024-05-13	✅
gpt-4o-mini	2024-07-18	✅

Modello	Versione	southafricanorth	uaenorth
text-embedding-ada-002	2	✅	✅
text-embedding-3-large	1	✅	✅
text-embedding-3-small	1	-	✅
Sussurro	001	-	✅

Modello	Versione	southafricanorth	uaenorth
gpt-5.1	2025-11-13	-	✅
gpt-4.1	2025-04-14	-	✅
o3-mini	2025-01-31	-	✅
o1	2024-12-17	-	✅
gpt-4o	2024-11-20	-	✅
gpt-4o	2024-08-06	-	✅
gpt-4o	2024-05-13	✅	✅

Nota

o3-deep-research è attualmente disponibile solo con il servizio agente Foundry. Per altre informazioni, vedere le linee guida per lo strumento Deep Research.
o1-mini è attualmente disponibile per tutti i clienti per la distribuzione Standard globale. Ai clienti selezionati è stato concesso l'accesso alla distribuzione standard (a livello di o1-mini area) come parte del o1-preview rilascio con accesso limitato. Al momento, l'accesso alle o1-mini distribuzioni standard (a livello di area) non viene espanso.
La versione di cui turbo-2024-04-09 è stato effettuato il provisioning è gpt-4 attualmente limitata solo al testo. Per altre informazioni sulle distribuzioni con provisioning, vedere Indicazioni sul provisioning.

Questa tabella non include informazioni sulla disponibilità a livello di area. Per queste informazioni, vedere la sezione relativa all'ottimizzazione .

Incorporamento di modelli

Questi modelli possono essere usati solo con le richieste API di incorporamento.

Nota

text-embedding-3-large è il modello di incorporamento più recente e più idoneo. Non è possibile eseguire l'aggiornamento tra modelli di incorporamento. Per eseguire la migrazione dall'uso text-embedding-ada-002 a text-embedding-3-large, è necessario generare nuovi incorporamenti.

ID modello	Richiesta massima (token)	Dimensioni di output	Dati di training (fino a)
`text-embedding-ada-002` (versione 2)	8,192	1,536	Settembre 2021
`text-embedding-ada-002` (versione 1)	2,046	1,536	Settembre 2021
`text-embedding-3-large`	8,192	3,072	Settembre 2021
`text-embedding-3-small`	8,192	1,536	Settembre 2021

Nota

Quando si invia una matrice di input per l'incorporamento, il numero massimo di elementi di input nella matrice per chiamata all'endpoint di incorporamento è 2.048.

Modelli di generazione di immagini

ID modello	Richiesta massima (caratteri)
`gpt-image-1`	4,000
`gpt-image-1-mini`	4,000
`gpt-image-1.5`	4,000

Modelli di generazione di video

ID modello	Max Request (caratteri)
Sora	4,000

Ottimizzazione dei modelli

Per l'ottimizzazione sono supportati i modelli seguenti:

ID modello	Aree standard	Globale	Sviluppatore	Metodi	Stato	Modalità
`gpt-4o-mini` (2024-07-18)	Stati Uniti centro-settentrionali Svezia centrale	✅	✅	SFT	GA	Testo in testo
`gpt-4o` (2024-08-06)	Stati Uniti orientali 2 Stati Uniti centro-settentrionali Svezia centrale	✅	✅	SFT, DPO	GA	Testo e visione del testo
`gpt-4.1` (2025-04-14)	Stati Uniti centro-settentrionali Svezia centrale	✅	✅	SFT, DPO	GA	Testo e visione del testo
`gpt-4.1-mini` (2025-04-14)	Stati Uniti centro-settentrionali Svezia centrale	✅	✅	SFT, DPO	GA	Testo in testo
`gpt-4.1-nano` (2025-04-14)	Stati Uniti centro-settentrionali Svezia centrale	✅	✅	SFT, DPO	GA	Testo in testo
`o4-mini` (2025-04-16)	Stati Uniti orientali 2 Svezia centrale	✅	❌	RFT	GA	Testo in testo
`gpt-5` (2025-08-07)	Stati Uniti centro-settentrionali Svezia centrale	✅	✅	RFT	Anteprima privata	Testo in testo
`Ministral-3B` (2411)	Non supportato	✅	❌	SFT	Anteprima pubblica	Testo in testo
`Qwen-32B`	Non supportato	✅	❌	SFT	Anteprima pubblica	Testo in testo
`Llama-3.3-70B-Instruct`	Non supportato	✅	❌	SFT	Anteprima pubblica	Testo in testo
`gpt-oss-20b`	Non supportato	✅	❌	SFT	Anteprima pubblica	Testo in testo

In alternativa, è possibile ottimizzare un modello ottimizzato in precedenza, formattato come base-model.ft-{jobid}.

Nota

I modelli open source (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) sono supportati solo nelle risorse Foundry e nella nuova interfaccia utente di Foundry.

Nota

Il training globale offre un training più conveniente per token, ma non offre la residenza dei dati. Attualmente è disponibile per le risorse Foundry nelle aree seguenti:

Australia orientale
Brasile meridionale
Canada centrale
Canada orientale
Stati Uniti orientali
Stati Uniti orientali 2
Francia centrale
Germania centro-occidentale
Italia settentrionale
Giappone orientale (nessun supporto per la visione)
Corea centrale
Stati Uniti centro-settentrionali
Norvegia orientale
Polonia centrale (nessun supporto di 4,1 nano)
Asia sud-orientale
Sudafrica settentrionale
Stati Uniti centro-meridionali
India meridionale
Spagna centrale
Svezia centrale
Svizzera occidentale
Svizzera settentrionale
Regno Unito meridionale
Europa occidentale
Stati Uniti occidentali
Stati Uniti occidentali3

Assistenti (anteprima)

Per gli assistenti, è necessaria una combinazione di un modello supportato e di un'area supportata. Alcuni strumenti e funzionalità richiedono i modelli più recenti. I modelli seguenti sono disponibili nell'API Assistants, nell'SDK e in Foundry. La tabella seguente è relativa alla distribuzione standard. Per informazioni sulla disponibilità delle unità elaborate con provisioning, vedere Provisioning della velocità effettiva. I modelli e le aree elencati possono essere usati con assistenti v1 e v2. È possibile usare i modelli Standard globali se sono supportati nelle aree seguenti.

Regione	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
francecentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	✅	✅
norvegiaeast	-	-	-	-	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	✅	-	-	-	-	✅	✅	-
sveziacentral	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
uksouth	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

Ritiro del modello

Per le informazioni più recenti sui ritiri dei modelli, vedere la guida al ritiro del modello.

Modelli Black Forest Labs venduti direttamente da Azure

I modelli FLUX (Black Forest Labs) portano la generazione di immagini all'avanguardia in Microsoft Foundry, consentendo di generare e modificare immagini di alta qualità da richieste di testo e immagini di riferimento. I modelli FLUX supportano una gamma di funzionalità, tra cui la generazione da testo a immagine, la modifica di immagini a più riferimenti e la generazione e la modifica nel contesto.

È possibile eseguire questi modelli tramite l'API del provider di servizi BFL e tramite gli endpoint images/generations e images/edits.

Per usare i modelli FLUX in Foundry, vedere Deploy e usare modelli FLUX in Microsoft Foundry.

La registrazione è necessaria per l'accesso a FLUX.2 [flex] (anteprima).

Modello	Tipo e endpoint API	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`FLUX.2-flex` Anteprima	Generazione di immagini - API del provider di servizi BFL: `<resource-name>/providers/blackforestlabs/v1/flux-2-flex`	- Input: testo e immagine (32.000 token e fino a 10 immaginiⁱ) - Output: Un'immagine - Chiamata di strumenti: No - Formati di risposta: Immagine (PNG e JPG) - Funzionalità principali: Controllo granulare; supporto multi-riferimento per un massimo di 10 immagini - Parametri aggiuntivi: `guidance`: controlla il modo in cui l'output segue il prompt. Minimo: 1,5, massimo: 10, valore predefinito: 4,5. Più alto = maggiore conformità alla richiesta. `steps`: numero di passaggi di inferenza. Massimo: 50, valore predefinito: 50. Più alto = più dettagli, più lento.	- Standard globale (tutte le aree)
`FLUX.2-pro` Anteprima	Generazione di immagini - API del provider di servizi BFL: `<resource-name>/providers/blackforestlabs/v1/flux-2-pro`	- Input: testo e immagine (32.000 token e fino a 8 immaginiⁱⁱ) - Output: Un'immagine - Chiamata di strumenti: No - Formati di risposta: Immagine (PNG e JPG) - Funzionalità principali: Supporto multi-riferimento per un massimo di 8 immagini; più a terra nella conoscenza reale; maggiore flessibilità di output; prestazioni migliorate - Parametri aggiuntivi:(Solo API specifica del provider) Supporta tutti i parametri.	- Standard globale (tutte le aree)
`FLUX.1-Kontext-pro` Anteprima	Generazione di immagini - API immagine: `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` E `https://<resource-name>/openai/deployments/{deployment-id}/images/edits` - API del provider di servizi BFL: `<resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview`	- Input: testo e immagine (5.000 token e 1 immagine) - Output: Un'immagine - Chiamata di strumenti: No - Formati di risposta: Immagine (PNG e JPG) - Funzionalità principali: Coerenza dei caratteri, modifica avanzata - Parametri aggiuntivi:(Solo API specifica del provider)`seed`, `aspect ratio`, `input_image`, `prompt_unsampling`, `safety_toleranceoutput_format`	- Standard globale (tutte le aree)
`FLUX-1.1-pro` Anteprima	Generazione di immagini - API immagine: `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` - API del provider di servizi BFL: `<resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview`	- Input: testo (5.000 token e 1 immagine) - Output: Un'immagine - Chiamata di strumenti: No - Formati di risposta: Immagine (PNG e JPG) - Funzionalità principali: Velocità di inferenza rapida, forte conformità alla richiesta, prezzi competitivi, generazione scalabile - Parametri aggiuntivi:(Solo API specifica del provider)`width`, `height`, `prompt_unsampling`, `seed`, `safety_toleranceoutput_format`	- Standard globale (tutte le aree)

^i,ii Il supporto per più immagini di riferimento è disponibile per FLUX.2 [pro] (Anteprima) e FLUX.2 [flex] (anteprima) usando l'API, ma non nel playground.

Modelli Cohere venduti direttamente da Azure

La famiglia cohere di modelli include vari modelli ottimizzati per diversi casi d'uso, tra cui completamenti di chat, classificazione rerank/text e incorporamenti. I modelli Cohere sono ottimizzati per vari casi d'uso che includono ragionamento, riepilogo e risposte alle domande.

Modello	Digitare	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`Cohere-rerank-v4.0-pro`	classificazione del testo (rerank)	- Input: testo - Output: testo - Languages:`en`, `fr`, `es`, `it`, `dept-br`, `ja`, `zh-cn`, `ar`, `ruvihiid`, e`nl` - Chiamata di strumenti: No - Formati di risposta: JSON	- Standard globale (tutte le aree) - Calcolo gestito
`Cohere-rerank-v4.0-fast`	classificazione del testo (rerank)	- Input: testo - Output: testo - Languages:`en`, `fr`, `es`, `it`, `dept-br`, `ja`, `zh-cn`, `ar`, `ruvihiid`, e`nl` - Chiamata di strumenti: No - Formati di risposta: JSON	- Standard globale (tutte le aree) - Calcolo gestito
`Cohere-command-a`	completamento chat	- Input: testo (131.072 token) - Output: testo (8.182 token) - Languages:`en`, `fr`, `esit`, , `dept-br`, `ja`, , `ko`, `zh-cn`e`ar` - Chiamata di strumenti: Sì - Formati di risposta: Testo, JSON	- Standard globale (tutte le aree)
`embed-v-4-0`	incorporamenti	- Input: testo (512 token) e immagini (2MM pixel) - Output: Vettore (256, 512, 1024, 1536 dim.) - Languages:`en`, `fr`, `esit`, , `dept-br`, `ja`, , `ko`, `zh-cn`e`ar`	- Standard globale (tutte le aree)

Modelli DeepSeek venduti direttamente da Azure

La famiglia di modelli DeepSeek include diversi modelli di ragionamento, che eccelleno nelle attività di ragionamento usando un processo di training dettagliato, ad esempio linguaggio, ragionamento scientifico e attività di codifica.

Modello	Digitare	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`DeepSeek-V3.2-Speciale` Anteprima	completamento chat (con contenuto ragionamento)	- Input: testo (128.000 token) - Output: testo (128.000 token) - Lingue:`en` E `zh` - Chiamata di strumenti: No - Formati di risposta: Testo, JSON	- Standard globale (tutte le aree)
`DeepSeek-V3.2` Anteprima	completamento chat (con contenuto ragionamento)	- Input: testo (128.000 token) - Output: testo (128.000 token) - Lingue:`en` E `zh` - Chiamata di strumenti: No - Formati di risposta: Testo, JSON	- Standard globale (tutte le aree)
`DeepSeek-V3.1` Anteprima	completamento chat (con contenuto ragionamento)	- Input: testo (131.072 token) - Output: testo (131.072 token) - Lingue:`en` E `zh` - Chiamata di strumenti: Sì - Formati di risposta: Testo, JSON	- Standard globale (tutte le aree)
`DeepSeek-R1-0528` Anteprima	completamento chat (con contenuto ragionamento)	- Input: testo (163.840 token) - Output: testo (163.840 token) - Lingue:`en` E `zh` - Chiamata di strumenti: No - Formati di risposta: Testo	- Standard globale (tutte le aree) - Provisioning globale (tutte le aree)
`DeepSeek-V3-0324` Anteprima	completamento chat	- Input: testo (131.072 token) - Output: testo (131.072 token) - Lingue:`en` E `zh` - Chiamata di strumenti: Sì - Formati di risposta: Testo, JSON	- Standard globale (tutte le aree) - Provisioning globale (tutte le aree)
`DeepSeek-R1`	completamento chat (con contenuto ragionamento)	- Input: testo (163.840 token) - Output: testo (163.840 token) - Lingue:`en` E `zh` - Chiamata di strumenti: No - Formati di risposta: Testo	- Standard globale (tutte le aree) - Provisioning globale (tutte le aree)

Meta modelli venduti direttamente da Azure

I modelli e gli strumenti meta Llama sono una raccolta di modelli di intelligenza artificiale generativi pre-sottoposti a training e ottimizzati per i modelli di ragionamento delle immagini. Intervallo di modelli meta in scala da includere:

Modelli di linguaggio (SLM) di piccole dimensioni, ad esempio 1B e base 3B e istruire i modelli per l'inferenza di dispositivi e dispositivi perimetrali
Modelli di linguaggio di medie dimensioni (LLMs) come 7B, 8B e 70B Base e 70B
Modelli ad alte prestazioni come Meta Llama 3.1-405B Indica per la generazione di dati sintetici e i casi d'uso della duplicazione.

Modello	Digitare	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`Llama-4-Maverick-17B-128E-Instruct-FP8` Anteprima	completamento chat	- Input: testo e immagini (token 1M) - Output: testo (token 1M) - Languages:`ar`, `en`, `frde`, `hi`, `id`, `it`, `pt`, , `estl`, `th`, , e`vi` - Chiamata di strumenti: No - Formati di risposta: Testo	- Standard globale (tutte le aree)
`Llama-3.3-70B-Instruct` Anteprima	completamento chat	- Input: testo (128.000 token) - Output: testo (8.192 token) - Languages:`en`, `de`, `fr`, `itpt`, `hi`, , `es`, e`th` - Chiamata di strumenti: No - Formati di risposta: Testo	- Standard globale (tutte le aree) - Provisioning globale (tutte le aree)

Diversi modelli Meta sono disponibili anche da partner e community.

Microsoft modelli venduti direttamente da Azure

Microsoft modelli includono vari gruppi di modelli, ad esempio Router modello, modelli MAI, modelli Phi, modelli di intelligenza artificiale sanitaria e altro ancora. Sono disponibili anche diversi modelli Microsoft da partner e community.

Per usare MAI-Image-2e e MAI-Image-2 modelli di generazione da testo a immagine in Foundry, vedere Deploy e usare i modelli MAI in Microsoft Foundry.

Modello	Digitare	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`MAI-Image-2e` Anteprima	Da testo a immagine. Per informazioni dettagliate, vedere Endpoint API .	- Input: testo - Output: Un'immagine - Lunghezza del contesto: 32.000 token - Chiamata di strumenti: No - Formati di risposta: Immagine (PNG) - Lingue:`en` - Funzionalità principali: Generazione di testo a immagine di alta qualità; sintesi fotorealistica delle immagini con struttura visiva coerente; ideale per immagini di prodotto, oggetti visivi di marketing, asset del marchio e flussi di lavoro creativi commerciali. - Parameters:`width`, `height`, `prompt` Minimo 768×768 pixel; numero massimo di pixel totali 1.048.576 (equivalente a 1024×1024). Entrambe le dimensioni possono superare 1024 purché il numero totale di pixel rimanga entro il limite (ad esempio, 768×1365).	- Standard globale (Stati Uniti centro-occidentali, Stati Uniti orientali, Stati Uniti occidentali, Europa occidentale, Svezia centrale, India meridionale)
`MAI-Image-2` Anteprima	Da testo a immagine. Per informazioni dettagliate, vedere Endpoint API .	- Input: testo - Output: Un'immagine - Lunghezza del contesto: 32.000 token - Chiamata di strumenti: No - Formati di risposta: Immagine (PNG) - Lingue:`en` - Funzionalità principali: Generazione di testo a immagine di alta qualità; sintesi fotorealistica delle immagini con struttura visiva coerente; ideale per immagini di prodotto, oggetti visivi di marketing, asset del marchio e flussi di lavoro creativi commerciali. - Parameters:`width`, `height`, `prompt` Minimo 768×768 pixel; numero massimo di pixel totali 1.048.576 (equivalente a 1024×1024). Entrambe le dimensioni possono superare 1024 purché il numero totale di pixel rimanga entro il limite (ad esempio, 768×1365).	- Standard globale (Stati Uniti centro-occidentali, Stati Uniti orientali, Stati Uniti occidentali, Europa occidentale, Svezia centrale, India meridionale)
`model-router` ¹	completamento chat	Per altre informazioni, vedere Panoramica del router del modello. - Input: testo, immagine - Output: testo (numero massimo di token di output²) Finestra di contesto: 200.000³ - Lingue:`en`	- Standard globale (Stati Uniti orientali 2, Svezia centrale) - Zona dati standard⁴ (Stati Uniti orientali 2, Svezia centrale)

¹Versione del router del modello2025-11-18. Sono disponibili anche versioni precedenti (2025-08-07 e 2025-05-19).

²Il numero massimo di token di output varia per i modelli sottostanti nel router del modello. Ad esempio, 32.768 (GPT-4.1 series), 100.000 (o4-mini), 128.000 (gpt-5 reasoning models) e 16.384 (gpt-5-chat).

^{3 Le}finestre di contesto più grandi sono compatibili con alcuni dei modelli sottostanti del router del modello. Ciò significa che una chiamata API con un contesto più ampio ha esito positivo solo se il prompt viene indirizzato a uno di questi modelli. In caso contrario, la chiamata ha esito negativo.

⁴ La fatturazione per le distribuzioni di router del router del modello Standard della zona dati non inizia prima del 1° novembre 2025.

Modelli misti venduti direttamente da Azure

Modello	Digitare	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`mistral-document-ai-2512`	Da immagine a testo	- Input: immagini o pagine PDF (30 pagine, massimo 30 MB di file PDF) - Output: testo - Lingue:`en` - Chiamata di strumenti: no - Formati di risposta: Text, JSON, Markdown	- Standard globale (tutte le aree) - Standard della zona dati (Stati Uniti e UE)
`mistral-document-ai-2505` Anteprima	Da immagine a testo	- Input: immagini o pagine PDF (30 pagine, massimo 30 MB di file PDF) - Output: testo - Lingue:`en` - Chiamata di strumenti: no - Formati di risposta: Text, JSON, Markdown	- Standard globale (tutte le aree) - Standard della zona dati (Stati Uniti e UE)
`Mistral-Large-3` Anteprima	completamento chat	- Input: testo, immagine - Output: testo - Languages:`en`, `fr`, `dees`, `it`, `pt`, `nl`, , `zh`, `ja`, `ko`, e`ar` - Chiamata di strumenti: Sì - Formati di risposta: Testo, JSON	- Standard globale (tutte le aree) - Standard della zona dati (Stati Uniti e UE)

Diversi modelli Mistral sono disponibili anche da partner e community.

Modelli di Intelligenza artificiale Moonshot venduti direttamente da Azure

I modelli di intelligenza artificiale Moonshot includono Kimi K2.5 (anteprima), un modello di ragionamento multifunzionale che accetta input di testo e immagine.

Modello	Digitare	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`Kimi-K2.5` Anteprima	completamento chat (con contenuto ragionamento)	- Input: testo e immagine (262.144 token) - Output: testo (262.144 token) - Lingue:`en` E `zh` - Chiamata di strumenti: Sì - Formati di risposta: Testo	- Standard globale (tutte le aree)

Vedere questa raccolta di modelli nel portale foundry.

Modelli xAI venduti direttamente da Azure

I modelli Grok di xAI in Foundry Models includono un set diversificato di modelli di ragionamento e non ragionamento progettati per casi d'uso aziendali, ad esempio estrazione dei dati, codifica, riepilogo del testo e applicazioni agentiche.

La registrazione è necessaria per l'accesso agrok-code-fast-1 (Anteprima) e grok-4.

Modello	Digitare	Funzionalità	Tipo di distribuzione (disponibilità dell'area)
`grok-4-20-reasoning` Anteprima	completamento chat	- Input: testo (262.000 token) - Output: testo (8.192 token) - Lingue:`en` - Chiamata di strumenti: sì - Formati di risposta: testo	- Standard globale (tutte le aree)
`grok-4-20-non-reasoning` Anteprima	completamento chat	- Input: testo (262.000 token) - Output: testo (8.192 token) - Lingue:`en` - Chiamata di strumenti: sì - Formati di risposta: testo	- Standard globale (tutte le aree)
`grok-4.1-fast-reasoning` Anteprima	completamento chat	- Input: text, image (128.000 token) - Output: testo (128.000 token) - Lingue:`en` - Chiamata di strumenti: sì - Formati di risposta: testo	- Standard globale (tutte le aree)
`grok-4.1-fast-non-reasoning` Anteprima	completamento chat	- Input: text, image (128.000 token) - Output: testo (128.000 token) - Lingue:`en` - Chiamata di strumenti: sì - Formati di risposta: testo	- Standard globale (tutte le aree)
`grok-4`	completamento chat	- Input: testo (262.000 token) - Output: testo (8.192 token) - Lingue:`en` - Chiamata di strumenti: sì - Formati di risposta: testo	- Standard globale (tutte le aree)
`grok-code-fast-1` Anteprima	completamento chat	- Input: testo (256.000 token) - Output: testo (8.192 token) - Lingue:`en` - Chiamata di strumenti: sì - Formati di risposta: testo	- Standard globale (tutte le aree)

Disponibilità dell'area del modello in base al tipo di distribuzione

I modelli foundry offrono opzioni per la struttura di hosting adatta ai modelli aziendali e di utilizzo. Il servizio offre due tipi principali di distribuzione:

Standard: dispone di un'opzione di distribuzione globale, che instrada il traffico a livello globale per offrire una velocità effettiva più elevata.
Provisioned: offre anche un'opzione di distribuzione globale che consente di acquistare e distribuire unità elaborate con provisioning nell'infrastruttura globale Azure.

Tutte le distribuzioni eseguono le stesse operazioni di inferenza, ma la fatturazione, la scalabilità e le prestazioni differiscono. Per altre informazioni sui tipi di distribuzione, vedere Tipi di distribuzione in Modelli foundry.

Disponibilità del modello Standard globale

Regione	FLUX.2-flex	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	Cohere-rerank-v4.0-pro	Cohere-rerank-v4.0-fast	cohere-command-a	embed-v-4-0	DeepSeek-V3.2-Speciale	DeepSeek-V3.2	DeepSeek-V3.1	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Llama-4-Maverick-17B-128E-Instruct-FP8	Llama-3.3-70B-Instruct	MAI-Image-2	model-router	mistral-document-ai-2512	mistral-document-ai-2505	Mistral-Large-3	Kimi-K2.5	grok-4-1-fast-reasoning	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brasilesouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
centralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
germaniawestcentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
italynorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
japanwest	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norvegiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
poloniacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southindia	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
spagnacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
sveziacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
svizzeranorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
svizzerawest	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilità del modello gestito con provisioning globale

Regione	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Llama-3.3-70B-Instruct
australiaeast	✅	✅	✅	✅
brasilesouth	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅
centralus	✅	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	✅	✅	✅	✅
germaniawestcentral	✅	✅	✅	✅
italynorth	✅	✅	✅	✅
japaneast	✅	✅	✅	✅
japanwest	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅
norvegiaeast	✅	✅	✅	✅
poloniacentral	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅
southindia	✅	✅	✅	✅
spagnacentral	✅	✅	✅	✅
sveziacentral	✅	✅	✅	✅
svizzeranorth	✅	✅	✅	✅
svizzerawest	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅
uksouth	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅
westeurope	✅	✅	✅	✅
westus	✅	✅	✅	✅
westus2	✅	✅	✅	✅
westus3	✅	✅	✅	✅

Disponibilità del modello Standard della zona dati

Regione	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	model-router	mistral-document-ai-2512	mistral-document-ai-2505	Mistral-Large-3	grok-4-1-fast-reasoning	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
centralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
germaniawestcentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
italynorth	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
northcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
poloniacentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
southcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
spagnacentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
sveziacentral	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-
westcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
westus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-05-01

Foundry Models venduto direttamente da Azure

Azure OpenAI nei modelli Microsoft Foundry

GPT-5.5

GPT-5.4

GPT-5.3

GPT-5.2

Disponibilità dell'area

GPT-5.1

Disponibilità dell'area

GPT-5

Disponibilità dell'area

gpt-oss

Disponibilità dell'area

Funzionalità

Distribuire con il codice

Serie GPT-4.1

Disponibilità dell'area

Funzionalità

computer-use-preview

Disponibilità dell'area

Funzionalità

Modelli serie o

Disponibilità dell'area

GPT-4o e GPT-4 Turbo

Modelli GPT-4 e GPT-4 Turbo

Incorporamenti

Modelli di generazione di immagini

Disponibilità dell'area

Modelli di generazione di video

Disponibilità dell'area

Modelli audio

Modelli audio GPT-4o

Audio API

Modelli di riconoscimento vocale

Modelli di traduzione vocale

Modelli di sintesi vocale (anteprima)

Tabella di riepilogo dei modelli e disponibilità dell'area

Modelli per tipo di distribuzione

Incorporamento di modelli

Modelli di generazione di immagini

Modelli di generazione di video

Ottimizzazione dei modelli

Assistenti (anteprima)

Ritiro del modello

Contenuto correlato

Modelli Black Forest Labs venduti direttamente da Azure

Modelli Cohere venduti direttamente da Azure

Modelli DeepSeek venduti direttamente da Azure

Meta modelli venduti direttamente da Azure

Microsoft modelli venduti direttamente da Azure

Modelli misti venduti direttamente da Azure

Modelli di Intelligenza artificiale Moonshot venduti direttamente da Azure

Modelli xAI venduti direttamente da Azure

Disponibilità dell'area del modello in base al tipo di distribuzione

Disponibilità del modello Standard globale

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive