Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Azure OpenAI è basato su un set diversificato di modelli con funzionalità e punti di prezzo diversi. La disponibilità dei modelli varia in base all'area e al cloud. Per la disponibilità del modello di Azure per enti pubblici, fare riferimento al servizio OpenAI di Azure per enti pubblici.
Modelli | Descrizione |
---|---|
codex-mini | Versione ottimizzata di o4-mini. |
Serie GPT-4.1 | Ultima versione del modello rilasciata da Azure OpenAI |
model-router | Modello che seleziona in modo intelligente da un set di modelli di chat sottostanti per rispondere a una determinata richiesta. |
anteprima dell'uso del computer | Un modello sperimentale addestrato per essere utilizzato con lo strumento per l'uso del computer dell'API Risposte. |
GPT-4.5 Preview | Il modello GPT più recente che eccelle in diverse attività di testo e immagine. |
Modelli serie o | Modelli di ragionamento con risoluzione avanzata dei problemi e maggiore attenzione e capacità. |
GPT-4o, GPT-4o mini e GPT-4 Turbo | I modelli Azure OpenAI più recenti e potenti con versioni multimodali, che possono accettare sia testo che immagini come input. |
GPT-4 | Un set di modelli migliore rispetto a GPT-3.5 e in grado di comprendere e generare linguaggio naturale e codice. |
GPT-3.5 | Un set di modelli migliore rispetto a GPT-3 e in grado di comprendere e generare linguaggio naturale e codice. |
Incorporamenti | Un set di modelli in grado di convertire il testo in formato vettoriale numerico per facilitare la similarità del testo. |
Generazione di immagini | Serie di modelli che possono generare immagini originali dal linguaggio naturale. |
Audio | Una serie di modelli per la trascrizione vocale, la traduzione e la sintesi vocale. I modelli audio GPT-4o supportano interazioni conversazionali con basso ritardo, "voce in, voce fuori", oppure la generazione di audio. |
Serie GPT 4.1
Aree di disponibilità
Modello | Regione |
---|---|
gpt-4.1 (2025-04-14) |
Vedere la tabella dei modelli. |
gpt-4.1-nano (2025-04-14) |
Vedere la tabella dei modelli. |
gpt-4.1-mini (2025-04-14) |
Vedere la tabella dei modelli. |
Capacità
ID modello | Descrizione | Finestra di contesto | Numero massimo di token di output | Dati di training (fino a) |
---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- Input di testo e immagine - Output di testo - API di completamento della chat - API Risposte - Streaming - Chiamata di funzione Output strutturati (completamenti chat) |
- 1,047,576 - 128.000 (distribuzioni gestite con provisioning) |
32.768 | 31 maggio 2024 |
gpt-4.1-nano (2025-04-14) |
- Input di testo e immagine - Output di testo - API di completamento della chat - API Risposte - Streaming - Chiamata di funzione Output strutturati (completamenti chat) |
- 1,047,576 - 128.000 (distribuzioni gestite con provisioning) |
32.768 | 31 maggio 2024 |
gpt-4.1-mini (2025-04-14) |
- Input di testo e immagine - Output di testo - API di completamento della chat - API Risposte - Streaming - Chiamata di funzione Output strutturati (completamenti chat) |
- 1,047,576 - 128.000 (distribuzioni gestite con provisioning) |
32.768 | 31 maggio 2024 |
modello-router
Modello che seleziona in modo intelligente da un set di modelli di chat sottostanti per rispondere a una determinata richiesta.
Aree di disponibilità
Modello | Regione |
---|---|
model-router (2025-05-19) |
Stati Uniti orientali 2 (standard globale), Svezia centrale (standard globale) |
Capacità
ID modello | Descrizione | Finestra di contesto | Numero massimo di token di output | Dati di training (fino a) |
---|---|---|---|---|
model-router (2025-05-19) |
Modello che seleziona in modo intelligente da un set di modelli di chat sottostanti per rispondere a una determinata richiesta. | 200,000* | 32768 (serie GPT 4.1) 100 K (o4-mini) |
31 maggio 2024 |
*Le finestre di contesto più grandi sono compatibili con alcuni dei modelli sottostanti, il che significa che una chiamata API con un contesto più ampio avrà esito positivo solo se la richiesta viene instradata al modello corretto, altrimenti la chiamata avrà esito negativo.
anteprima dell'utilizzo del computer
Un modello sperimentale sottoposto a training per essere utilizzato con lo strumento per l'uso del computer dell'API Risposte. Può essere usato insieme alle librerie di terze parti per consentire al modello di controllare l'input del mouse e della tastiera durante il recupero del contesto dagli screenshot dell'ambiente corrente.
Attenzione
Non è consigliabile usare modelli in anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate a versioni di anteprima future o alla versione disponibile a livello generale stabile più recente. I modelli designati in anteprima non seguono il ciclo di vita standard del modello OpenAI di Azure.
Disponibilità
Per l'accesso alla computer-use-preview
registrazione è necessario e l'accesso verrà concesso in base ai criteri di idoneità di Microsoft. I clienti che hanno accesso ad altri modelli di accesso limitato dovranno comunque richiedere l'accesso per questo modello.
Richiedere l'accesso: computer-use-preview
applicazione modello di accesso limitato
Dopo aver concesso l'accesso, sarà necessario creare una distribuzione per il modello.
Aree di disponibilità
Modello | Regione |
---|---|
computer-use-preview |
Vedere la tabella dei modelli. |
Capacità
ID modello | Descrizione | Finestra di contesto | Numero massimo di token di output | Dati di training (fino a) |
---|---|---|---|---|
computer-use-preview (2025-03-11) |
Modello specializzato da utilizzare con lo strumento per l'uso del computer dell'API Risposte -Utensileria - Streaming - Testo (input/output) - Immagine |
8,192 | 1,024 | Ott 2023 |
GPT-4.5 Preview
Aree di disponibilità
Modello | Regione |
---|---|
gpt-4.5-preview |
Vedere la tabella dei modelli. |
Capacità
ID modello | Descrizione | Finestra di contesto | Numero massimo di token di output | Dati di training (fino a) |
---|---|---|---|---|
gpt-4.5-preview (2025-02-27) GPT-4.5 Preview |
GPT 4.1 è la sostituzione consigliata per questo modello. Excel in diverse attività di testo e immagine. - Output strutturati - Memorizzazione delle richieste nella cache -Strumenti - Streaming - Testo(ingresso/uscita) - Immagine |
128.000 | 16,384 | Ott 2023 |
Nota
È previsto un comportamento per cui il modello non può rispondere a domande su se stesso. Se vuoi sapere qual è il termine di validità dei dati di addestramento del modello o altri dettagli sul modello, consulta la documentazione del modello sopra.
Modelli serie o
I modelli di serie o OpenAI* di Azure sono progettati specificamente per affrontare le attività di ragionamento e risoluzione dei problemi con maggiore attenzione e capacità. Questi modelli dedicano più tempo all'elaborazione e comprensione delle richieste degli utenti, rafforzando al contempo aree come scienze, codifica e matematica rispetto alle iterazioni precedenti.
ID modello | Descrizione | Richiesta massima (token) | Dati di training (fino a) |
---|---|---|---|
codex-mini (2025-05-16) |
Versione ottimizzata di o4-mini. - API Risposte - Output strutturati - Elaborazione di testo e immagini - Funzioni/Strumenti Riepilogo completo delle funzionalità |
Input: 200.000 Output: 100-000 |
31 maggio 2024 |
o3-pro (2025-06-10) |
- API Risposte - Output strutturati - Elaborazione di testo e immagini - Funzioni/Strumenti Riepilogo completo delle funzionalità |
Input: 200.000 Output: 100-000 |
31 maggio 2024 |
o4-mini (2025-04-16) |
- NUOVO modello di ragionamento, offrendo capacità di ragionamento avanzate. - API di completamento chat - API Risposte - Output strutturati - Elaborazione di testo e immagini - Funzioni/Strumenti Riepilogo completo delle funzionalità |
Input: 200.000 Output: 100-000 |
31 maggio 2024 |
o3 (2025-04-16) |
- NUOVO modello di ragionamento, offrendo capacità di ragionamento avanzate. - API di completamento chat - API Risposte - Output strutturati - Elaborazione di testo e immagini - Funzioni/Strumenti/Chiamata di strumenti paralleli Riepilogo completo delle funzionalità |
Input: 200.000 Output: 100-000 |
31 maggio 2024 |
o3-mini (2025-01-31) |
- Capacità di ragionamento migliorate. - Output strutturati - Elaborazione solo testo - Funzioni/Strumenti |
Input: 200.000 Output: 100-000 |
Ott 2023 |
o1 (2024-12-17) |
- Capacità di ragionamento migliorate. - Output strutturati - Elaborazione di testo e immagini - Funzioni/Strumenti |
Input: 200.000 Output: 100-000 |
Ott 2023 |
o1-preview (2024-09-12) |
Versione di anteprima precedente | Input: 128.000 Output: 32.768 |
Ott 2023 |
o1-mini (2024-09-12) |
Un'opzione più veloce e più conveniente nella serie o1, ideale per la codifica delle attività che richiedono velocità e un consumo di risorse inferiore. Distribuzione globale standard resa disponibile automaticamente. Le distribuzioni standard (a livello di area) sono attualmente disponibili solo per i clienti selezionati che hanno ricevuto l'accesso come parte del o1-preview rilascio con accesso limitato. |
Input: 128.000 Output: 65.536 |
Ott 2023 |
Disponibilità
Per altre informazioni sui modelli avanzati o-series
, vedere Introduzione ai modelli di ragionamento.
Aree di disponibilità
Modello | Regione |
---|---|
codex-mini |
Stati Uniti orientali 2 e Svezia centrale (standard globale) |
o3-pro |
Stati Uniti orientali 2 e Svezia centrale (standard globale) |
o4-mini |
Vedere la tabella dei modelli. |
o3 |
Vedere la tabella dei modelli. |
o3-mini |
Vedere la tabella dei modelli. |
o1 |
Vedere la tabella dei modelli. |
o1-preview |
Vedere la tabella dei modelli. Questo modello è disponibile solo per i clienti a cui è stato concesso l'accesso come parte dell'accesso limitato originale |
o1-mini |
Vedere la tabella dei modelli. |
GPT-4o e GPT-4 Turbo
GPT-4o integra testo e immagini in un singolo modello, consentendo di gestire più tipi di dati contemporaneamente. Questo approccio multidimensionale migliora l'accuratezza e la velocità di risposta nelle interazioni tra computer umani. GPT-4o ha le stesse prestazioni di GPT-4 Turbo in attività con testo e codice in inglese, ma offre prestazioni superiori nelle altre lingue e nelle attività di visione, impostando nuovi benchmark per le funzionalità di intelligenza artificiale.
Come si accede ai modelli GPT-4o e GPT-4o mini?
GPT-4o e GPT-4o mini sono disponibili per la distribuzione di modelli Standard e Standard-globali.
È necessario creare o usare una risorsa esistente in un'area standard ostandard globale supportata in cui è disponibile il modello.
Quando la risorsa viene creata, è possibile distribuire i modelli GPT-4o. Se si esegue una distribuzione a livello di codice, i nomi dei modelli sono:
gpt-4o
Versione2024-11-20
gpt-4o
Versione2024-08-06
gpt-4o
Versione2024-05-13
gpt-4o-mini
Versione2024-07-18
GPT-4 Turbo
GPT-4 Turbo è un modello bidirezionale di grandi dimensioni (accetta cioè input di testo o immagine e genera testo) in grado di risolvere problemi difficili con maggiore accuratezza rispetto ai modelli precedenti di OpenAI. Come GPT-3.5 Turbo e i modelli GPT-4 precedenti, GPT-4 Turbo è ottimizzato per la chat e funziona bene per le attività di completamento tradizionali.
GPT-4
GPT-4 è il predecessore di GPT-4 Turbo. Entrambi i modelli GPT-4 e GPT-4 Turbo hanno un nome di modello di base gpt-4
. È possibile distinguere tra i modelli GPT-4 e Turbo esaminando la versione del modello.
gpt-4
Versione0314
gpt-4
Versione0613
gpt-4-32k
Versione0613
È possibile visualizzare la lunghezza del contesto del token supportata da ogni modello nella tabella di riepilogo del modello.
Modelli GPT-4 e GPT-4 Turbo
- Questi modelli possono essere usati solo con l'API Chat Completion.
Vedere le versioni dei modelli per informazioni su come Azure OpenAI gestisce gli aggiornamenti delle versioni del modello e sull'uso dei modelli per informazioni su come visualizzare e configurare le impostazioni della versione del modello delle distribuzioni GPT-4.
ID modello | Descrizione | Richiesta massima (token) | Dati di training (fino a) |
---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
Modello di grandi dimensioni più recente disponibile a livello generale - Output strutturati - Elaborazione di testo e immagini - Modalità JSON - chiamata di funzioni parallele - Maggiore precisione e velocità di risposta - Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Visione - Prestazioni superiori nelle lingue non inglesi e nelle attività di visione. - Miglioramento della capacità di scrittura creativa |
Input: 128.000 Output: 16.384 |
Ott 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
- Output strutturati - Elaborazione di testo e immagini - Modalità JSON - chiamata di funzioni parallele - Maggiore precisione e velocità di risposta - Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Visione - Prestazioni superiori nelle lingue diverse dall'inglese e nelle attività di visione |
Input: 128.000 Output: 16.384 |
Ott 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Più recente modello GA di piccole dimensioni - Modello veloce, economico e in grado di supportare la sostituzione dei modelli della serie GPT-3.5 Turbo. - Elaborazione di testo e immagini - Modalità JSON - chiamata di funzioni parallele |
Input: 128.000 Output: 16.384 |
Ott 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Testo, elaborazione di immagini - Modalità JSON - chiamata di funzioni parallele - Maggiore precisione e velocità di risposta - Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Visione - Prestazioni superiori nelle lingue diverse dall'inglese e nelle attività di visione |
Input: 128.000 Output: 4.096 |
Ott 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo con Visione |
Nuovo modello ga - Sostituzione di tutti i modelli di anteprima GPT-4 precedenti ( vision-preview , 1106-Preview , 0125-Preview ). - La disponibilità delle funzionalità è attualmente diversa a seconda del metodo di input e del tipo di distribuzione. |
Input: 128.000 Output: 4.096 |
Dic. 2023 |
gpt-4-32k (0613) |
Modello GA vecchio - Funzioni di base chiamate con strumenti |
32.768 | Settembre 2021 |
gpt-4 (0613) |
Modello GA vecchio - Funzioni di base chiamate con strumenti |
8,192 | Settembre 2021 |
gpt-4-32k (0314) |
Modello GA vecchio - Informazioni sul ritiro |
32.768 | Settembre 2021 |
gpt-4 (0314) |
Modello GA vecchio - Informazioni sul ritiro |
8,192 | Settembre 2021 |
Attenzione
Non è consigliabile usare modelli in anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate a versioni di anteprima future o alla versione disponibile a livello generale stabile più recente. I modelli designati in anteprima non seguono il ciclo di vita standard del modello OpenAI di Azure.
GPT-3.5
I modelli GPT-3.5 possono comprendere e generare codice o linguaggio naturale. Il modello più efficiente e conveniente in termini di costi della famiglia GPT-3.5 è GPT-3.5 Turbo, ottimizzato per la chat e in grado di funzionare bene anche per le attività di completamento tradizionali. GPT-3.5 Turbo è disponibile per l'uso con l'API Completamento chat. GPT-3.5 Turbo Instruct offre funzionalità simili a text-davinci-003
usando l'API Completamenti anziché l'API Completamento chat. È consigliabile usare i modelli GPT-3.5 Turbo e GPT-3.5 Turbo Instruct su modelli GPT-3.5 e GPT-3 legacy.
ID modello | Descrizione | Richiesta massima (token) | Dati di training (fino a) |
---|---|---|---|
gpt-35-turbo (0125) NUOVO |
Modello ga più recente - Modalità JSON - chiamata di funzioni parallele - output riproducibile (anteprima) - Maggiore accuratezza nella risposta nei formati richiesti. - Correzione di un bug che causava un problema di codifica del testo per le chiamate di funzione non in lingua inglese. |
Input: 16.385 Output: 4.096 |
Settembre 2021 |
gpt-35-turbo (1106) |
Modello GA precedente - Modalità JSON - chiamata di funzioni parallele - output riproducibile (anteprima) |
Input: 16.385 Output: 4.096 |
Settembre 2021 |
gpt-35-turbo-instruct (0914) |
Solo endpoint di completamenti - Sostituzione dei modelli di completamento storici |
4.097 | Settembre 2021 |
Per saperne di più su come interagire con GPT-3.5 Turbo e l'API Completamento chat, consulta la nostra guida dettagliata.
1 Questo modello accetterà le richieste > di 4.096 token. Non è consigliabile superare il limite di 4.096 token di input perché la versione più recente del modello è limitata a 4.096 token. Se si verificano problemi quando si superano 4.096 token di input con questo modello, questa configurazione non è ufficialmente supportata.
Incorporamenti
text-embedding-3-large
è il modello di incorporamento più recente e più idoneo. L'aggiornamento tra modelli di incorporamento non è possibile. Per passare dall'uso di text-embedding-ada-002
a text-embedding-3-large
è necessario generare nuovi incorporamenti.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Nei test, OpenAI segnala che sia i modelli di embedding di terza generazione grandi che piccoli offrono migliori prestazioni medie di recupero multilingua con il benchmark MIRACL, pur mantenendo le prestazioni per i compiti in inglese con il benchmark MTEB.
Benchmark di valutazione | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Media MIRACL | 31,4 | 44.0 | 54.9 |
Media MTEB | 61.0 | 62,3 | 64.6 |
I modelli di incorporamento di terza generazione supportano la riduzione delle dimensioni dell'incorporamento tramite un nuovo parametro dimensions
. In genere, gli incorporamenti di dimensioni maggiori sono più costosi dal punto di vista di calcolo, memoria e archiviazione. La possibilità di regolare il numero di dimensioni consente un maggiore controllo sui costi e sulle prestazioni complessivi. Il parametro dimensions
non è supportato in tutte le versioni della libreria Python OpenAI 1.x, per sfruttare questo parametro, è consigliabile eseguire l'aggiornamento alla versione più recente: pip install openai --upgrade
.
Il test di benchmark MTEB di OpenAI ha rilevato che anche quando le dimensioni del modello di terza generazione sono ridotte a meno di text-embeddings-ada-002
1.536 dimensioni le prestazioni rimangono leggermente migliori.
Modelli di generazione di immagini
I modelli di generazione di immagini generano immagini da richieste di testo fornite dall'utente. GPT-image-1 è in anteprima pubblica con accesso limitato. DALL-E 3 è disponibile a livello generale per l'uso con le API REST. DALL-E 2 e DALL-E 3 con SDK per clienti sono in fase di anteprima.
Disponibilità
Per l'accesso alla gpt-image-1
registrazione è necessario e l'accesso verrà concesso in base ai criteri di idoneità di Microsoft. I clienti che hanno accesso ad altri modelli di accesso limitato dovranno comunque richiedere l'accesso per questo modello.
Richiedere l'accesso: gpt-image-1
applicazione modello di accesso limitato
Dopo aver concesso l'accesso, sarà necessario creare una distribuzione per il modello.
Aree di disponibilità
Modello | Regione |
---|---|
dall-e-3 |
Stati Uniti orientali Australia orientale Svezia centrale |
gpt-image-1 |
Stati Uniti occidentali 3 (standard globale) Emirati Arabi Uniti settentrionali (standard globale) |
Modelli di generazione di video
Sora è un modello di intelligenza artificiale di OpenAI che può creare scene video realistiche e fantasiose dalle istruzioni di testo. Sora è disponibile in anteprima pubblica.
Aree di disponibilità
Modello | Regione |
---|---|
sora |
Stati Uniti orientali 2 |
Modelli audio
I modelli audio in Azure OpenAI sono disponibili tramite le realtime
API , completions
e audio
.
Modelli audio GPT-4o
I modelli audio GPT 4o fanno parte della famiglia di modelli GPT-4o e supportano interazioni conversazionali "voce in, voce out" a bassa latenza o generazione audio.
Attenzione
Non è consigliabile usare modelli in anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate a versioni di anteprima future o alla versione disponibile a livello generale stabile più recente. I modelli designati in anteprima non seguono il ciclo di vita standard del modello OpenAI di Azure.
Nella tabella seguente sono disponibili informazioni dettagliate sui token di richiesta massimi e sui dati di training.
ID modello | Descrizione | Richiesta massima (token) | Dati di training (fino a) |
---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o audio |
Modello audio per la generazione di audio e testo. | Input: 128.000 Output: 4.096 |
Ott 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o audio |
Modello audio per l'elaborazione audio in tempo reale. | Input: 128.000 Output: 4.096 |
Ott 2023 |
gpt-4o-audio-preview (2024-12-17) GPT-4o audio |
Modello audio per la generazione di audio e testo. | Input: 128.000 Output: 4.096 |
Ott 2023 |
gpt-4o-realtime-preview (2024-12-17) GPT-4o audio |
Modello audio per l'elaborazione audio in tempo reale. | Input: 128.000 Output: 4.096 |
Ott 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o audio |
Modello audio per l'elaborazione audio in tempo reale. | Input: 128.000 Output: 4.096 |
Ott 2023 |
Per confrontare la disponibilità di modelli audio GPT-4o in tutte le aree, vedere la tabella dei modelli.
Audio API
I modelli audio tramite l'API /audio
possono essere usati per la conversione da parlato a testo, la traduzione e la sintesi vocale.
Modelli di conversione da voce a testo
ID modello | Descrizione | Richiesta massima (dimensioni file audio) |
---|---|---|
whisper |
Modello di riconoscimento vocale generico. | 25 MB |
gpt-4o-transcribe |
Riconoscimento vocale con tecnologia GPT-4o. | 25 MB |
gpt-4o-mini-transcribe |
Riconoscimento vocale con tecnologia GPT-4o mini. | 25 MB |
Modelli di traduzione vocale
ID modello | Descrizione | Richiesta massima (dimensioni file audio) |
---|---|---|
whisper |
Modello di riconoscimento vocale generico. | 25 MB |
Modelli di sintesi vocale (anteprima)
ID modello | Descrizione |
---|---|
tts |
Sintesi vocale ottimizzata per la velocità. |
tts-hd |
Sintesi vocale ottimizzata per la qualità. |
gpt-4o-mini-tts |
Modello di sintesi vocale basato su GPT-4o mini. Puoi guidare la voce a parlare in uno stile o un tono. |
Per altre informazioni, vedere Disponibilità dell'area dei modelli audio in questo articolo.
Tabella di riepilogo dei modelli e disponibilità dell'area
Modelli per tipo di distribuzione
OpenAI di Azure offre ai clienti opzioni per la struttura di hosting che si adattano ai criteri di business e di utilizzo. Il servizio offre due tipi principali di distribuzione:
- Standard è disponibile con un'opzione di distribuzione globale, instradando il traffico a livello globale per offrire una velocità effettiva più elevata.
- ‘Provisioned’ è disponibile anche con un'opzione di implementazione globale che consente ai clienti di acquistare e distribuire unità di throughput riservato nell'infrastruttura globale di Azure.
Tutte le distribuzioni possono eseguire esattamente le stesse operazioni di inferenza, ma la fatturazione, la scalabilità e le prestazioni sono sostanzialmente diverse. Per altre informazioni sui tipi di distribuzione OpenAI di Azure, vedere la guida ai tipi di distribuzione.
- Standard globale
- Gestito con provisioning globale
- Batch globale
- Zona Dati Standard
- Gestito con provisioning dell’area dati
- Batch area dati
- Standard
- Gestito con provisioning
Disponibilità del modello standard globale
Regione | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | model-router, 2025-05-19 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | anteprima dell'uso del computer, 11/03/2025 | gpt-4.5-preview, 2025-02-27 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transcribe, 2025-03-20 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Brasilsud | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Canada Est | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Germania Ovest Centrale | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
italynorth | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
coreacentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Northcentralus | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Norvegia Est | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Polonia Centrale | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Sudafrica Nord | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Southcentralus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
India del Sud | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Spagna Centrale | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
SveziaCentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ |
Svizzera settentrionale | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uaenorth | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uksouth | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Europa occidentale | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Nota
o1-mini
è attualmente disponibile per tutti i clienti per la distribuzione standard globale.
Ai clienti selezionati è stato concesso l'accesso alla distribuzione standard (a livello di area) a o1-mini
come parte del rilascio con accesso limitato o1-preview
. Al momento, l'accesso alle distribuzioni standard (a livello di area) o1-mini
non viene espanso.
Questa tabella non include informazioni dettagliate sulla disponibilità a livello di area. Per queste informazioni, vedere la sezione relativa all'ottimizzazione .
Modelli di distribuzione standard (a livello di area) per endpoint
- Completamenti chat
- Incorporamenti
- Generazione di immagini
- Generazione di video
- Audio
- Completamenti (legacy)
Completamenti della chat
Regione | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | ✅ | - | - | - | ✅ | ✅ |
Canada Est | - | - | - | ✅ | - | - | - | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
francecentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
japaneast | - | - | - | ✅ | - | - | - | - | ✅ |
Northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Norvegia Est | - | - | - | ✅ | - | - | - | - | - |
Southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
India del Sud | - | - | - | ✅ | - | - | - | ✅ | ✅ |
SveziaCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Svizzera settentrionale | - | - | - | ✅ | - | - | - | - | ✅ |
uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ |
Europa occidentale | - | - | - | - | - | - | - | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Nota
o1-mini
è attualmente disponibile per tutti i clienti per la distribuzione standard globale.
Ai clienti selezionati è stato concesso l'accesso alla distribuzione standard (a livello di area) a o1-mini
come parte del rilascio con accesso limitato o1-preview
. Al momento, l'accesso alle distribuzioni standard (a livello di area) o1-mini
non viene espanso.
Disponibilità dei modelli GPT-4 e GPT-4 Turbo
Selezionare l'accesso del cliente
Oltre alle aree precedenti, disponibili per tutti i clienti Di Azure OpenAI, alcuni clienti preesistenti selezionati hanno ottenuto l'accesso alle versioni di GPT-4 in aree aggiuntive:
Modello | Regione |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
Stati Uniti orientali Francia centrale Stati Uniti centro-meridionali Regno Unito meridionale |
gpt-4 (0613) gpt-4-32k (0613) |
Stati Uniti orientali Stati Uniti orientali 2 Giappone orientale Regno Unito meridionale |
Modelli GPT-3.5
Vedere le versioni dei modelli per informazioni su come Azure OpenAI gestisce gli aggiornamenti delle versioni del modello e sull'uso dei modelli per informazioni su come visualizzare e configurare le impostazioni della versione del modello delle distribuzioni GPT-3.5 Turbo.
Ottimizzazione dei modelli
Nota
gpt-35-turbo
- L'ottimizzazione di questo modello è limitata a un subset di aree e non è disponibile in ogni area in cui è disponibile il modello di base.
Le aree supportate per l'ottimizzazione possono variare se si usano modelli OpenAI di Azure in un progetto di Azure AI Foundry rispetto all'esterno di un progetto.
ID modello | Aree di training standard | Formazione globale (anteprima) | Richiesta max (token) | Dati di training (fino a) | Modalità |
---|---|---|---|---|---|
gpt-35-turbo (1106) |
Stati Uniti Orientali 2 Stati Uniti centro-settentrionali Svezia centrale Svizzera occidentale |
- | Input: 16.385 Output: 4.096 |
Settembre 2021 | Testo a testo |
gpt-35-turbo (0125) |
Stati Uniti Orientali 2 Stati Uniti centro-settentrionali Svezia centrale Svizzera occidentale |
- | 16.385 | Settembre 2021 | Testo a testo |
gpt-4o-mini (2024-07-18) |
Stati Uniti centro-settentrionali Svezia centrale |
- | Input: 128.000 Output: 16.384 Lunghezza del contesto di training di esempio: 65.536 |
Ott 2023 | Testo a testo |
gpt-4o (2024-08-06) |
Stati Uniti Orientali 2 Stati Uniti centro-settentrionali Svezia centrale |
- | Input: 128.000 Output: 16.384 Lunghezza del contesto di training di esempio: 65.536 |
Ott 2023 | Testo e visione artificiale in testo |
gpt-4.1 (2025-04-14) |
Stati Uniti centro-settentrionali Svezia centrale |
✅ | Input: 128.000 Output: 16.384 Lunghezza del contesto di training di esempio: 65.536 |
Maggio 2024 | Testo e visione artificiale in testo |
gpt-4.1-mini (2025-04-14) |
Stati Uniti centro-settentrionali Svezia centrale |
✅ | Input: 128.000 Output: 16.384 Lunghezza del contesto di training di esempio: 65.536 |
Maggio 2024 | Testo a testo |
gpt-4.1-nano (2025-04-14) |
Stati Uniti centro-settentrionali Svezia centrale |
- | Input: 128.000 Output: 16.384 Lunghezza del contesto di esempio di training: 32.768 |
Maggio 2024 | Testo a testo |
o4-mini (2025-04-16) |
Stati Uniti Orientali 2 Svezia centrale |
- | Input: 128.000 Output: 16.384 Lunghezza del contesto di training di esempio: 65.536 |
Maggio 2024 | Testo a testo |
Nota
Il training globale (in anteprima pubblica) offre un training più conveniente per token, ma non offre la residenza dei dati. Attualmente è disponibile per le risorse OpenAI di Azure nelle aree seguenti, con altre aree presto disponibili:
- Australia orientale
- Brasile meridionale
- Stati Uniti orientali
- Stati Uniti orientali 2
- Francia centrale
- Germania centro-occidentale
- Italia settentrionale
- Giappone orientale (nessun supporto per la visione)
- Corea centrale
- Stati Uniti centro-settentrionali
- Norvegia orientale
- Polonia centrale
- Sud-est asiatico
- Sudafrica settentrionale
- Spagna centrale
- Svezia centrale
- Svizzera occidentale
- Svizzera settentrionale
- Regno Unito meridionale
- Stati Uniti occidentali
- Stati Uniti occidentali3
Assistenti (Anteprima)
Per gli assistenti è necessaria la combinazione di un modello supportato e di un'area supportata. Alcuni strumenti e funzionalità richiedono i modelli più recenti. I modelli seguenti sono disponibili nell'API Assistants, nell'SDK e in Azure AI Foundry. La tabella seguente è relativa alla distribuzione standard. Per informazioni sulla disponibilità delle Provisioned Throughput Unit (PTU), vedere provisioned throughput. I modelli e le aree elencati possono essere usati con Assistenti v1 e v2. È possibile usare modelli standard globali se supportati nelle aree elencate di seguito.
Regione | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
Norvegia Est | - | - | - | - | ✅ | - | - | - | - | - | - | - |
India del Sud | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
SveziaCentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Ritiro del modello
Per le informazioni più recenti sui ritiri dei modelli, vedere la guida al ritiro del modello.