Condividi tramite


Azure OpenAI nei modelli di Azure AI Foundry

Azure OpenAI è basato su un set diversificato di modelli con funzionalità e punti di prezzo diversi. La disponibilità dei modelli varia in base all'area e al cloud. Per la disponibilità del modello di Azure per enti pubblici, fare riferimento al servizio OpenAI di Azure per enti pubblici.

Modelli Descrizione
codex-mini Versione ottimizzata di o4-mini.
Serie GPT-4.1 Ultima versione del modello rilasciata da Azure OpenAI
model-router Modello che seleziona in modo intelligente da un set di modelli di chat sottostanti per rispondere a una determinata richiesta.
anteprima dell'uso del computer Un modello sperimentale addestrato per essere utilizzato con lo strumento per l'uso del computer dell'API Risposte.
GPT-4.5 Preview Il modello GPT più recente che eccelle in diverse attività di testo e immagine.
Modelli serie o Modelli di ragionamento con risoluzione avanzata dei problemi e maggiore attenzione e capacità.
GPT-4o, GPT-4o mini e GPT-4 Turbo I modelli Azure OpenAI più recenti e potenti con versioni multimodali, che possono accettare sia testo che immagini come input.
GPT-4 Un set di modelli migliore rispetto a GPT-3.5 e in grado di comprendere e generare linguaggio naturale e codice.
GPT-3.5 Un set di modelli migliore rispetto a GPT-3 e in grado di comprendere e generare linguaggio naturale e codice.
Incorporamenti Un set di modelli in grado di convertire il testo in formato vettoriale numerico per facilitare la similarità del testo.
Generazione di immagini Serie di modelli che possono generare immagini originali dal linguaggio naturale.
Audio Una serie di modelli per la trascrizione vocale, la traduzione e la sintesi vocale. I modelli audio GPT-4o supportano interazioni conversazionali con basso ritardo, "voce in, voce fuori", oppure la generazione di audio.

Serie GPT 4.1

Aree di disponibilità

Modello Regione
gpt-4.1 (2025-04-14) Vedere la tabella dei modelli.
gpt-4.1-nano (2025-04-14) Vedere la tabella dei modelli.
gpt-4.1-mini (2025-04-14) Vedere la tabella dei modelli.

Capacità

ID modello Descrizione Finestra di contesto Numero massimo di token di output Dati di training (fino a)
gpt-4.1 (2025-04-14) - Input di testo e immagine
- Output di testo
- API di completamento della chat
- API Risposte
- Streaming
- Chiamata di funzione
Output strutturati (completamenti chat)
- 1,047,576
- 128.000 (distribuzioni gestite con provisioning)
32.768 31 maggio 2024
gpt-4.1-nano (2025-04-14) - Input di testo e immagine
- Output di testo
- API di completamento della chat
- API Risposte
- Streaming
- Chiamata di funzione
Output strutturati (completamenti chat)
- 1,047,576
- 128.000 (distribuzioni gestite con provisioning)
32.768 31 maggio 2024
gpt-4.1-mini (2025-04-14) - Input di testo e immagine
- Output di testo
- API di completamento della chat
- API Risposte
- Streaming
- Chiamata di funzione
Output strutturati (completamenti chat)
- 1,047,576
- 128.000 (distribuzioni gestite con provisioning)
32.768 31 maggio 2024

modello-router

Modello che seleziona in modo intelligente da un set di modelli di chat sottostanti per rispondere a una determinata richiesta.

Aree di disponibilità

Modello Regione
model-router (2025-05-19) Stati Uniti orientali 2 (standard globale), Svezia centrale (standard globale)

Capacità

ID modello Descrizione Finestra di contesto Numero massimo di token di output Dati di training (fino a)
model-router (2025-05-19) Modello che seleziona in modo intelligente da un set di modelli di chat sottostanti per rispondere a una determinata richiesta. 200,000* 32768 (serie GPT 4.1)
100 K (o4-mini)
31 maggio 2024

*Le finestre di contesto più grandi sono compatibili con alcuni dei modelli sottostanti, il che significa che una chiamata API con un contesto più ampio avrà esito positivo solo se la richiesta viene instradata al modello corretto, altrimenti la chiamata avrà esito negativo.

anteprima dell'utilizzo del computer

Un modello sperimentale sottoposto a training per essere utilizzato con lo strumento per l'uso del computer dell'API Risposte. Può essere usato insieme alle librerie di terze parti per consentire al modello di controllare l'input del mouse e della tastiera durante il recupero del contesto dagli screenshot dell'ambiente corrente.

Attenzione

Non è consigliabile usare modelli in anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate a versioni di anteprima future o alla versione disponibile a livello generale stabile più recente. I modelli designati in anteprima non seguono il ciclo di vita standard del modello OpenAI di Azure.

Disponibilità

Per l'accesso alla computer-use-preview registrazione è necessario e l'accesso verrà concesso in base ai criteri di idoneità di Microsoft. I clienti che hanno accesso ad altri modelli di accesso limitato dovranno comunque richiedere l'accesso per questo modello.

Richiedere l'accesso: computer-use-preview applicazione modello di accesso limitato

Dopo aver concesso l'accesso, sarà necessario creare una distribuzione per il modello.

Aree di disponibilità

Modello Regione
computer-use-preview Vedere la tabella dei modelli.

Capacità

ID modello Descrizione Finestra di contesto Numero massimo di token di output Dati di training (fino a)
computer-use-preview (2025-03-11) Modello specializzato da utilizzare con lo strumento per l'uso del computer dell'API Risposte

-Utensileria
- Streaming
- Testo (input/output)
- Immagine
8,192 1,024 Ott 2023

GPT-4.5 Preview

Aree di disponibilità

Modello Regione
gpt-4.5-preview Vedere la tabella dei modelli.

Capacità

ID modello Descrizione Finestra di contesto Numero massimo di token di output Dati di training (fino a)
gpt-4.5-preview (2025-02-27)
GPT-4.5 Preview
GPT 4.1 è la sostituzione consigliata per questo modello. Excel in diverse attività di testo e immagine.
- Output strutturati
- Memorizzazione delle richieste nella cache
-Strumenti
- Streaming
- Testo(ingresso/uscita)
- Immagine
128.000 16,384 Ott 2023

Nota

È previsto un comportamento per cui il modello non può rispondere a domande su se stesso. Se vuoi sapere qual è il termine di validità dei dati di addestramento del modello o altri dettagli sul modello, consulta la documentazione del modello sopra.

Modelli serie o

I modelli di serie o OpenAI* di Azure sono progettati specificamente per affrontare le attività di ragionamento e risoluzione dei problemi con maggiore attenzione e capacità. Questi modelli dedicano più tempo all'elaborazione e comprensione delle richieste degli utenti, rafforzando al contempo aree come scienze, codifica e matematica rispetto alle iterazioni precedenti.

ID modello Descrizione Richiesta massima (token) Dati di training (fino a)
codex-mini (2025-05-16) Versione ottimizzata di o4-mini.
- API Risposte
- Output strutturati
- Elaborazione di testo e immagini
- Funzioni/Strumenti
Riepilogo completo delle funzionalità
Input: 200.000
Output: 100-000
31 maggio 2024
o3-pro (2025-06-10) - API Risposte
- Output strutturati
- Elaborazione di testo e immagini
- Funzioni/Strumenti
Riepilogo completo delle funzionalità
Input: 200.000
Output: 100-000
31 maggio 2024
o4-mini (2025-04-16) - NUOVO modello di ragionamento, offrendo capacità di ragionamento avanzate.

- API di completamento chat
- API Risposte
- Output strutturati
- Elaborazione di testo e immagini
- Funzioni/Strumenti
Riepilogo completo delle funzionalità
Input: 200.000
Output: 100-000
31 maggio 2024
o3 (2025-04-16) - NUOVO modello di ragionamento, offrendo capacità di ragionamento avanzate.

- API di completamento chat
- API Risposte
- Output strutturati
- Elaborazione di testo e immagini
- Funzioni/Strumenti/Chiamata di strumenti paralleli
Riepilogo completo delle funzionalità
Input: 200.000
Output: 100-000
31 maggio 2024
o3-mini (2025-01-31) - Capacità di ragionamento migliorate.
- Output strutturati
- Elaborazione solo testo
- Funzioni/Strumenti
Input: 200.000
Output: 100-000
Ott 2023
o1 (2024-12-17) - Capacità di ragionamento migliorate.
- Output strutturati
- Elaborazione di testo e immagini
- Funzioni/Strumenti
Input: 200.000
Output: 100-000
Ott 2023
o1-preview (2024-09-12) Versione di anteprima precedente Input: 128.000
Output: 32.768
Ott 2023
o1-mini (2024-09-12) Un'opzione più veloce e più conveniente nella serie o1, ideale per la codifica delle attività che richiedono velocità e un consumo di risorse inferiore.

Distribuzione globale standard resa disponibile automaticamente.

Le distribuzioni standard (a livello di area) sono attualmente disponibili solo per i clienti selezionati che hanno ricevuto l'accesso come parte del o1-preview rilascio con accesso limitato.
Input: 128.000
Output: 65.536
Ott 2023

Disponibilità

Per altre informazioni sui modelli avanzati o-series , vedere Introduzione ai modelli di ragionamento.

Aree di disponibilità

Modello Regione
codex-mini Stati Uniti orientali 2 e Svezia centrale (standard globale)
o3-pro Stati Uniti orientali 2 e Svezia centrale (standard globale)
o4-mini Vedere la tabella dei modelli.
o3 Vedere la tabella dei modelli.
o3-mini Vedere la tabella dei modelli.
o1 Vedere la tabella dei modelli.
o1-preview Vedere la tabella dei modelli. Questo modello è disponibile solo per i clienti a cui è stato concesso l'accesso come parte dell'accesso limitato originale
o1-mini Vedere la tabella dei modelli.

GPT-4o e GPT-4 Turbo

GPT-4o integra testo e immagini in un singolo modello, consentendo di gestire più tipi di dati contemporaneamente. Questo approccio multidimensionale migliora l'accuratezza e la velocità di risposta nelle interazioni tra computer umani. GPT-4o ha le stesse prestazioni di GPT-4 Turbo in attività con testo e codice in inglese, ma offre prestazioni superiori nelle altre lingue e nelle attività di visione, impostando nuovi benchmark per le funzionalità di intelligenza artificiale.

Come si accede ai modelli GPT-4o e GPT-4o mini?

GPT-4o e GPT-4o mini sono disponibili per la distribuzione di modelli Standard e Standard-globali.

È necessario creare o usare una risorsa esistente in un'area standard ostandard globale supportata in cui è disponibile il modello.

Quando la risorsa viene creata, è possibile distribuire i modelli GPT-4o. Se si esegue una distribuzione a livello di codice, i nomi dei modelli sono:

  • gpt-4oVersione2024-11-20
  • gpt-4oVersione2024-08-06
  • gpt-4oVersione2024-05-13
  • gpt-4o-miniVersione2024-07-18

GPT-4 Turbo

GPT-4 Turbo è un modello bidirezionale di grandi dimensioni (accetta cioè input di testo o immagine e genera testo) in grado di risolvere problemi difficili con maggiore accuratezza rispetto ai modelli precedenti di OpenAI. Come GPT-3.5 Turbo e i modelli GPT-4 precedenti, GPT-4 Turbo è ottimizzato per la chat e funziona bene per le attività di completamento tradizionali.

GPT-4

GPT-4 è il predecessore di GPT-4 Turbo. Entrambi i modelli GPT-4 e GPT-4 Turbo hanno un nome di modello di base gpt-4. È possibile distinguere tra i modelli GPT-4 e Turbo esaminando la versione del modello.

  • gpt-4Versione0314
  • gpt-4Versione0613
  • gpt-4-32kVersione0613

È possibile visualizzare la lunghezza del contesto del token supportata da ogni modello nella tabella di riepilogo del modello.

Modelli GPT-4 e GPT-4 Turbo

  • Questi modelli possono essere usati solo con l'API Chat Completion.

Vedere le versioni dei modelli per informazioni su come Azure OpenAI gestisce gli aggiornamenti delle versioni del modello e sull'uso dei modelli per informazioni su come visualizzare e configurare le impostazioni della versione del modello delle distribuzioni GPT-4.

ID modello Descrizione Richiesta massima (token) Dati di training (fino a)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Modello di grandi dimensioni più recente disponibile a livello generale
- Output strutturati
- Elaborazione di testo e immagini
- Modalità JSON
- chiamata di funzioni parallele
- Maggiore precisione e velocità di risposta
- Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Visione
- Prestazioni superiori nelle lingue non inglesi e nelle attività di visione.
- Miglioramento della capacità di scrittura creativa
Input: 128.000
Output: 16.384
Ott 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Output strutturati
- Elaborazione di testo e immagini
- Modalità JSON
- chiamata di funzioni parallele
- Maggiore precisione e velocità di risposta
- Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Visione
- Prestazioni superiori nelle lingue diverse dall'inglese e nelle attività di visione
Input: 128.000
Output: 16.384
Ott 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
Più recente modello GA di piccole dimensioni
- Modello veloce, economico e in grado di supportare la sostituzione dei modelli della serie GPT-3.5 Turbo.
- Elaborazione di testo e immagini
- Modalità JSON
- chiamata di funzioni parallele
Input: 128.000
Output: 16.384
Ott 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Testo, elaborazione di immagini
- Modalità JSON
- chiamata di funzioni parallele
- Maggiore precisione e velocità di risposta
- Parità con il testo inglese e le attività di codifica rispetto a GPT-4 Turbo con Visione
- Prestazioni superiori nelle lingue diverse dall'inglese e nelle attività di visione
Input: 128.000
Output: 4.096
Ott 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo con Visione
Nuovo modello ga
- Sostituzione di tutti i modelli di anteprima GPT-4 precedenti (vision-preview, 1106-Preview, 0125-Preview).
- La disponibilità delle funzionalità è attualmente diversa a seconda del metodo di input e del tipo di distribuzione.
Input: 128.000
Output: 4.096
Dic. 2023
gpt-4-32k (0613) Modello GA vecchio
- Funzioni di base chiamate con strumenti
32.768 Settembre 2021
gpt-4 (0613) Modello GA vecchio
- Funzioni di base chiamate con strumenti
8,192 Settembre 2021
gpt-4-32k(0314) Modello GA vecchio
- Informazioni sul ritiro
32.768 Settembre 2021
gpt-4 (0314) Modello GA vecchio
- Informazioni sul ritiro
8,192 Settembre 2021

Attenzione

Non è consigliabile usare modelli in anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate a versioni di anteprima future o alla versione disponibile a livello generale stabile più recente. I modelli designati in anteprima non seguono il ciclo di vita standard del modello OpenAI di Azure.

GPT-3.5

I modelli GPT-3.5 possono comprendere e generare codice o linguaggio naturale. Il modello più efficiente e conveniente in termini di costi della famiglia GPT-3.5 è GPT-3.5 Turbo, ottimizzato per la chat e in grado di funzionare bene anche per le attività di completamento tradizionali. GPT-3.5 Turbo è disponibile per l'uso con l'API Completamento chat. GPT-3.5 Turbo Instruct offre funzionalità simili a text-davinci-003 usando l'API Completamenti anziché l'API Completamento chat. È consigliabile usare i modelli GPT-3.5 Turbo e GPT-3.5 Turbo Instruct su modelli GPT-3.5 e GPT-3 legacy.

ID modello Descrizione Richiesta massima (token) Dati di training (fino a)
gpt-35-turbo (0125) NUOVO Modello ga più recente
- Modalità JSON
- chiamata di funzioni parallele
- output riproducibile (anteprima)
- Maggiore accuratezza nella risposta nei formati richiesti.
- Correzione di un bug che causava un problema di codifica del testo per le chiamate di funzione non in lingua inglese.
Input: 16.385
Output: 4.096
Settembre 2021
gpt-35-turbo (1106) Modello GA precedente
- Modalità JSON
- chiamata di funzioni parallele
- output riproducibile (anteprima)
Input: 16.385
Output: 4.096
Settembre 2021
gpt-35-turbo-instruct (0914) Solo endpoint di completamenti
- Sostituzione dei modelli di completamento storici
4.097 Settembre 2021

Per saperne di più su come interagire con GPT-3.5 Turbo e l'API Completamento chat, consulta la nostra guida dettagliata.

1 Questo modello accetterà le richieste > di 4.096 token. Non è consigliabile superare il limite di 4.096 token di input perché la versione più recente del modello è limitata a 4.096 token. Se si verificano problemi quando si superano 4.096 token di input con questo modello, questa configurazione non è ufficialmente supportata.

Incorporamenti

text-embedding-3-large è il modello di incorporamento più recente e più idoneo. L'aggiornamento tra modelli di incorporamento non è possibile. Per passare dall'uso di text-embedding-ada-002 a text-embedding-3-large è necessario generare nuovi incorporamenti.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Nei test, OpenAI segnala che sia i modelli di embedding di terza generazione grandi che piccoli offrono migliori prestazioni medie di recupero multilingua con il benchmark MIRACL, pur mantenendo le prestazioni per i compiti in inglese con il benchmark MTEB.

Benchmark di valutazione text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Media MIRACL 31,4 44.0 54.9
Media MTEB 61.0 62,3 64.6

I modelli di incorporamento di terza generazione supportano la riduzione delle dimensioni dell'incorporamento tramite un nuovo parametro dimensions. In genere, gli incorporamenti di dimensioni maggiori sono più costosi dal punto di vista di calcolo, memoria e archiviazione. La possibilità di regolare il numero di dimensioni consente un maggiore controllo sui costi e sulle prestazioni complessivi. Il parametro dimensions non è supportato in tutte le versioni della libreria Python OpenAI 1.x, per sfruttare questo parametro, è consigliabile eseguire l'aggiornamento alla versione più recente: pip install openai --upgrade.

Il test di benchmark MTEB di OpenAI ha rilevato che anche quando le dimensioni del modello di terza generazione sono ridotte a meno di text-embeddings-ada-002 1.536 dimensioni le prestazioni rimangono leggermente migliori.

Modelli di generazione di immagini

I modelli di generazione di immagini generano immagini da richieste di testo fornite dall'utente. GPT-image-1 è in anteprima pubblica con accesso limitato. DALL-E 3 è disponibile a livello generale per l'uso con le API REST. DALL-E 2 e DALL-E 3 con SDK per clienti sono in fase di anteprima.

Disponibilità

Per l'accesso alla gpt-image-1 registrazione è necessario e l'accesso verrà concesso in base ai criteri di idoneità di Microsoft. I clienti che hanno accesso ad altri modelli di accesso limitato dovranno comunque richiedere l'accesso per questo modello.

Richiedere l'accesso: gpt-image-1 applicazione modello di accesso limitato

Dopo aver concesso l'accesso, sarà necessario creare una distribuzione per il modello.

Aree di disponibilità

Modello Regione
dall-e-3 Stati Uniti orientali
Australia orientale
Svezia centrale
gpt-image-1 Stati Uniti occidentali 3 (standard globale)
Emirati Arabi Uniti settentrionali (standard globale)

Modelli di generazione di video

Sora è un modello di intelligenza artificiale di OpenAI che può creare scene video realistiche e fantasiose dalle istruzioni di testo. Sora è disponibile in anteprima pubblica.

Aree di disponibilità

Modello Regione
sora Stati Uniti orientali 2

Modelli audio

I modelli audio in Azure OpenAI sono disponibili tramite le realtimeAPI , completionse audio .

Modelli audio GPT-4o

I modelli audio GPT 4o fanno parte della famiglia di modelli GPT-4o e supportano interazioni conversazionali "voce in, voce out" a bassa latenza o generazione audio.

Attenzione

Non è consigliabile usare modelli in anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate a versioni di anteprima future o alla versione disponibile a livello generale stabile più recente. I modelli designati in anteprima non seguono il ciclo di vita standard del modello OpenAI di Azure.

Nella tabella seguente sono disponibili informazioni dettagliate sui token di richiesta massimi e sui dati di training.

ID modello Descrizione Richiesta massima (token) Dati di training (fino a)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o audio
Modello audio per la generazione di audio e testo. Input: 128.000
Output: 4.096
Ott 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o audio
Modello audio per l'elaborazione audio in tempo reale. Input: 128.000
Output: 4.096
Ott 2023
gpt-4o-audio-preview (2024-12-17)
GPT-4o audio
Modello audio per la generazione di audio e testo. Input: 128.000
Output: 4.096
Ott 2023
gpt-4o-realtime-preview (2024-12-17)
GPT-4o audio
Modello audio per l'elaborazione audio in tempo reale. Input: 128.000
Output: 4.096
Ott 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o audio
Modello audio per l'elaborazione audio in tempo reale. Input: 128.000
Output: 4.096
Ott 2023

Per confrontare la disponibilità di modelli audio GPT-4o in tutte le aree, vedere la tabella dei modelli.

Audio API

I modelli audio tramite l'API /audio possono essere usati per la conversione da parlato a testo, la traduzione e la sintesi vocale.

Modelli di conversione da voce a testo

ID modello Descrizione Richiesta massima (dimensioni file audio)
whisper Modello di riconoscimento vocale generico. 25 MB
gpt-4o-transcribe Riconoscimento vocale con tecnologia GPT-4o. 25 MB
gpt-4o-mini-transcribe Riconoscimento vocale con tecnologia GPT-4o mini. 25 MB

Modelli di traduzione vocale

ID modello Descrizione Richiesta massima (dimensioni file audio)
whisper Modello di riconoscimento vocale generico. 25 MB

Modelli di sintesi vocale (anteprima)

ID modello Descrizione
tts Sintesi vocale ottimizzata per la velocità.
tts-hd Sintesi vocale ottimizzata per la qualità.
gpt-4o-mini-tts Modello di sintesi vocale basato su GPT-4o mini.

Puoi guidare la voce a parlare in uno stile o un tono.

Per altre informazioni, vedere Disponibilità dell'area dei modelli audio in questo articolo.

Tabella di riepilogo dei modelli e disponibilità dell'area

Modelli per tipo di distribuzione

OpenAI di Azure offre ai clienti opzioni per la struttura di hosting che si adattano ai criteri di business e di utilizzo. Il servizio offre due tipi principali di distribuzione:

  • Standard è disponibile con un'opzione di distribuzione globale, instradando il traffico a livello globale per offrire una velocità effettiva più elevata.
  • ‘Provisioned’ è disponibile anche con un'opzione di implementazione globale che consente ai clienti di acquistare e distribuire unità di throughput riservato nell'infrastruttura globale di Azure.

Tutte le distribuzioni possono eseguire esattamente le stesse operazioni di inferenza, ma la fatturazione, la scalabilità e le prestazioni sono sostanzialmente diverse. Per altre informazioni sui tipi di distribuzione OpenAI di Azure, vedere la guida ai tipi di distribuzione.

Disponibilità del modello standard globale

Regione o3-pro, 2025-06-10 codex-mini, 2025-05-16 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 anteprima dell'uso del computer, 11/03/2025 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20
australiaeast - - - - - - - - - - - - - - - - - -
Brasilsud - - - - - - - - - - - - - - - - -
Canada Est - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - -
Germania Ovest Centrale - - - - - - - - - - - - - - - - -
italynorth - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
coreacentral - - - - - - - - - - - - - - - - -
Northcentralus - - - - - - - - - - - - - - -
Norvegia Est - - - - - - - - - - - - - - - - - -
Polonia Centrale - - - - - - - - - - - - - - - - - -
Sudafrica Nord - - - - - - - - - - - - - - - - - -
Southcentralus - - - - - - - - - - - - - - - -
India del Sud - - - - - - - - - - - - - - - - -
Spagna Centrale - - - - - - - - - - - - - - - - -
SveziaCentral - - -
Svizzera settentrionale - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - -
Europa occidentale - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - -

Nota

o1-mini è attualmente disponibile per tutti i clienti per la distribuzione standard globale.

Ai clienti selezionati è stato concesso l'accesso alla distribuzione standard (a livello di area) a o1-mini come parte del rilascio con accesso limitato o1-preview. Al momento, l'accesso alle distribuzioni standard (a livello di area) o1-mini non viene espanso.

Questa tabella non include informazioni dettagliate sulla disponibilità a livello di area. Per queste informazioni, vedere la sezione relativa all'ottimizzazione .

Modelli di distribuzione standard (a livello di area) per endpoint

Completamenti della chat

Regione o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast - - - - - -
Canada Est - - - - - -
eastus -
eastus2 -
francecentral - - - - - -
japaneast - - - - - - -
Northcentralus -
Norvegia Est - - - - - - - -
Southcentralus -
India del Sud - - - - - -
SveziaCentral
Svizzera settentrionale - - - - - - -
uksouth - - - - - -
Europa occidentale - - - - - - - -
westus
westus3 -

Nota

o1-mini è attualmente disponibile per tutti i clienti per la distribuzione standard globale.

Ai clienti selezionati è stato concesso l'accesso alla distribuzione standard (a livello di area) a o1-mini come parte del rilascio con accesso limitato o1-preview. Al momento, l'accesso alle distribuzioni standard (a livello di area) o1-mini non viene espanso.

Disponibilità dei modelli GPT-4 e GPT-4 Turbo

Selezionare l'accesso del cliente

Oltre alle aree precedenti, disponibili per tutti i clienti Di Azure OpenAI, alcuni clienti preesistenti selezionati hanno ottenuto l'accesso alle versioni di GPT-4 in aree aggiuntive:

Modello Regione
gpt-4 (0314)
gpt-4-32k (0314)
Stati Uniti orientali
Francia centrale
Stati Uniti centro-meridionali
Regno Unito meridionale
gpt-4 (0613)
gpt-4-32k (0613)
Stati Uniti orientali
Stati Uniti orientali 2
Giappone orientale
Regno Unito meridionale

Modelli GPT-3.5

Vedere le versioni dei modelli per informazioni su come Azure OpenAI gestisce gli aggiornamenti delle versioni del modello e sull'uso dei modelli per informazioni su come visualizzare e configurare le impostazioni della versione del modello delle distribuzioni GPT-3.5 Turbo.

Ottimizzazione dei modelli

Nota

gpt-35-turbo - L'ottimizzazione di questo modello è limitata a un subset di aree e non è disponibile in ogni area in cui è disponibile il modello di base.

Le aree supportate per l'ottimizzazione possono variare se si usano modelli OpenAI di Azure in un progetto di Azure AI Foundry rispetto all'esterno di un progetto.

ID modello Aree di training standard Formazione globale (anteprima) Richiesta max (token) Dati di training (fino a) Modalità
gpt-35-turbo (1106) Stati Uniti Orientali 2
Stati Uniti centro-settentrionali
Svezia centrale
Svizzera occidentale
- Input: 16.385
Output: 4.096
Settembre 2021 Testo a testo
gpt-35-turbo (0125) Stati Uniti Orientali 2
Stati Uniti centro-settentrionali
Svezia centrale
Svizzera occidentale
- 16.385 Settembre 2021 Testo a testo
gpt-4o-mini (2024-07-18) Stati Uniti centro-settentrionali
Svezia centrale
- Input: 128.000
Output: 16.384
Lunghezza del contesto di training di esempio: 65.536
Ott 2023 Testo a testo
gpt-4o (2024-08-06) Stati Uniti Orientali 2
Stati Uniti centro-settentrionali
Svezia centrale
- Input: 128.000
Output: 16.384
Lunghezza del contesto di training di esempio: 65.536
Ott 2023 Testo e visione artificiale in testo
gpt-4.1 (2025-04-14) Stati Uniti centro-settentrionali
Svezia centrale
Input: 128.000
Output: 16.384
Lunghezza del contesto di training di esempio: 65.536
Maggio 2024 Testo e visione artificiale in testo
gpt-4.1-mini (2025-04-14) Stati Uniti centro-settentrionali
Svezia centrale
Input: 128.000
Output: 16.384
Lunghezza del contesto di training di esempio: 65.536
Maggio 2024 Testo a testo
gpt-4.1-nano (2025-04-14) Stati Uniti centro-settentrionali
Svezia centrale
- Input: 128.000
Output: 16.384
Lunghezza del contesto di esempio di training: 32.768
Maggio 2024 Testo a testo
o4-mini (2025-04-16) Stati Uniti Orientali 2
Svezia centrale
- Input: 128.000
Output: 16.384
Lunghezza del contesto di training di esempio: 65.536
Maggio 2024 Testo a testo

Nota

Il training globale (in anteprima pubblica) offre un training più conveniente per token, ma non offre la residenza dei dati. Attualmente è disponibile per le risorse OpenAI di Azure nelle aree seguenti, con altre aree presto disponibili:

  • Australia orientale
  • Brasile meridionale
  • Stati Uniti orientali
  • Stati Uniti orientali 2
  • Francia centrale
  • Germania centro-occidentale
  • Italia settentrionale
  • Giappone orientale (nessun supporto per la visione)
  • Corea centrale
  • Stati Uniti centro-settentrionali
  • Norvegia orientale
  • Polonia centrale
  • Sud-est asiatico
  • Sudafrica settentrionale
  • Spagna centrale
  • Svezia centrale
  • Svizzera occidentale
  • Svizzera settentrionale
  • Regno Unito meridionale
  • Stati Uniti occidentali
  • Stati Uniti occidentali3

Assistenti (Anteprima)

Per gli assistenti è necessaria la combinazione di un modello supportato e di un'area supportata. Alcuni strumenti e funzionalità richiedono i modelli più recenti. I modelli seguenti sono disponibili nell'API Assistants, nell'SDK e in Azure AI Foundry. La tabella seguente è relativa alla distribuzione standard. Per informazioni sulla disponibilità delle Provisioned Throughput Unit (PTU), vedere provisioned throughput. I modelli e le aree elencati possono essere usati con Assistenti v1 e v2. È possibile usare modelli standard globali se supportati nelle aree elencate di seguito.

Regione gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
australiaeast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Norvegia Est - - - - - - - - - - -
India del Sud - - - - - - - - -
SveziaCentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Ritiro del modello

Per le informazioni più recenti sui ritiri dei modelli, vedere la guida al ritiro del modello.

Passaggi successivi