Modelli del Servizio OpenAI di Azure
Il servizio Azure OpenAI è basato su un set di modelli diversificato con funzionalità e punti di prezzo diversi. La disponibilità del modello varia in base all'area geografica. Per GPT-3 e altri modelli ritirati a luglio 2024, vedere Modelli precedenti del servizio Azure OpenAI.
Modelli | Descrizione |
---|---|
GPT-4 | Set di modelli che migliorano su GPT-3.5 e possono comprendere e generare codice e linguaggio naturale. |
GPT-3.5 | Set di modelli che migliorano su GPT-3 e possono comprendere e generare codice e linguaggio naturale. |
Incorporamenti | Un set di modelli in grado di convertire il testo in formato vettoriale numerico per facilitare la similarità del testo. |
DALL-E | Serie di modelli che possono generare immagini originali dal linguaggio naturale. |
Sussurro | Serie di modelli in anteprima che possono trascrivere e tradurre la voce in testo. |
Sintesi vocale (anteprima) | Serie di modelli in anteprima in grado di sintetizzare il testo in sintesi vocale. |
GPT-4 e GPT-4 Turbo Preview
GPT-4 è un modellomultidimensionale di grandi dimensioni (accettazione di input di testo o immagine e generazione di testo) che può risolvere problemi difficili con maggiore accuratezza rispetto ai modelli precedenti di OpenAI. Come GPT-3.5 Turbo, GPT-4 è ottimizzato per la chat e funziona bene per le attività di completamento tradizionali. Usare l'API Chat Completions per l’utilizzo di GPT-4. Per altre informazioni su come interagire con GPT-4 e l'API Chat Completions, vedere la procedura dettagliata.
GPT-4 Turbo with Vision è la versione di GPT-4 che accetta input di immagine. È disponibile come vision-preview
modello di gpt-4
.
gpt-4
gpt-4-32k
È possibile visualizzare la lunghezza del contesto del token supportata da ogni modello nella tabella di riepilogo del modello.
GPT-3.5
I modelli GPT-3.5 possono comprendere e generare codice o linguaggio naturale. Il modello più efficiente e conveniente in termini di costi della famiglia GPT-3.5 è GPT-3.5 Turbo, ottimizzato per la chat e in grado di funzionare bene anche per le attività di completamento tradizionali. GPT-3.5 Turbo è disponibile per l'uso con l'API Completamento chat. GPT-3.5 Turbo Instruct offre funzionalità simili all'uso text-davinci-003
dell'API Completamento anziché dell'API Completamento chat. È consigliabile usare i modelli GPT-3.5 Turbo e GPT-3.5 Turbo Instruct su modelli GPT-3.5 e GPT-3 legacy.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
È possibile visualizzare la lunghezza del contesto del token supportata da ogni modello nella tabella di riepilogo del modello.
Per altre informazioni su come interagire con GPT-3.5 Turbo e l'API Chat Completions, vedere le procedure dettagliate.
Incorporamenti
text-embedding-3-large
è il modello di incorporamento più recente e più idoneo. L'aggiornamento tra modelli di incorporamento non è possibile. Per passare dall'uso text-embedding-ada-002
a text-embedding-3-large
è necessario generare nuovi incorporamenti.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Nei test, OpenAI segnala sia i modelli di incorporamenti di terza generazione di grandi dimensioni che offrono migliori prestazioni di recupero in più lingue con il benchmark MIRACL mantenendo al tempo stesso le prestazioni per le attività in inglese con il benchmark MTEB .
Benchmark di valutazione | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL average | 31.4 | 44.0 | 54.9 |
Media MTEB | 61.0 | 62,3 | 64.6 |
I modelli di incorporamento di terza generazione supportano la riduzione delle dimensioni dell'incorporamento tramite un nuovo dimensions
parametro. In genere, gli incorporamenti di dimensioni maggiori sono più costosi dal punto di vista di calcolo, memoria e archiviazione. La possibilità di regolare il numero di dimensioni consente un maggiore controllo sui costi e sulle prestazioni complessivi. Il dimensions
parametro non è supportato in tutte le versioni della libreria Python OpenAI 1.x, per sfruttare questo parametro, è consigliabile eseguire l'aggiornamento alla versione più recente: pip install openai --upgrade
.
Il test di benchmark MTEB di OpenAI ha rilevato che anche quando le dimensioni del modello di terza generazione sono ridotte a meno di text-embeddings-ada-002
1.536 dimensioni prestazioni rimangono leggermente migliori.
DALL-E
I modelli DALL-E generano immagini dai prompt di testo forniti dall'utente. DALL-E 3 è disponibile a livello generale per l'uso con le API REST. DALL-E 2 e DALL-E 3 con SDK client sono in anteprima.
Sussurro
I modelli Whisper possono essere usati per la sintesi vocale.
È anche possibile usare il modello Whisper tramite l'API di trascrizione batch di Riconoscimento vocale di Azure. Per altre informazioni sull'uso di Riconoscimento vocale per Voce di Azure AI, vedere Che cos'è il modello Whisper? Servizio OpenAI di Azure.
Sintesi vocale (anteprima)
I modelli openAI di sintesi vocale, attualmente in anteprima, possono essere usati per sintetizzare il testo in voce.
È anche possibile usare il testo OpenAI per le voci vocali tramite Riconoscimento vocale di Intelligenza artificiale di Azure. Per altre informazioni, vedere OpenAI text to speech voices via Azure OpenAI Service o via Azure AI Speech guide (Guida al riconoscimento vocale di Intelligenza artificiale di Azure).
Tabella di riepilogo dei modelli e disponibilità dell'area
Nota
Questo articolo illustra solo la disponibilità di modelli/aree applicabili a tutti i clienti OpenAI di Azure con tipi di distribuzione Standard. Alcuni clienti selezionati hanno accesso alle combinazioni di modelli/aree non elencate nella tabella unificata seguente. Queste tabelle non si applicano anche ai clienti che usano solo i tipi di distribuzione con provisioning che dispongono di una matrice di disponibilità univoca di modello/area geografica. Per altre informazioni sulle distribuzioni con provisioning, vedere le linee guida per il provisioning.
Disponibilità del modello di distribuzione standard
Area | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | babbage-002, 1 | dall-e-3, 3.0 | davinci-002, 1 | tts, 001 | tts-hd, 001 | sussurra, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Stati Uniti centro-meridionali | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
Svezia centrale | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Svizzera settentrionale | ✅ | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Questa tabella non include l'ottimizzazione della disponibilità a livello di area. Per queste informazioni, vedere la sezione dedicata sull'ottimizzazione.
Quota del modello di distribuzione standard
La quota predefinita per i modelli varia in base al modello e all'area. I limiti di quota predefiniti sono soggetti a modifiche.
La quota per le distribuzioni standard è descritta in termini di token al minuto (TPM).
Paese | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | 250 K |
francecentral | 20.000 | 60 K | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
norwayeast | - | - | 150 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
Stati Uniti centro-meridionali | - | - | 80 K | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
Svezia centrale | 40 K | 80 K | 150 K | 30 K | 300 K | 240 K | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K |
Svizzera settentrionale | 40 K | 80 K | - | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K |
uksouth | - | - | 80 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
1 K = 1000 token al minuto (TPM). La relazione tra TPM e Richieste al minuto (RPM) è attualmente definita come 6 RPM per 1000 TPM.
Modelli GPT-4 e GPT-4 Turbo Preview
GPT-4, GPT-4-32k e GPT-4 Turbo with Vision sono ora disponibili per tutti i clienti del servizio Azure OpenAI. La disponibilità dipende dall'area geografica. Se GPT-4 non viene visualizzato nell'area, ricontrollare più tardi.
Questi modelli possono essere usati solo con l'API Chat Completion.
GPT-4 versione 0314 è la prima versione del modello rilasciata. La versione 0613 è la seconda versione del modello e aggiunge il supporto per le chiamate di funzione.
Vedere le versioni dei modelli per informazioni su come il servizio OpenAI di Azure gestisce gli aggiornamenti delle versioni del modello e l'uso dei modelli per informazioni su come visualizzare e configurare le impostazioni della versione del modello delle distribuzioni GPT-4.
Nota
La versione 0314
di gpt-4
e gpt-4-32k
verrà ritirata non prima del 5 luglio 2024. La versione 0613
di gpt-4
e gpt-4-32k
verrà ritirata non prima del 30 settembre 2024. Vedere aggiornamenti del modello per il comportamento di aggiornamento del modello.
GPT-4 versione 0125-preview è una versione aggiornata dell'anteprima GPT-4 Turbo rilasciata in precedenza come versione 1106-preview. GPT-4 versione 0125-preview completa attività come la generazione di codice più completamente rispetto a gpt-4-1106-preview. Per questo motivo, a seconda dell'attività, i clienti potrebbero scoprire che GPT-4-0125-preview genera più output rispetto a gpt-4-1106-preview. È consigliabile che i clienti confrontino gli output del nuovo modello. GPT-4-0125-preview risolve anche bug in gpt-4-1106-preview con la gestione UTF-8 per lingue non inglesi.
Importante
gpt-4
Le versioni 1106-Preview e 0125-Preview verranno aggiornate con una versione stabile digpt-4
in futuro. L'aggiornamento dellagpt-4
distribuzione 1106-Preview agpt-4
0125-Preview pianificato per l'8 marzo 2024 non viene più eseguito. Le distribuzioni dellegpt-4
versioni 1106-Preview e 0125-Preview impostate su "Aggiornamento automatico per impostazione predefinita" e "Aggiornamento quando scaduto" inizieranno ad essere aggiornate dopo il rilascio della versione stabile. Per ogni distribuzione, viene eseguito un aggiornamento della versione del modello senza interruzioni nel servizio per le chiamate API. Gli aggiornamenti vengono gestiti in base all'area e il processo di aggiornamento completo richiederà 2 settimane. Le distribuzioni dellegpt-4
versioni 1106-Preview e 0125-Preview impostate su "Nessun aggiornamento automatico" non verranno aggiornate e smetteranno di funzionare quando la versione di anteprima viene aggiornata nell'area.
Model ID | Richiesta max (token) | Dati di training (fino a) |
---|---|---|
gpt-4 (0314) |
8,192 | Settembre 2021 |
gpt-4-32k (0314) |
32.768 | Settembre 2021 |
gpt-4 (0613) |
8,192 | Settembre 2021 |
gpt-4-32k (0613) |
32.768 | Settembre 2021 |
gpt-4 (1106-Preview)1GPT-4 Turbo Preview |
Input: 128.000 Output: 4.096 |
Apr. 2023 |
gpt-4 (0125-Preview)1GPT-4 Turbo Preview |
Input: 128.000 Output: 4.096 |
Dic. 2023 |
gpt-4 (vision-preview)2GPT-4 Turbo con Vision Preview |
Input: 128.000 Output: 4.096 |
Apr. 2023 |
1 GPT-4 Turbo Preview = gpt-4
(0125-Preview) o gpt-4
(1106-Preview). Per distribuire questo modello, in Distribuzioni selezionare il modello gpt-4. In Versione selezionare (0125-Preview) o (1106-Preview).
2 GPT-4 Turbo con Vision Preview = gpt-4
(vision-preview). Per distribuire questo modello, in Distribuzioni selezionare il modello gpt-4. Per Versione del modello selezionare vision-preview.
Attenzione
Non è consigliabile usare modelli di anteprima nell'ambiente di produzione. Tutte le distribuzioni dei modelli di anteprima verranno aggiornate alle versioni di anteprima future e a una versione stabile. I modelli designati in anteprima non seguono il ciclo di vita standard del modello OpenAI di Azure.
Nota
Le aree in cui GPT-4 (0314) & (0613) sono elencate come disponibili hanno accesso alle versioni 8K e 32K del modello
Disponibilità del modello GPT-4 e GPT-4 Turbo Preview
Aree del cloud pubblico
Area | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4-32k, 0613 |
---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ |
canadaeast | ✅ | ✅ | - | - | ✅ |
eastus | - | - | ✅ | - | - |
eastus2 | - | ✅ | - | - | - |
francecentral | ✅ | ✅ | - | - | ✅ |
japaneast | - | - | - | ✅ | - |
northcentralus | - | - | ✅ | - | - |
norwayeast | - | ✅ | - | - | - |
Stati Uniti centro-meridionali | - | - | ✅ | - | - |
southindia | - | ✅ | - | - | - |
Svezia centrale | ✅ | ✅ | - | ✅ | ✅ |
Svizzera settentrionale | ✅ | - | - | ✅ | ✅ |
uksouth | - | ✅ | ✅ | - | - |
westus | - | ✅ | - | ✅ | - |
Selezionare l'accesso al cliente
Oltre alle aree precedenti, disponibili per tutti i clienti OpenAI di Azure, è stato concesso ad alcuni clienti preesistenti l'accesso alle versioni di GPT-4 in aree aggiuntive:
Modello | Paese |
---|---|
gpt-4 (0314) |
Stati Uniti orientali Francia centrale Stati Uniti centro-meridionali Regno Unito meridionale |
gpt-4 (0613) |
Stati Uniti orientali Stati Uniti orientali 2 Giappone orientale Regno Unito meridionale |
Aree di Azure per enti pubblici
I modelli GPT-4 seguenti sono disponibili con Azure per enti pubblici:
Model ID | Disponibilità del modello |
---|---|
gpt-4 (1106-Preview) |
US Gov Virginia US Gov Arizona |
Modelli GPT-3.5
Importante
Il nuovo gpt-35-turbo (0125)
modello presenta vari miglioramenti, tra cui una maggiore precisione nella risposta nei formati richiesti e una correzione per un bug che ha causato un problema di codifica del testo per le chiamate di funzione non in lingua inglese.
GPT-3.5 Turbo viene usato con l'API di completamento della chat. GPT-3.5 Turbo versione 0301 può essere usato anche con l'API Completamento, anche se questa opzione non è consigliata. GPT-3.5 Turbo versioni 0613 e 1106 supportano solo l'API Completamento chat.
GPT-3.5 Turbo versione 0301 è la prima versione del modello rilasciata. La versione 0613 è la seconda versione del modello e aggiunge il supporto per le chiamate di funzione.
Vedere le versioni dei modelli per informazioni su come il servizio OpenAI di Azure gestisce gli aggiornamenti delle versioni del modello e l'uso dei modelli per informazioni su come visualizzare e configurare le impostazioni della versione del modello delle distribuzioni GPT-3.5 Turbo.
Nota
La versione 0613
di gpt-35-turbo
e gpt-35-turbo-16k
verrà ritirata non prima del 1° agosto 2024. La versione 0301
di gpt-35-turbo
verrà ritirata non prima del 1° agosto 2024. Vedere aggiornamenti del modello per il comportamento di aggiornamento del modello.
Model ID | Richiesta max (token) | Dati di training (fino a) |
---|---|---|
gpt-35-turbo 1 (0301) |
4.096 | Settembre 2021 |
gpt-35-turbo (0613) |
4.096 | Settembre 2021 |
gpt-35-turbo-16k (0613) |
16,384 | Settembre 2021 |
gpt-35-turbo-instruct (0914) |
4.097 | Settembre 2021 |
gpt-35-turbo (1106) |
Input: 16.385 Output: 4.096 |
Settembre 2021 |
gpt-35-turbo (0125) NUOVO |
Input: 16.385 Output: 4.096 |
Settembre 2021 |
Disponibilità del modello GPT-3.5-Turbo
Aree del cloud pubblico
Area | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
Stati Uniti centro-meridionali | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
Svezia centrale | - | ✅ | ✅ | - | ✅ | ✅ |
Svizzera settentrionale | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Questo modello accetterà le richieste > di 4.096 token. Non è consigliabile superare il limite di 4.096 token di input perché la versione più recente del modello è limitata a 4.096 token. Se si verificano problemi quando si superano 4.096 token di input con questo modello questa configurazione non è ufficialmente supportata.
Aree di Azure per enti pubblici
I modelli turbo GPT-3.5 seguenti sono disponibili con Azure per enti pubblici:
Model ID | Disponibilità del modello |
---|---|
gpt-35-turbo (1106-Preview) |
US Gov Virginia |
Incorporamento di modelli
Questi modelli possono essere usati solo con le richieste API di incorporamento.
Nota
text-embedding-3-large
è il modello di incorporamento più recente e più idoneo. L'aggiornamento tra modelli di incorporamento non è possibile. Per eseguire la migrazione dall'uso text-embedding-ada-002
a text-embedding-3-large
è necessario generare nuovi incorporamenti.
Model ID | Richiesta max (token) | Dimensioni di output | Dati di training (up-to) |
---|---|---|---|
text-embedding-ada-002 (versione 2) |
8.191 | 1.536 | Settembre 2021 |
text-embedding-ada-002 (versione 1) |
2.046 | 1.536 | Settembre 2021 |
text-embedding-3-large |
8.191 | 3.072 | Settembre 2021 |
text-embedding-3-small |
8.191 | 1.536 | Settembre 2021 |
Nota
Quando si invia una matrice di input per l'incorporamento, il numero massimo di elementi di input nella matrice per chiamata all'endpoint di incorporamento è 2048.
Aree del cloud pubblico
Area | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
Stati Uniti centro-meridionali | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
Svezia centrale | - | ✅ | - | - |
Svizzera settentrionale | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Aree di Azure per enti pubblici
I modelli di incorporamento seguenti sono disponibili con Azure per enti pubblici:
Model ID | Disponibilità del modello |
---|---|
text-embedding-ada-002 (versione 2) |
US Gov Virginia US Gov Arizona |
Modelli DALL-E
Model ID | Disponibilità della funzionalità | Richiesta max (caratteri) |
---|---|---|
dalle2 (anteprima) | Stati Uniti orientali | 1.000 |
dall-e-3 | Stati Uniti orientali, Australia orientale, Svezia centrale | 4.000 |
Ottimizzazione dei modelli
babbage-002
e davinci-002
non sono sottoposti a training per seguire le istruzioni. L'esecuzione di query su questi modelli di base deve essere eseguita solo come punto di riferimento a una versione ottimizzata per valutare lo stato di avanzamento del training.
gpt-35-turbo
- L'ottimizzazione di questo modello è limitata a un subset di aree e non è disponibile in ogni area in cui è disponibile il modello di base.
Model ID | Ottimizzazione delle aree | Richiesta max (token) | Dati di training (fino a) |
---|---|---|---|
babbage-002 |
Stati Uniti centro-settentrionali Svezia centrale Svizzera occidentale |
16,384 | Settembre 2021 |
davinci-002 |
Stati Uniti centro-settentrionali Svezia centrale Svizzera occidentale |
16,384 | Settembre 2021 |
gpt-35-turbo (0613) |
Stati Uniti orientali 2 Stati Uniti centro-settentrionali Svezia centrale Svizzera occidentale |
4.096 | Settembre 2021 |
gpt-35-turbo (1106) |
Stati Uniti orientali 2 Stati Uniti centro-settentrionali Svezia centrale Svizzera occidentale |
Input: 16.385 Output: 4.096 |
Settembre 2021 |
gpt-35-turbo (0125) |
Stati Uniti orientali 2 Stati Uniti centro-settentrionali Svezia centrale Svizzera occidentale |
16,385 | Settembre 2021 |
Sussurrare modelli
Model ID | Disponibilità del modello | Richiesta massima (dimensioni file audio) |
---|---|---|
whisper |
Stati Uniti orientali 2 Stati Uniti centro-settentrionali Norvegia orientale India meridionale Svezia centrale Europa occidentale |
25 MB |
Modelli di sintesi vocale (anteprima)
Model ID | Disponibilità del modello |
---|---|
tts-1 |
Stati Uniti centro-settentrionali Svezia centrale |
tts-1-hd |
Stati Uniti centro-settentrionali Svezia centrale |
Assistenti (anteprima)
Per gli assistenti è necessaria una combinazione di un modello supportato e di un'area supportata. Alcuni strumenti e funzionalità richiedono i modelli più recenti. I modelli seguenti sono disponibili nell'API Assistants, SDK, Azure AI Studio e Azure OpenAI Studio. La tabella seguente è relativa al pagamento in base al consumo. Per informazioni sulla disponibilità PTU (Provisioned Throughput Unit), vedere Provisioning della velocità effettiva.
Paese | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Australia orientale | ✅ | ✅ | ✅ | ✅ | |
Stati Uniti orientali | ✅ | ✅ | |||
Stati Uniti orientali 2 | ✅ | ✅ | ✅ | ||
Francia centrale | ✅ | ✅ | ✅ | ✅ | |
Norvegia orientale | ✅ | ||||
Svezia centrale | ✅ | ✅ | ✅ | ✅ | |
Regno Unito meridionale | ✅ | ✅ | ✅ | ✅ |