Novità del servizio OpenAI di Azure

Articolo
05/01/2024

Questo articolo fornisce un riepilogo delle versioni più recenti e degli aggiornamenti principali della documentazione per Azure OpenAI.

Maggio 2024

Disponibilità generale del modello GPT-4 Turbo (GA)

La versione ga più recente di GPT-4 Turbo è:

gpt-4Versioneturbo-2024-04-09:

Questa è la sostituzione dei modelli di anteprima seguenti:

gpt-4Versione1106-Preview:
gpt-4Versione0125-Preview:
gpt-4Versionevision-preview:

Differenze tra i modelli OpenAI e Azure OpenAI GPT-4 Turbo GA

La versione di OpenAI del modello turbo più recente 0409 supporta la modalità JSON e la chiamata di funzione per tutte le richieste di inferenza.
La versione di Azure OpenAI dell'ultima versione turbo-2024-04-09 attualmente non supporta l'uso della modalità JSON e della chiamata di funzione quando si effettuano richieste di inferenza con input di immagine (visione). Le richieste di input basate su testo (richieste senza image_url immagini inline) supportano la modalità JSON e la chiamata a funzioni.

Differenze rispetto a gpt-4 vision-preview

L'integrazione dei miglioramenti specifici di Visione artificiale di Azure con GPT-4 Turbo con Vision non è supportata per gpt-4Version:turbo-2024-04-09. Sono inclusi il riconoscimento ottico dei caratteri (OCR), il grounding degli oggetti, le richieste video e una migliore gestione dei dati con le immagini.

Disponibilità gestita con provisioning GPT-4 Turbo

gpt-4Versione:turbo-2024-04-09 è disponibile sia per le distribuzioni standard che per le distribuzioni con provisioning. Attualmente la versione di cui è stato effettuato il provisioning di questo modello non supporta le richieste di inferenza di immagini/visione. Le distribuzioni con provisioning di questo modello accettano solo input di testo. Le distribuzioni di modelli standard accettano richieste di inferenza di testo e immagine/visione.

Aree di disponibilità

Per informazioni sulla disponibilità a livello di area del modello, vedere la matrice del modello per le distribuzioni standard e con provisioning.

Distribuzione di GPT-4 Turbo con Vision GA

Per distribuire il modello ga dall'interfaccia utente di Studio, selezionare GPT-4 e quindi scegliere la turbo-2024-04-09 versione dal menu a discesa. La quota predefinita per il gpt-4-turbo-2024-04-09 modello sarà la stessa della quota corrente per GPT-4-Turbo. Vedere i limiti di quota a livello di area.

Aprile 2024

L'ottimizzazione è ora supportata in due nuove aree Stati Uniti orientali 2 e Svizzera occidentale

L'ottimizzazione è ora disponibile con il supporto per:

Stati Uniti orientali 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Svizzera occidentale

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Controllare la pagina dei modelli per ottenere le informazioni più recenti sulla disponibilità del modello e sul supporto per l'ottimizzazione in ogni area.

Esempi di training di chat a più turni

L'ottimizzazione supporta ora esempi di training di chat a più turni.

GPT-4 (0125) è disponibile per Azure OpenAI sui dati

È ora possibile usare il modello GPT-4 (0125) nelle aree disponibili con Azure OpenAI sui dati.

Marzo 2024

Rischi e monitoraggio Cassaforte ty in Azure OpenAI Studio

Azure OpenAI Studio offre ora un dashboard Rischi e Cassaforte ty per ognuna delle distribuzioni che usa una configurazione del filtro contenuto. Usarlo per controllare i risultati dell'attività di filtro. È quindi possibile modificare la configurazione del filtro per soddisfare meglio le esigenze aziendali e soddisfare i principi di IA responsabile.

Usare il monitoraggio di rischi e Cassaforte ty

Azure OpenAI sugli aggiornamenti dei dati

È ora possibile connettersi a un database vettoriale elasticsearch da usare con Azure OpenAI sui dati.
È possibile usare il parametro dimensione blocco durante l'inserimento dati per impostare il numero massimo di token di qualsiasi blocco di dati specificato nell'indice.

API disponibile a livello generale (GA) 2024-024

Questa è la versione più recente dell'API GA ed è la sostituzione della versione ga precedente 2023-05-15 . Questa versione aggiunge il supporto per le funzionalità di Disponibilità generale di Azure OpenAI più recenti, ad esempio Whisper, DALLE-3, ottimizzazione, sui dati e così via.

Le funzionalità ancora in anteprima, ad esempio Assistants, text to speech (TTS), determinate nelle origini dati dei dati, richiedono comunque una versione dell'API di anteprima. Per altre informazioni, vedere la guida al ciclo di vita della versione dell'API.

Sussurrare la disponibilità generale (GA)

Il modello Di sintesi vocale Sussurra è ora disponibile a livello generale sia per REST che per Python. Gli SDK della libreria client sono attualmente ancora in anteprima pubblica.

Provare Whisper seguendo una guida introduttiva.

Disponibilità generale DALL-E 3 (GA)

Il modello di generazione di immagini DALL-E 3 è ora disponibile a livello generale sia per REST che per Python. Gli SDK della libreria client sono attualmente ancora in anteprima pubblica.

Provare DALL-E 3 seguendo una guida introduttiva.

Nuovo supporto regionale per DALL-E 3

È ora possibile accedere a DALL-E 3 con una risorsa OpenAI di Azure nell'area East US o AustraliaEast in aggiunta a SwedenCentral.

Deprecazione e ritiri del modello

È stata aggiunta una pagina per tenere traccia delle deprecazioni e dei ritiri del modello nel servizio Azure OpenAI. Questa pagina fornisce informazioni sui modelli attualmente disponibili, deprecati e ritirati.

API 2024-03-01-preview rilasciata

2024-03-01-preview ha tutte le stesse funzionalità di 2024-02-15-preview e aggiunge due nuovi parametri per gli incorporamenti:

encoding_format consente di specificare il formato per generare incorporamenti in floato base64. Il valore predefinito è float.
dimensions consente di impostare il numero di incorporamenti di output. Questo parametro è supportato solo con i modelli di incorporamento di nuova generazione: text-embedding-3-large, text-embedding-3-small. In genere, gli incorporamenti di dimensioni maggiori sono più costosi dal punto di vista di calcolo, memoria e archiviazione. La possibilità di regolare il numero di dimensioni consente un maggiore controllo sui costi e sulle prestazioni complessivi. Il dimensions parametro non è supportato in tutte le versioni della libreria Python OpenAI 1.x, per sfruttare questo parametro, è consigliabile eseguire l'aggiornamento alla versione più recente: pip install openai --upgrade.

Se attualmente si usa una versione dell'API di anteprima per sfruttare le funzionalità più recenti, è consigliabile consultare l'articolo relativo al ciclo di vita della versione dell'API per tenere traccia del tempo di supporto della versione dell'API corrente.

Aggiornamento ai piani di aggiornamento GPT-4-1106-Preview

L'aggiornamento della gpt-4 distribuzione 1106-Preview a gpt-4 0125-Preview pianificato per l'8 marzo 2024 non viene più eseguito. Le distribuzioni delle gpt-4 versioni 1106-Preview e 0125-Preview impostate su "Aggiornamento automatico per impostazione predefinita" e "Aggiorna alla scadenza" inizieranno a essere aggiornate dopo il rilascio di una versione stabile del modello.

Per altre informazioni sul processo di aggiornamento, vedere la pagina dei modelli.

Febbraio 2024

Modello GPT-3.5-turbo-0125 disponibile

Questo modello presenta vari miglioramenti, tra cui una maggiore precisione nella risposta nei formati richiesti e una correzione per un bug che ha causato un problema di codifica del testo per le chiamate di funzione non in lingua inglese.

Per informazioni sulla disponibilità e gli aggiornamenti a livello di area del modello, vedere la pagina dei modelli.

Modelli di incorporamento di terza generazione disponibili

text-embedding-3-large
text-embedding-3-small

Nei test, OpenAI segnala sia i modelli di incorporamenti di terze dimensioni che quelli di terza generazione offrono prestazioni migliori per il recupero in più lingue con il benchmark MIRACL , mantenendo al tempo stesso prestazioni migliori per le attività in inglese con il benchmark MTEB rispetto al modello text-embedding-ada-002 di seconda generazione.

Per informazioni sulla disponibilità e gli aggiornamenti a livello di area del modello, vedere la pagina dei modelli.

Consolidamento delle quote turbo GPT-3.5

Per semplificare la migrazione tra versioni diverse dei modelli GPT-3.5-Turbo (incluso 16k), verrà consolidata tutta la quota GPT-3.5-Turbo in un singolo valore di quota.

Tutti i clienti che hanno aumentato la quota approvata avranno una quota totale combinata che riflette gli aumenti precedenti.
Qualsiasi cliente il cui utilizzo totale corrente tra le versioni del modello è inferiore al valore predefinito otterrà una nuova quota totale combinata per impostazione predefinita.

Modello GPT-4-0125-preview disponibile

La versione 0125-preview del gpt-4 modello è ora disponibile nel servizio Azure OpenAI nelle aree Stati Uniti orientali, Stati Uniti centro-settentrionali e Stati Uniti centro-meridionali. I clienti con distribuzioni di gpt-4 versione 1106-preview verranno aggiornati automaticamente a 0125-preview nelle prossime settimane.

Per informazioni sulla disponibilità e gli aggiornamenti a livello di area del modello, vedere la pagina dei modelli.

Anteprima pubblica dell'API Assistants

Azure OpenAI supporta ora l'API che supporta i criteri di gruppo di OpenAI. Gli assistenti OpenAI di Azure (anteprima) consentono di creare assistenti di intelligenza artificiale personalizzati in base alle proprie esigenze tramite istruzioni personalizzate e strumenti avanzati come l'interprete del codice e le funzioni personalizzate. Per altre informazioni, vedere:

Anteprima pubblica del testo OpenAI per le voci vocali

Il servizio OpenAI di Azure supporta ora le API di sintesi vocale con le voci di OpenAI. Ottenere il riconoscimento vocale generato dall'intelligenza artificiale dal testo fornito. Per altre informazioni, vedere la guida alla panoramica e provare la guida introduttiva.

Nota

Riconoscimento vocale di Azure per intelligenza artificiale supporta anche il testo OpenAI per le voci vocali. Per altre informazioni, vedere OpenAI text to speech voices via Azure OpenAI Service o via Azure AI Speech guide (Guida al riconoscimento vocale di Intelligenza artificiale di Azure).

Nuove funzionalità di ottimizzazione e supporto del modello

Nuovo supporto a livello di area per Azure OpenAI sui dati

È ora possibile usare Azure OpenAI nei dati nell'area di Azure seguente:

Sudafrica settentrionale

Disponibilità generale di Azure OpenAI sui dati

Azure OpenAI nei dati è ora disponibile a livello generale.

Dicembre 2023

Azure OpenAI sui dati

Supporto completo della VPN e dell'endpoint privato per Azure OpenAI sui dati, incluso il supporto per la sicurezza per gli account di archiviazione, le risorse OpenAI di Azure e le risorse di Azure AI servizio di ricerca.
Nuovo articolo per l'uso di Azure OpenAI sui dati in modo sicuro proteggendo i dati con reti virtuali ed endpoint privati.

GPT-4 Turbo con Visione ora disponibile

GPT-4 Turbo con Visione nel servizio Azure OpenAI è ora disponibile in anteprima pubblica. GPT-4 Turbo with Vision è un grande modello granulare (LMM) sviluppato da OpenAI che può analizzare le immagini e fornire risposte testuali a domande su di essi. Incorpora sia l'elaborazione del linguaggio naturale che la comprensione visiva. Con la modalità avanzata, è possibile usare le funzionalità di Visione artificiale di Azure per generare informazioni aggiuntive dalle immagini.

Esplorare le funzionalità di GPT-4 Turbo con Visione in un'esperienza senza codice usando Azure OpenAI Playground. Per altre informazioni, vedere la Guida introduttiva.
Il miglioramento della visione con GPT-4 Turbo con Visione è ora disponibile in Azure OpenAI Playground e include il supporto per il riconoscimento ottico dei caratteri, il supporto dell'oggetto, il supporto delle immagini per "aggiungere i dati" e il supporto per la richiesta video.
Effettuare chiamate all'API di chat direttamente usando l'API REST.
La disponibilità dell'area è attualmente limitata a SwitzerlandNorth, SwedenCentralWestUS, eAustraliaEast
Altre informazioni sulle limitazioni note di GPT-4 Turbo con Visione e altre domande frequenti.

Novembre 2023

Supporto di una nuova origine dati in Azure OpenAI nei dati

È ora possibile usare Azure Cosmos DB per vCore MongoDB, nonché URL/indirizzi Web come origini dati per inserire i dati e chattare con un modello OpenAI di Azure supportato.

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 rilasciato

Entrambi i modelli sono la versione più recente di OpenAI con istruzioni migliorate seguenti, modalità JSON, output riproducibile e chiamata di funzioni parallele.

GPT-4 Turbo Preview ha una finestra di contesto massima di 128.000 token e può generare 4.096 token di output. Ha i dati di training più recenti con conoscenze fino ad aprile 2023. Questo modello è in anteprima e non è consigliato per l'uso in produzione. Tutte le distribuzioni di questo modello di anteprima verranno aggiornate automaticamente dopo che la versione stabile diventa disponibile.
GPT-3.5-Turbo-1106 ha una finestra di contesto massima di 16.385 token e può generare 4.096 token di output.

Per informazioni sulla disponibilità a livello di area del modello, vedere la pagina dei modelli.

I modelli hanno allocazioni di quote univoche per area.

Anteprima pubblica DALL-E 3

DALL-E 3 è il modello di generazione di immagini più recente di OpenAI. Offre una qualità avanzata delle immagini, scene più complesse e prestazioni migliorate durante il rendering del testo nelle immagini. Include anche altre opzioni relative alle proporzioni. DALL-E 3 è disponibile tramite OpenAI Studio e tramite l'API REST. La risorsa OpenAI deve trovarsi nell'area di SwedenCentral Azure.

DALL-E 3 include la riscrittura dei prompt predefinita per migliorare le immagini, ridurre la distorsione e aumentare la variazione naturale.

Provare DALL-E 3 seguendo una guida introduttiva.

Intelligenza artificiale responsabile

Configurabilità dei clienti espansa: tutti i clienti OpenAI di Azure possono ora configurare tutti i livelli di gravità (basso, medio, alto) per le categorie odio, violenza, violenza, sesso e autolesionismo, incluso il filtro solo di contenuti con gravità elevata. Configurare i filtri di contenuto
Credenziali del contenuto in tutti i modelli DALL-E: le immagini generate dall'intelligenza artificiale da tutti i modelli DALL-E ora includono credenziali digitali che rivelano il contenuto come generato dall'intelligenza artificiale. Le applicazioni che visualizzano gli asset di immagine possono sfruttare l'SDK open source Content Authenticity Initiative per visualizzare le credenziali nelle immagini generate dall'intelligenza artificiale. Credenziali del contenuto in Azure OpenAI
Nuovi modelli RAI
- Rilevamento dei rischi jailbreak: gli attacchi Jailbreak sono richieste utente progettate per provocare il modello di intelligenza artificiale generativa in comportamenti esposti che è stato addestrato per evitare o per interrompere le regole impostate nel messaggio di sistema. Il modello di rilevamento dei rischi jailbreak è facoltativo (disattivato per impostazione predefinita) e disponibile in annotazioni e modello di filtro. Viene eseguito alle richieste degli utenti.
- Testo materiale protetto: il testo del materiale protetto descrive il contenuto di testo noto (ad esempio, testi di canzoni, articoli, ricette e contenuto Web selezionato) che possono essere restituiti da modelli linguistici di grandi dimensioni. Il modello di testo del materiale protetto è facoltativo (disattivato per impostazione predefinita) e disponibile nelle annotazioni e nel modello di filtro. Viene eseguito sui completamenti LLM.
- Codice materiale protetto: il codice materiale protetto descrive il codice sorgente che corrisponde a un set di codice sorgente da repository pubblici, che possono essere restituiti da modelli di linguaggio di grandi dimensioni senza una corretta citazione dei repository di origine. Il modello di codice materiale protetto è facoltativo (disattivato per impostazione predefinita) e disponibile in annotazioni e modelli di filtro. Viene eseguito sui completamenti LLM.
Configurare i filtri di contenuto
Elenchi di blocchi: i clienti possono ora personalizzare rapidamente il comportamento del filtro del contenuto per richieste e completamenti creando un elenco di blocchi personalizzato nei relativi filtri. L'elenco di blocchi personalizzato consente al filtro di intervenire su un elenco personalizzato di modelli, ad esempio termini specifici o modelli regex. Oltre agli elenchi di blocchi personalizzati, viene fornito un elenco di blocchi di contenuto volgare Microsoft (inglese). Usare elenchi di blocchi

Ottobre 2023

Nuovi modelli di ottimizzazione (anteprima)

gpt-35-turbo-0613 è ora disponibile per l'ottimizzazione.
babbage-002 e davinci-002 sono ora disponibili per l'ottimizzazione. Questi modelli sostituiscono i modelli di base legacy ada, babbage, marie e davinci disponibili in precedenza per l'ottimizzazione.
La disponibilità di ottimizzazione è limitata a determinate aree. Controllare la pagina modelli per ottenere le informazioni più recenti sulla disponibilità di modelli in ogni area.
I modelli ottimizzati hanno limiti di quota diversi rispetto ai modelli regolari.
Esercitazione: ottimizzazione di GPT-3.5-Turbo

Azure OpenAI sui dati

Nuovi parametri personalizzati per determinare il numero di documenti recuperati e rigidità.
- L'impostazione di rigidità imposta la soglia per classificare i documenti come rilevanti per le query.
- L'impostazione documenti recuperati specifica il numero di documenti con punteggio superiore dall'indice dati usato per generare risposte.
È possibile visualizzare lo stato di inserimento/caricamento dei dati in Azure OpenAI Studio.
Supporto per endpoint privati e VPN per i contenitori BLOB.

Settembre 2023

GPT-4

GPT-4 e GPT-4-32k sono ora disponibili per tutti i clienti del servizio Azure OpenAI. I clienti non devono più richiedere che l'elenco di attesa usi GPT-4 e GPT-4-32k (i requisiti di registrazione accesso limitato continuano a essere applicati per tutti i modelli OpenAI di Azure). La disponibilità può variare in base all'area. Controllare la pagina modelli per ottenere le informazioni più recenti sulla disponibilità di modelli in ogni area.

GPT-3.5 Turbo Instruct

Il servizio Azure OpenAI supporta ora il modello GPT-3.5 Turbo Instruct. Questo modello offre prestazioni paragonabili a text-davinci-003 ed è disponibile per l'uso con l'API Completamenti. Controllare la pagina modelli per ottenere le informazioni più recenti sulla disponibilità di modelli in ogni area.

Anteprima pubblica di Whisper

Il servizio OpenAI di Azure supporta ora le API Di riconoscimento vocale basate sul modello Whisper di OpenAI. Ottenere testo generato dall'intelligenza artificiale in base all'audio vocale fornito. Per altre informazioni, vedere guida introduttiva.

Nota

Riconoscimento vocale di Azure per intelligenza artificiale supporta anche il modello Whisper di OpenAI tramite l'API di trascrizione batch. Per altre informazioni, vedere la guida Creare una trascrizione batch. Per altre informazioni sull'uso di Riconoscimento vocale per Voce di Azure AI, vedere Che cos'è il modello Whisper? Servizio OpenAI di Azure.

Nuove aree

Azure OpenAI è ora disponibile anche nelle aree Svezia centrale e Svizzera settentrionale. Controllare la pagina modelli per ottenere le informazioni più recenti sulla disponibilità di modelli in ogni area.

Aumenti dei limiti di quota a livello di area

Aumenta fino ai limiti di quota predefiniti massimi per determinati modelli e aree. La migrazione dei carichi di lavoro a questi modelli e aree consente di sfruttare i vantaggi dei token più elevati al minuto (TPM).

Agosto 2023

Aggiornamenti di Azure OpenAI sui propri dati (anteprima)

È ora possibile distribuire Azure OpenAI nei dati in Power Virtual Agents.
Azure OpenAI on Your Data supporta ora endpoint privati.
Possibilità di filtrare l'accesso ai documenti sensibili.
Aggiornare automaticamente l'indice in base a una pianificazione.
Opzioni di ricerca vettoriale e ricerca semantica.
Visualizzare la cronologia delle chat nell'app Web distribuita

Luglio 2023

Supporto per la chiamata di funzioni

Azure OpenAI supporta ora la chiamata alle funzioni per consentire l'uso di funzioni nell'API di completamento della chat.

Aumento della matrice di input di incorporamento

Azure OpenAI supporta ora matrici con un massimo di 16 input per richiesta API con text-embedding-ada-002 Versione 2.

Nuove aree

Azure OpenAI è ora disponibile anche nelle aree Canada orientale, Stati Uniti orientali 2, Giappone orientale e Stati Uniti centro-settentrionali. Controllare la pagina modelli per ottenere le informazioni più recenti sulla disponibilità di modelli in ogni area.

Giugno 2023

Usare OpenAI di Azure per i propri dati (anteprima)

Azure OpenAI On Your Data è ora disponibile in anteprima, consentendo di chattare con modelli OpenAI come GPT-35-Turbo e GPT-4 e ricevere risposte in base ai dati.

Nuove versioni dei modelli gpt-35-turbo e gpt-4

gpt-35-turbo (versione 0613)
gpt-35-turbo-16k (versione 0613)
gpt-4 (versione 0613)
gpt-4-32k (versione 0613)

Regno Unito meridionale

Azure OpenAI è ora disponibile nell'area Regno Unito meridionale. Controllare la pagina modelli per ottenere le informazioni più recenti sulla disponibilità di modelli in ogni area.

Filtro del contenuto e annotazioni (anteprima)

Come configurare filtri di contenuto con il servizio OpenAI di Azure.
Abilitare le annotazioni per visualizzare le informazioni sulla categoria e sulla rigorosità dei filtri come parte delle chiamate di Completamento e Completamento della chat basate su GPT.

Obiettivo di vendita

La quota offre la flessibilità necessaria per gestire attivamente l'allocazione dei limiti di frequenza tra le distribuzioni all'interno della propria sottoscrizione.

Maggio 2023

Supporto per Java & JavaScript SDK

NUOVI SDK di anteprima di Azure OpenAI che offrono supporto per JavaScript e Java.

Disponibilità generale (GA) del completamento della chat OpenAI di Azure

Supporto di disponibilità generale per:
- API Completamento chat versione 2023-05-15.
- Modelli GPT-35-Turbo.
- Serie di modelli GPT-4.

Se si sta attualmente usando l'API 2023-03-15-preview, è consigliabile eseguire la migrazione all'API di disponibilità generale 2023-05-15. Se si usa la versione 2022-12-01 dell'API, questa rimane disponibile a livello generale, ma non include le funzionalità di Completamento della chat più recenti.

Importante

L'uso delle versioni correnti dei modelli GPT-35-Turbo con l'endpoint di completamento rimane in anteprima.

Francia centrale

Azure OpenAI è ora disponibile nell'area Francia centrale. Controllare la pagina modelli per ottenere le informazioni più recenti sulla disponibilità di modelli in ogni area.

Aprile 2023

Anteprima pubblica di DALL-E 2. Il servizio Azure OpenAI supporta ora le API di generazione di immagini basate sul modello DALL-E 2 di OpenAI. Ottenere immagini generate dall'intelligenza artificiale in base al testo descrittivo fornito. Per ulteriori informazioni, consultare la guida introduttiva. I clienti di OpenAI di Azure esistenti possono richiedere l’accesso compilando questo modulo.
Le distribuzioni inattive di modelli personalizzati verranno ora eliminate dopo 15 giorni; i modelli rimarranno disponibili per la ridistribuzione. Se un modello personalizzato (ottimizzato) viene distribuito per più di quindici (15) giorni, durante i quali non vengono effettuati completamenti o chiamate di completamento della chat, la distribuzione verrà eliminata automaticamente (e non ci saranno ulteriori per l'hosting per tale distribuzione). Il modello personalizzato sottostante rimarrà disponibile e potrà essere ridistribuito in qualsiasi momento. Per ulteriori informazioni, consultare l'articolo di istruzioni.

Marzo 2023

I modelli della serie GPT-4 sono ora disponibili in anteprima in Azure OpenAI. I clienti di Azure OpenAI esistenti possono richiedere l’accesso compilando questo modulo. Questi modelli sono attualmente disponibili nelle aree Stati Uniti orientali e Stati Uniti centro-meridionali.
Nuova API di completamento della chat per i modelli GPT-35-Turbo e GPT-4 rilasciata in anteprima il 3/21. Per ulteriori informazioni, consultare le guide introduttive aggiornate e l’articolo di istruzioni.
Anteprima GPT-35-Turbo. Per ulteriori informazioni, consultare l'articolo di istruzioni.
Aumento dei limiti di training per l'ottimizzazione: la dimensione massima del processo di training (token nel file di training) x (# di periodi) è di 2 miliardi di token per tutti i modelli. Abbiamo anche aumentato il massimo lavoro di training da 120 a 720 ore.
Aggiunta di ulteriori casi d'uso all'accesso esistente. In precedenza, il processo di aggiunta di nuovi casi d'uso richiedeva ai clienti di fare nuovamente domanda per il servizio. Verrà ora rilasciato un nuovo processo che consente di aggiungere rapidamente nuovi casi d'uso all'uso del servizio. Questo processo segue il processo di accesso limitato stabilito nei servizi di intelligenza artificiale di Azure. I clienti esistenti possono confermare qui tutti i nuovi casi d'uso. Notare che questa operazione è necessaria ogni volta che si voglia utilizzare il servizio per un nuovo caso d'uso per cui non è stata fatta originariamente richiesta.

2023 febbraio

Nuove funzionalità

Campioni di versione di anteprima | di .NET SDK(inference)
Aggiornamento di Terraform SDK per supportare le operazioni di gestione di Azure OpenAI.
L'inserimento di testo alla fine di un completamento è ora supportato con il parametro suffix.

Aggiornamenti

Il filtro del contenuto è attivato per impostazione predefinita.

Nuovi articoli su:

Nuovo corso di formazione:

Introduzione ad Azure OpenAI

Gennaio 2023

Nuove funzionalità

Disponibilità generale del servizio. Il servizio OpenAI di Azure è ora disponibile a livello generale.
Nuovi modelli: aggiunta del modello di testo più recente, text-davinci-003 (Stati Uniti orientali, Europa occidentale), text-ada-embeddings-002 (Stati Uniti orientali, Stati Uniti centro-meridionali, Europa occidentale)

Dicembre 2022

Nuove funzionalità

I modelli più recenti di OpenAI. Azure OpenAI consente di accedere a tutti i modelli più recenti, inclusa la serie GPT-3.5.
Nuova versione dell'API (2022-12-01). Questo aggiornamento include diversi miglioramenti richiesti, tra cui le informazioni sull'utilizzo dei token nella risposta API, i messaggi di errore migliorati per i file, l'allineamento con OpenAI sull’ottimizzazione della struttura dei dati di creazione e il supporto per il parametro suffisso per consentire la denominazione personalizzata dei processi ottimizzati.
Limiti di richiesta al secondo più elevati. 50 per i modelli non Davinci. 20 per i modelli Davinci
Ottimizzare le distribuzioni più rapidamente. Distribuire modelli ottimizzati per Ada e Marie in meno di 10 minuti.
Limiti di training più elevati: token di training di 40M per Ada, Babbage e Marie. 10M per Davinci.
Processo per richiedere modifiche all'abuso e alla registrazione dei dati di utilizzo non usato e revisione umana. Attualmente, il servizio registra i dati di richiesta/risposta al fine di rilevare abusi e uso improprio per garantire che questi modelli avanzati non vengano usati impropriamente. Tuttavia, molti clienti hanno requisiti rigorosi di privacy e sicurezza dei dati che richiedono un maggiore controllo sui dati. Per supportare questi casi d'uso, sarà rilasciato un nuovo processo perché i clienti possano modificare i criteri di filtro dei contenuti o disattivare la registrazione degli abusi per i casi d'uso a basso rischio. Questo processo segue il processo di accesso limitato stabilito nei servizi di intelligenza artificiale di Azure e i clienti OpenAI esistenti possono essere applicati qui.
Crittografia della chiave gestita dal cliente (CMK). CMK offre ai clienti un maggiore controllo sulla gestione dei dati in Azure OpenAI fornendo le sue chiavi di crittografia usate per archiviare i dati di training e i modelli personalizzati. Le chiavi gestite dal cliente, note anche come Bring Your Own Key (BYOK), offrono maggiore flessibilità per creare, ruotare, disabilitare e revocare i controlli di accesso. È anche possibile controllare le chiavi di crittografia usate per proteggere i dati. Per ulteriori informazioni, consultare la documentazione relativa alla crittografia in inattività.
Supporto di Lockbox
Conformità SOC-2
Registrazione e diagnostica tramite azure Integrità risorse, analisi dei costi e metriche e impostazioni di diagnostica.
Miglioramenti di Studio. Numerosi miglioramenti dell'usabilità del flusso di lavoro di Studio, incluso il supporto del ruolo di Azure AD per controllare quali membri del team abbiano accesso alla la creazione di modelli ottimizzati e la distribuzione.

Modifiche (interruzione)

L’ottimizzazione della richiesta di creazione API è stata aggiornata in modo che corrisponda allo schema di OpenAI.

Versioni dell'API di anteprima:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

API versione 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

Il filtro del contenuto è temporaneamente disattivato per impostazione predefinita. La con modalità tenda razione di Azure funziona in modo diverso rispetto ad Azure OpenAI. Azure OpenAI esegue filtri di contenuto durante la chiamata di generazione per rilevare contenuto dannoso o offensivo e filtrarlo dalla risposta. Ulteriori informazioni

Questi modelli verranno riabilitato nel primo trimestre del 2023 e saranno attivati per impostazione predefinita.

Azioni cliente

Contattare il supporto tecnico di Azure se si vuole abilitare queste opzioni per la sottoscrizione.
Richiedere le modifiche del filtro, se si desidera che rimangano disattivate. (Questa opzione è solo per casi d'uso a basso rischio.)

Passaggi successivi

Altre informazioni sui modelli sottostanti che alimentano OpenAI di Azure.

Novità del servizio OpenAI di Azure

Maggio 2024

Disponibilità generale del modello GPT-4 Turbo (GA)

Differenze tra i modelli OpenAI e Azure OpenAI GPT-4 Turbo GA

Differenze rispetto a gpt-4 vision-preview

Disponibilità gestita con provisioning GPT-4 Turbo

Aree di disponibilità

Distribuzione di GPT-4 Turbo con Vision GA

Aprile 2024

L'ottimizzazione è ora supportata in due nuove aree Stati Uniti orientali 2 e Svizzera occidentale

Stati Uniti orientali 2

Svizzera occidentale

Esempi di training di chat a più turni

GPT-4 (0125) è disponibile per Azure OpenAI sui dati

Marzo 2024

Rischi e monitoraggio Cassaforte ty in Azure OpenAI Studio

Azure OpenAI sugli aggiornamenti dei dati

API disponibile a livello generale (GA) 2024-024

Sussurrare la disponibilità generale (GA)

Disponibilità generale DALL-E 3 (GA)

Nuovo supporto regionale per DALL-E 3

Deprecazione e ritiri del modello

API 2024-03-01-preview rilasciata

Aggiornamento ai piani di aggiornamento GPT-4-1106-Preview

Febbraio 2024

Modello GPT-3.5-turbo-0125 disponibile

Modelli di incorporamento di terza generazione disponibili

Consolidamento delle quote turbo GPT-3.5

Modello GPT-4-0125-preview disponibile

Anteprima pubblica dell'API Assistants

Anteprima pubblica del testo OpenAI per le voci vocali

Nuove funzionalità di ottimizzazione e supporto del modello

Nuovo supporto a livello di area per Azure OpenAI sui dati

Disponibilità generale di Azure OpenAI sui dati

Dicembre 2023

Azure OpenAI sui dati

GPT-4 Turbo con Visione ora disponibile

Novembre 2023

Supporto di una nuova origine dati in Azure OpenAI nei dati

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 rilasciato

Anteprima pubblica DALL-E 3

Intelligenza artificiale responsabile

Ottobre 2023

Nuovi modelli di ottimizzazione (anteprima)

Azure OpenAI sui dati

Settembre 2023

GPT-4

GPT-3.5 Turbo Instruct

Anteprima pubblica di Whisper

Nuove aree

Aumenti dei limiti di quota a livello di area

Agosto 2023

Aggiornamenti di Azure OpenAI sui propri dati (anteprima)

Luglio 2023

Supporto per la chiamata di funzioni

Aumento della matrice di input di incorporamento

Nuove aree

Giugno 2023

Usare OpenAI di Azure per i propri dati (anteprima)

Nuove versioni dei modelli gpt-35-turbo e gpt-4

Regno Unito meridionale

Filtro del contenuto e annotazioni (anteprima)

Obiettivo di vendita

Maggio 2023

Supporto per Java & JavaScript SDK

Disponibilità generale (GA) del completamento della chat OpenAI di Azure

Francia centrale

Aprile 2023

Marzo 2023

2023 febbraio

Nuove funzionalità

Aggiornamenti

Gennaio 2023

Nuove funzionalità

Dicembre 2022

Nuove funzionalità

Modifiche (interruzione)

Passaggi successivi

Risorse aggiuntive