Che cos'è il Servizio OpenAI di Azure?

Il servizio Azure OpenAI fornisce all'API REST l'accesso ai modelli di linguaggio avanzati di OpenAI, tra cui la serie di modelli GPT-4, GPT-4 Turbo con Vision, GPT-3.5-Turbo e Embeddings. Inoltre, la nuova serie di modelli GPT-4 e GPT-3.5-Turbo ha raggiunto la disponibilità generale. Questi modelli possono essere facilmente adattati all'attività specifica, tra cui, a titolo esemplificativo, la generazione di contenuti, il riepilogo, la comprensione delle immagini, la ricerca semantica e il linguaggio naturale per la traduzione del codice. Gli utenti possono accedere al servizio tramite API REST, Python SDK o l'interfaccia basata sul Web in Azure OpenAI Studio.

Panoramica delle funzionalità

Funzionalità OpenAI di Azure
Modelli disponibili Serie GPT-4 (incluso GPT-4 Turbo con Visione)
Serie GPT-3.5-Turbo
Serie di incorporamenti
Per altre informazioni, vedere la pagina Modelli .
Ottimizzazione (anteprima) GPT-3.5-Turbo (0613)
babbage-002
davinci-002.
Price Disponibile qui
Per informazioni dettagliate su GPT-4 Turbo with Vision, vedere le informazioni speciali sui prezzi.
Supporto della rete virtuale e supporto collegamento privato Sì, a meno che non si usi Azure OpenAI nei dati.
Identità gestita Sì, tramite Microsoft Entra ID
Esperienza dell'interfaccia utente portale di Azure per la gestione di account e risorse,
Azure OpenAI Service Studio per l'esplorazione e l'ottimizzazione dei modelli
Disponibilità a livello di area del modello Disponibilità del modello
Filtri dei contenuti I prompt e i completamenti vengono valutati in base ai criteri di contenuto con sistemi automatizzati. Il contenuto con gravità elevata verrà filtrato.

Intelligenza artificiale responsabile

Microsoft si impegna a promuovere l'IA basata su principi che mettono le persone al primo posto. I modelli generativi, ad esempio quelli disponibili in Azure OpenAI, presentano potenziali vantaggi significativi, ma senza un'attenta progettazione e mitigazioni ponderate, tali modelli hanno la possibilità di generare contenuto errato o persino dannoso. Microsoft ha effettuato investimenti significativi per proteggere gli abusi e i danni imprevisti, che includono la richiesta ai candidati di mostrare casi d'uso ben definiti, incorporando i principi di Microsoft per l'uso responsabile dell'IA, creando filtri di contenuto per supportare i clienti e fornendo linee guida per l'implementazione dell'IA responsabile per i clienti di cui è stato eseguito l'onboarding.

Ricerca per categorie ottenere l'accesso ad Azure OpenAI?

Ricerca per categorie ottenere l'accesso ad Azure OpenAI?

L'accesso è attualmente limitato perché si esplorano le richieste elevate, i miglioramenti futuri dei prodotti e l'impegno di Microsoft per l'IA responsabile. Al momento, collaboriamo con i clienti con una partnership esistente con Microsoft, casi d'uso di rischio inferiori e con quelli impegnati a integrare le mitigazioni.

Nel modulo dell'applicazione sono incluse informazioni più specifiche. Apprezziamo la pazienza del nostro lavoro per consentire in modo responsabile l'accesso più ampio ad Azure OpenAI.

Applicare qui per l'accesso:

Applica ora

Confronto tra OpenAI di Azure e OpenAI

Il servizio Azure OpenAI offre ai clienti un'intelligenza artificiale avanzata del linguaggio con OpenAI GPT-4, GPT-3, Codex, DALL-E, Whisper e i modelli di sintesi vocale con la sicurezza e la promessa aziendale di Azure. Azure OpenAI sviluppa le API con OpenAI, garantendo la compatibilità e una transizione uniforme da una all'altra.

Con OpenAI di Azure i clienti accedono alle funzionalità di sicurezza di Microsoft Azure eseguendo gli stessi modelli di OpenAI. Azure OpenAI offre funzionalità di rete privata, disponibilità a livello di area e filtro dei contenuti di intelligenza artificiale responsabile.

Concetti chiave

Richieste e completamenti

L'endpoint di completamento è il componente principale del servizio API. Questa API fornisce l'accesso all'interfaccia "testo in ingresso e testo in uscita" del modello. Gli utenti devono semplicemente fornire un prompt di input contenente il comando di testo inglese e il modello genererà un completamento del testo.

Di seguito è riportato un esempio di semplice richiesta e completamento:

Prompt: """ count to 5 in a for loop """

Completamento: for i in range(1, 6): print(i)

OAuth

Token di testo

Azure OpenAI elabora il testo suddividendolo in token. I token possono essere parole o blocchi di caratteri. Ad esempio, la parola "hamburger" viene suddivisa nei token "ham", "bur" e "ger", mentre una parola breve e comune come "pear" è un singolo token. Molti token iniziano con uno spazio vuoto, ad esempio " hello" e " bye".

Il numero totale di token elaborati in una determinata richiesta dipende dalla lunghezza dei parametri di input, output e richiesta. La quantità di token elaborati influirà anche sulla latenza della risposta e sulla velocità effettiva per i modelli.

Token di immagine (GPT-4 Turbo con Visione)

Il costo del token di un'immagine di input dipende da due fattori principali: le dimensioni dell'immagine e l'impostazione dei dettagli (bassa o elevata) usata per ogni immagine. Ecco una suddivisione del funzionamento:

  • Dettaglio: modalità a bassa risoluzione

    • Dettagli ridotti consente all'API di restituire risposte più veloci e di usare meno token di input per i casi d'uso che non richiedono dettagli elevati.
    • Queste immagini costano 85 token, indipendentemente dalle dimensioni dell'immagine.
    • Esempio: immagine 4096 x 8192 (dettaglio basso): il costo è un token fisso di 85 token, perché si tratta di un'immagine di dettaglio bassa e le dimensioni non influiscono sul costo in questa modalità.
  • Dettaglio: modalità ad alta risoluzione

    • Dettagli elevati consente all'API di visualizzare l'immagine in modo più dettagliato ritagliandola in quadrati più piccoli. Ogni quadrato usa più token per generare testo.
    • Il costo del token viene calcolato in base a una serie di passaggi di ridimensionamento:
      1. L'immagine viene ridimensionata per la prima volta per adattarsi all'interno di un quadrato 2048 x 2048 mantenendone le proporzioni.
      2. L'immagine viene quindi ridotta in modo che il lato più breve sia lungo 768 pixel.
      3. L'immagine è divisa in riquadri quadrati da 512 pixel e il numero di questi riquadri (arrotondamento per riquadri parziali) determina il costo finale. Ogni riquadro costa 170 token.
      4. Vengono aggiunti altri 85 token al costo totale.
    • Esempio: immagine 2048 x 4096 (dettaglio elevato)
      1. Inizialmente ridimensionato a 1024 x 2048 per adattarsi al quadrato 2048.
      2. Ridimensionato ulteriormente a 768 x 1536.
      3. Richiede sei riquadri da 512 px da coprire.
      4. Il costo totale è 170 × 6 + 85 = 1105 token.

Risorse

Azure OpenAI è una nuova offerta di prodotti in Azure. È possibile iniziare a usare Azure OpenAI allo stesso modo di qualsiasi altro prodotto Azure in cui si crea una risorsa o un'istanza del servizio nella sottoscrizione di Azure. Altre informazioni sulla progettazione della gestione delle risorse di Azure.

Deployments

Dopo aver creato una risorsa OpenAI di Azure, è necessario distribuire un modello prima di iniziare a effettuare chiamate API e generare testo. Questa azione può essere eseguita usando le API di distribuzione. Queste API consentono di specificare il modello da usare.

Progettazione dei prompt

I modelli GPT-3, GPT-3.5 e GPT-4 di OpenAI sono basati su prompt. Con tali modelli basati su prompt, l'utente interagisce con il modello immettendo una richiesta di testo, a cui il modello risponde con un completamento del testo. Questo completamento è la continuazione del modello del testo di input.

Sebbene questi modelli siano estremamente potenti, il loro comportamento è anche molto sensibile al prompt. Ciò rende la richiesta di ingegneria un'importante competenza da sviluppare.

La costruzione di richieste può essere difficile. In pratica, il prompt agisce per configurare i pesi del modello per completare l'attività desiderata, ma è più un'arte che una scienza, dato che spesso richiede esperienza e intuizione per creare una richiesta di successo.

Modelli

Il servizio fornisce agli utenti l'accesso a diversi modelli. Ogni modello offre una funzionalità e un punto di prezzo diversi.

I modelli DALL-E (alcuni in anteprima; vedere i modelli) generano immagini dai prompt di testo forniti dall'utente.

I modelli Whisper possono essere usati per trascrivere e tradurre il parlato in testo.

I modelli di sintesi vocale, attualmente in anteprima, possono essere usati per sintetizzare il testo nella voce.

Altre informazioni su ogni modello sono disponibili nella pagina del concetto di modelli.

Passaggi successivi

Altre informazioni sui modelli sottostanti che alimentano Azure OpenAI.