Distribuire modelli di intelligenza artificiale generativa

Completato

Per effettuare chiamate API e ricevere completamenti ai prompt, è prima di tutto necessario distribuire un modello. Quando si crea una nuova distribuzione, è necessario indicare quale modello di base distribuire. È possibile distribuire un numero qualsiasi di distribuzioni in una o più risorse OpenAI di Azure, purché il numero di unità TPM complessivo sia inferiore in totale a 240.000 in tale area. Esistono diversi modi per distribuire il modello di base.

Eseguire la distribuzione con Azure OpenAI Studio

Nella pagina Distribuzioni di Azure OpenAI Studio è possibile creare una nuova distribuzione selezionando un nome di modello nel menu. I modelli di base disponibili provengono dall'elenco nella pagina dei modelli.

Screenshot of the Azure OpenAI Studio portal's model deployment wizard.

Nella pagina Distribuzioni di Studio è anche possibile visualizzare informazioni su tutte le distribuzioni, tra cui nome della distribuzione, nome del modello, versione del modello, stato, data di creazione e altro ancora.

Eseguire la distribuzione usando l'interfaccia della riga di comando di Azure

È anche possibile distribuire un modello usando la console. Usando questo esempio, sostituire le variabili seguenti con i valori delle proprie risorse:

  • OAIResourceGroup: sostituire con il nome del gruppo di risorse
  • MyOpenAIResource: sostituire con il nome della risorsa
  • MyModel: sostituire con un nome univoco per il modello
  • gpt-35-turbo: sostituire con il modello di base da distribuire
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

Distribuire tramite l'API REST

È possibile distribuire un modello usando l'API REST. Nel corpo della richiesta specificare il modello di base da distribuire. Vedere un esempio nella documentazione di Azure OpenAI.