Distribuire modelli di intelligenza artificiale generativa
Per effettuare chiamate API e ricevere completamenti ai prompt, è prima di tutto necessario distribuire un modello. Quando si crea una nuova distribuzione, è necessario indicare quale modello di base distribuire. È possibile distribuire un numero qualsiasi di distribuzioni in una o più risorse OpenAI di Azure, purché il numero di unità TPM complessivo sia inferiore in totale a 240.000 in tale area. Esistono diversi modi per distribuire il modello di base.
Eseguire la distribuzione con Azure OpenAI Studio
Nella pagina Distribuzioni di Azure OpenAI Studio è possibile creare una nuova distribuzione selezionando un nome di modello nel menu. I modelli di base disponibili provengono dall'elenco nella pagina dei modelli.
Nella pagina Distribuzioni di Studio è anche possibile visualizzare informazioni su tutte le distribuzioni, tra cui nome della distribuzione, nome del modello, versione del modello, stato, data di creazione e altro ancora.
Eseguire la distribuzione usando l'interfaccia della riga di comando di Azure
È anche possibile distribuire un modello usando la console. Usando questo esempio, sostituire le variabili seguenti con i valori delle proprie risorse:
- OAIResourceGroup: sostituire con il nome del gruppo di risorse
- MyOpenAIResource: sostituire con il nome della risorsa
- MyModel: sostituire con un nome univoco per il modello
- gpt-35-turbo: sostituire con il modello di base da distribuire
az cognitiveservices account deployment create \
-g OAIResourceGroup \
-n MyOpenAIResource \
--deployment-name MyModel \
--model-name gpt-35-turbo \
--model-version "0301" \
--model-format OpenAI \
--sku-name "Standard" \
--sku-capacity 1
Distribuire tramite l'API REST
È possibile distribuire un modello usando l'API REST. Nel corpo della richiesta specificare il modello di base da distribuire. Vedere un esempio nella documentazione di Azure OpenAI.