Informazioni su come generare incorporamenti con Azure OpenAI

Un incorporamento è un formato speciale di rappresentazione dei dati che può essere facilmente utilizzato da modelli e algoritmi di Machine Learning. L'incorporamento è una rappresentazione densa di informazioni del significato semantico di una parte di testo. Ogni incorporamento è un vettore di numeri a virgola mobile, in modo che la distanza tra due incorporamenti nello spazio vettoriale sia correlata alla somiglianza semantica tra due input nel formato originale. Ad esempio, se due testi sono simili, anche le rappresentazioni vettoriali dovrebbero essere simili. Incorporamento della ricerca di somiglianza dei vettori di alimentazione in Database di Azure, ad esempio Azure Cosmos DB per MongoDB vCore o Database di Azure per PostgreSQL - Server flessibile.

Come ottenere incorporamenti

Per ottenere un vettore di incorporamento per una parte di testo, viene inviata una richiesta all'endpoint di incorporamento, come illustrato nei frammenti di codice seguenti:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Procedure consigliate

Verificare che gli input non superino la lunghezza massima

  • La lunghezza massima del testo di input per i modelli di incorporamento più recenti è di 8192 token. È necessario verificare che gli input non superino questo limite prima di effettuare una richiesta.
  • Se si invia una matrice di input in un'unica richiesta di incorporamento, la dimensione massima della matrice è 2048.

Limitazioni e rischi

I modelli di incorporamento possono essere inaffidabili o rappresentare rischi sociali in determinati casi e possono causare danni in assenza di mitigazioni. Per altre informazioni sull'approccio responsabile dell'uso responsabile, vedere il contenuto dell'intelligenza artificiale responsabile.

Passaggi successivi