Share via


Lär dig hur du genererar inbäddningar med Azure OpenAI

En inbäddning är ett särskilt format för datarepresentation som enkelt kan användas av maskininlärningsmodeller och algoritmer. Inbäddningen är en informationstät representation av den semantiska innebörden av ett stycke text. Varje inbäddning är en vektor med flyttalsnummer, så att avståndet mellan två inbäddningar i vektorutrymmet korreleras med semantisk likhet mellan två indata i det ursprungliga formatet. Om två texter till exempel är liknande bör deras vektorrepresentationer också vara liknande. Inbäddning av energivektorlikhetssökning i Azure Databases, till exempel Azure Cosmos DB for MongoDB vCore eller Azure Database for PostgreSQL – flexibel server.

Så här hämtar du inbäddningar

För att hämta en inbäddningsvektor för en textdel skickar vi en begäran till slutpunkten för inbäddningsdata enligt följande kodfragment:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Bästa praxis

Kontrollera att indata inte överskrider den maximala längden

  • Den maximala längden på indatatexten för våra senaste inbäddningsmodeller är 8 192 tokens. Du bör kontrollera att dina indata inte överskrider den här gränsen innan du gör en begäran.
  • Om du skickar en matris med indata i en enda inbäddningsbegäran är den maximala matrisstorleken 2048.

Begränsningar och risker

Våra inbäddningsmodeller kan vara otillförlitliga eller utgöra sociala risker i vissa fall och kan orsaka skada i avsaknad av åtgärder. Läs vårt ansvarsfulla AI-innehåll för mer information om hur du hanterar deras användning på ett ansvarsfullt sätt.

Nästa steg