Generieren von Einbettungen mit Azure OpenAI

Eine Einbettung ist ein spezielles Format der Datendarstellung, das problemlos von Machine Learning-Modellen und -Algorithmen genutzt werden kann. Die Einbettung ist eine verdichtete Informationsdarstellung der semantischen Bedeutung eines Textteils. Jede Einbettung ist ein Vektor aus Gleitkommazahlen. Der Abstand zwischen zwei Einbettungen im Vektorraum korreliert mit der semantischen Nähe zwischen zwei Eingaben im Originalformat. Wenn beispielsweise zwei Texte semantisch sehr ähnlich sind, sollten auch ihre Vektordarstellungen nahe zueinander liegen. Einbettungen helfen bei der Vektorähnlichkeitssuche in Azure-Datenbanken wie Azure Cosmos DB for MongoDB vCore oder Azure Database for PostgreSQL – Flexibler Server.

Abrufen von Einbettungen

Zum Abrufen eines Einbettungsvektors für einen Text erstellen Sie eine Anforderung an den Einbettungsendpunkt, wie in den folgenden Codeschnipseln gezeigt:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Bewährte Methoden

Verifizieren, dass Eingaben die maximale Länge nicht überschreiten

  • Die maximal zulässige Länge des Eingabetexts für die Einbettungsmodelle liegt bei 8192 Token. Vergewissern Sie sich, dass Ihre Eingaben diesen Maximalwert nicht überschreiten, bevor Sie eine Anforderung erstellen.
  • Beim Senden eines Arrays von Eingaben in einer einzigen Anforderung beträgt die maximale Array-Größe 2048.

Einschränkungen und Risiken

Unsere Einbettungsmodelle können in bestimmten Fällen unzuverlässig sein oder soziale Risiken bergen und bei nicht vorhandenen Maßnahmen zur Risikominderung Schäden verursachen. Lesen Sie unsere Artikel und Beiträge zu verantwortungsvoller KI, um zu erfahren, wie Sie diese Modelle verantwortungsbewusst einsetzen.

Nächste Schritte