了解如何使用 Azure OpenAI 產生內嵌

內嵌是一種特殊的資料表示格式,可供機器學習模型和演算法輕鬆使用。 內嵌是文字片段語意的資訊密集表示法。 每個內嵌都是浮點數的向量,因此向量空間中兩個內嵌之間的距離會與原始格式兩個輸入之間的語意相似性相互關聯。 舉例來說,兩段類似文字的向量表示法也應該會相似。 在 Azure 資料庫中內嵌電源向量相似度搜尋,例如適用於 MongoDB 的 Azure Cosmos DB 虛擬核心適用於 PostgreSQL 的 Azure 資料庫 - 彈性伺服器

如何取得內嵌

為了取得一段文字的內嵌向量,我們會向內嵌端點提出要求,如下列程式碼片段所示:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

最佳作法

確認輸入內容未超過長度最大值

  • 我們最新內嵌模型的輸入文字長度上限為8192標記。 在提出要求之前,請先確認輸入內容未超過此限制。
  • 如果在單一內嵌要求中傳送輸入數位,則陣列大小上限為2048。

限制和風險

我們的內嵌模型在某些情況下可能不可靠,或會帶來社交風險,而且可能會在缺少風險緩解措施的情況下造成損害。 如需了解如何要求負責任的詳細資訊,請檢閱我們的負責任 AI 內容。

下一步