Azure OpenAI 向量化工具
Azure OpenAI 向量化工具會連線到 Azure OpenAI 資源上已部署的內嵌模型,以在查詢時產生內嵌。 您的資料會在模型部署所在的地理位置中處理。
向量化程式會在查詢時間使用,但在索引定義中指定,並透過向量配置檔在向量欄位上參考。 AZURE OpenAI 向量化程式會在 API 中呼叫 AzureOpenAIVectorizer
。
使用 2024-07-01 REST API 或已更新的 Azure SDK 套件來提供此功能。
在搜尋索引中設定向量化工具提供使用指示。
注意
此向量化工具會繫結至 Azure OpenAI 並以現有的 Azure OpenAI 隨用隨付價格計費。
必要條件
您的 Azure OpenAI 服務必須有相關聯的 自定義子域。 如果服務是透過 Azure 入口網站 建立的,此子域會自動產生為服務設定的一部分。 請確定您的服務包含自定義子域,再搭配 Azure AI 搜尋整合使用。
不支援在 AI Studio 中建立的 Azure OpenAI 服務資源(可存取內嵌模型)。 只有 Azure 入口網站 中建立的 Azure OpenAI 服務資源與 Azure OpenAI 內嵌技能整合相容。
向量化工具參數
這些參數會區分大小寫。
參數名稱 | 描述 |
---|---|
resourceUri |
在此案例中,模型提供者的URI是 Azure OpenAI 資源。 此參數僅支援具有網域 openai.azure.com 的網址,例如 https://<resourcename>.openai.azure.com 。 如果 Azure OpenAI 端點具有具有網域cognitiveservices.azure.com 的 URL,例如 https://<resourcename>.cognitiveservices.azure.com ,則必須先為 Azure OpenAI 資源建立自定義子域openai.azure.com ,並改用 https://<resourcename>.openai.azure.com 。 |
apiKey |
用於存取模型的祕密金鑰。 如果您提供金鑰,請將 authIdentity 保留空白。 如果您同時設定 apiKey 和 authIdentity ,則會在連線上使用 apiKey 。 |
deploymentId |
已部署的 Azure OpenAI 內嵌模型名稱。 此模型應該是內嵌模型,例如 text-embedding-ada-002。 如需支援的模型,請參閱 OpenAI 模型清單。 |
authIdentity |
搜尋服務用來連線到 Azure OpenAI 的使用者受控識別。 您可以使用系統或使用者受控的識別。 若要使用系統管理的身分識別,請將 apiKey 和 authIdentity 保留空白。 自動使用系統管理的身分識別。 受控識別必須具有認知服務 OpenAI 使用者權限,才能將文字傳送至 Azure OpenAI。 |
modelName |
(在 API 版本 2024-05-01-Preview 和更新版本中必要)。 在提供的 resourceUri 和 deploymentId 部署的 Azure OpenAI 內嵌模型名稱。 目前支援的值為 text-embedding-ada-002 、text-embedding-3-large 和 text-embedding-3-small |
支援的向量查詢類型
Azure OpenAI 向量化工具僅支援 text
向量查詢。
預期的欄位維度
使用 Azure OpenAI 向量化工具設定之欄位的預期欄位維度取決於所設定的 modelName
。
modelName |
最小維度 | 最大維度 |
---|---|---|
text-embedding-ada-002 | 1536 | 1536 |
text-embedding-3-large | 1 | 3072 |
text-embedding-3-small | 1 | 1536 |
範例定義
"vectorizers": [
{
"name": "my-openai-vectorizer",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://my-fake-azure-openai-resource.openai.azure.com",
"apiKey": "0000000000000000000000000000000000000",
"deploymentId": "my-ada-002-deployment",
"authIdentity": null,
"modelName": "text-embedding-ada-002",
},
}
]