你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Skillsets - Create Or Update
在搜索服务中创建新的技能组,或者更新技能组(如果已存在)。
PUT {endpoint}/skillsets('{skillsetName}')?api-version=2023-11-01
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
endpoint
|
path | True |
string |
搜索服务的终结点 URL。 |
skillset
|
path | True |
string |
要创建或更新的技能组的名称。 |
api-version
|
query | True |
string |
客户端 API 版本。 |
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
x-ms-client-request-id |
string uuid |
随请求一起发送以帮助调试的跟踪 ID。 |
|
If-Match |
string |
定义 If-Match 条件。 仅当服务器上的 ETag 与此值匹配时,才会执行该操作。 |
|
If-None-Match |
string |
定义 If-None-Match 条件。 仅当服务器上的 ETag 与此值不匹配时,才会执行该操作。 |
|
Prefer | True |
string |
对于 HTTP PUT 请求,指示服务在成功时返回创建/更新的资源。 |
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
name | True |
string |
技能组的名称。 |
skills | True |
SearchIndexerSkill[]:
|
技能集中的技能列表。 |
@odata.etag |
string |
技能组的 ETag。 |
|
cognitiveServices | CognitiveServicesAccount: |
有关运行技能时要使用的 Azure AI 服务的详细信息。 |
|
description |
string |
技能组的说明。 |
|
encryptionKey |
在 Azure 密钥保管库 中创建的加密密钥的说明。 当你希望完全保证没有人(甚至 Microsoft)无法解密技能组定义时,此密钥用于为技能组定义提供额外的静态加密级别。 加密技能组定义后,该定义将始终保持加密状态。 搜索服务将忽略将此属性设置为 null 的尝试。 如果要轮换加密密钥,可以根据需要更改此属性;技能组定义将不受影响。 使用客户管理的密钥加密不适用于免费搜索服务,并且仅适用于 2019 年 1 月 1 日或之后创建的付费服务。 |
||
knowledgeStore |
定义扩充数据的 Azure Blob、表或文件的其他投影。 |
名称 | 类型 | 说明 |
---|---|---|
200 OK |
技能组已成功更新。 |
|
201 Created |
已成功创建技能组。 |
|
Other Status Codes |
错误响应。 |
示例请求
PUT https://myservice.search.windows.net/skillsets('demoskillset')?api-version=2023-11-01
{
"name": "demoskillset",
"description": "Extract entities, detect language and extract key-phrases",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.EntityRecognitionSkill",
"categories": [
"organization"
],
"defaultLanguageCode": "en",
"minimumPrecision": 0.7,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "organizations",
"targetName": "organizations"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"textSplitMode": "pages",
"maximumPageLength": 4000,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "MyCustomWebApiSkill",
"uri": "https://contoso.example.org",
"httpMethod": "POST",
"timeout": "PT30S",
"batchSize": 1,
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
],
"httpHeaders": {}
}
],
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": null
}
}
示例响应
{
"name": "demoskillset",
"description": "Extract entities, detect language and extract key-phrases",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.EntityRecognitionSkill",
"name": "#1",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "organizations",
"targetName": "organizations"
}
],
"categories": [
"organization"
],
"defaultLanguageCode": "en",
"minimumPrecision": 0.7
},
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "#2",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "#3",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
],
"defaultLanguageCode": null,
"textSplitMode": "pages",
"maximumPageLength": 4000
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "#4",
"description": null,
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
],
"defaultLanguageCode": null,
"maxKeyPhraseCount": null
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "MyCustomWebApiSkill",
"description": null,
"context": "/document",
"uri": "https://contoso.example.org",
"httpMethod": "POST",
"timeout": "PT30S",
"batchSize": 1,
"degreeOfParallelism": null,
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
],
"httpHeaders": {}
}
],
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": null
}
}
{
"name": "demoskillset",
"description": "Extract entities, detect language and extract key-phrases",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.EntityRecognitionSkill",
"name": "#1",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "organizations",
"targetName": "organizations"
}
],
"categories": [
"organization"
],
"defaultLanguageCode": "en",
"minimumPrecision": 0.7
},
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "#2",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "#3",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
],
"defaultLanguageCode": null,
"textSplitMode": "pages",
"maximumPageLength": 4000
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "#4",
"description": null,
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
],
"defaultLanguageCode": null,
"maxKeyPhraseCount": null
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "MyCustomWebApiSkill",
"description": null,
"context": "/document",
"uri": "https://contoso.example.org",
"httpMethod": "POST",
"timeout": "PT30S",
"batchSize": 1,
"degreeOfParallelism": null,
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
],
"httpHeaders": {}
}
],
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": null
}
}
名称 | 说明 |
---|---|
Azure |
为搜索服务创建的已注册应用程序的凭据,用于对 Azure 密钥保管库中存储的加密密钥的身份验证访问。 |
Cognitive |
使用附加到技能组的密钥预配的 Azure AI 服务资源。 |
Conditional |
一种技能,使需要布尔运算来确定要分配给输出的数据的方案。 |
Custom |
一个 对象,其中包含有关找到的匹配项和相关元数据的信息。 |
Custom |
一个复杂对象,可用于指定根实体名称的替代拼写或同义词。 |
Custom |
技能从用户定义的自定义字词和短语列表中查找文本。 |
Custom |
CustomEntityLookupSkill 支持的输入文本的语言代码。 |
Default |
一个空对象,表示技能组的默认 Azure AI 服务资源。 |
Document |
一种技能,用于从扩充管道中的文件中提取内容。 |
Entity |
一个字符串,指示要返回的实体类别。 |
Entity |
使用 文本分析 API 从文本中提取链接的实体。 |
Entity |
文本分析实体识别。 |
Entity |
EntityRecognitionSkill 支持的输入文本的语言代码。 |
Entity |
使用 文本分析 API 从文本中提取不同类型的实体。 |
Image |
分析图像文件的技能。 它基于图像内容提取一组丰富的视觉特征。 |
Image |
ImageAnalysisSkill 支持输入的语言代码。 |
Image |
一个字符串,指示要返回哪些特定于域的详细信息。 |
Input |
技能的输入字段映射。 |
Key |
使用文本分析提取关键短语的技能。 |
Key |
KeyPhraseExtractionSkill 支持的输入文本的语言代码。 |
Language |
一种技能,用于检测输入文本的语言,并为请求中提交的每个文档报告单个语言代码。 语言代码与指示分析置信度分数配对。 |
Merge |
一种技能,用于将两个或多个字符串合并为单个统一字符串,并使用可选的用户定义的分隔符分隔每个组件部分。 |
Ocr |
一种从图像文件中提取文本的技能。 |
Ocr |
OcrSkill 输入支持的语言代码。 |
Output |
技能的输出字段映射。 |
PIIDetection |
使用 文本分析 API 从输入文本中提取个人信息,并提供屏蔽选项。 |
PIIDetection |
一个字符串,指示用于屏蔽输入文本中检测到的个人信息的 maskingMode。 |
Search |
描述 API 的错误条件。 |
Search |
定义扩充数据的 Azure Blob、表或文件的其他投影。 |
Search |
要存储在Azure 文件存储中的数据的投影定义。 |
Search |
要存储在 Azure Blob 中的数据的投影定义。 |
Search |
各种投影选择器的容器对象。 |
Search |
有关要在 Azure 表中存储的数据的说明。 |
Search |
技能列表。 |
Search |
Azure 密钥保管库中客户管理的加密密钥。 创建和管理的密钥可用于加密或解密搜索服务上的静态数据,例如索引和同义词映射。 |
Sentiment |
文本分析正负情绪分析,评分为 0 到 1 范围内的浮点值。 |
Sentiment |
SentimentSkill 支持的输入文本的语言代码。 |
Sentiment |
使用 文本分析 API 评估非结构化文本,并根据服务在句子和文档级别找到的最高置信度分数,提供情绪标签 (,如“负面”、“中性”和“积极”) 。 |
Shaper |
用于重塑输出的技能。 它创建一个复杂类型以支持复合字段 (也称为多部分字段) 。 |
Split |
将字符串拆分为文本块的技能。 |
Split |
SplitSkill 支持的输入文本的语言代码。 |
Text |
指示要执行的拆分模式的值。 |
Text |
将文本从一种语言翻译到另一种语言的技能。 |
Text |
TextTranslationSkill 支持的输入文本的语言代码。 |
Visual |
指示要返回的视觉特征类型的字符串。 |
Web |
一种可以调用 Web API 终结点的技能,允许你通过调用自定义代码来扩展技能集。 |
为搜索服务创建的已注册应用程序的凭据,用于对 Azure 密钥保管库中存储的加密密钥的身份验证访问。
名称 | 类型 | 说明 |
---|---|---|
applicationId |
string |
一个 AAD 应用程序 ID,该 ID 授予了对 Azure 密钥保管库所需的访问权限,该权限将在加密静态数据时使用。 应用程序 ID 不应与 AAD 应用程序的对象 ID 混淆。 |
applicationSecret |
string |
指定 AAD 应用程序的身份验证密钥。 |
使用附加到技能组的密钥预配的 Azure AI 服务资源。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定附加到技能组的 Azure AI 服务资源类型的 URI 片段。 |
description |
string |
附加到技能组的 Azure AI 服务资源的说明。 |
key |
string |
用于预配附加到技能组的 Azure AI 服务资源的密钥。 |
一种技能,使需要布尔运算来确定要分配给输出的数据的方案。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
一个 对象,其中包含有关找到的匹配项和相关元数据的信息。
名称 | 类型 | 说明 |
---|---|---|
accentSensitive |
boolean |
默认为 false。 指示与实体名称的比较是否应区分重音的布尔值。 |
aliases |
一个复杂对象的数组,可用于指定根实体名称的替代拼写或同义词。 |
|
caseSensitive |
boolean |
默认为 false。 一个布尔值,表示在与实体名称进行比较时是否应区分字符大小写。 “Microsoft”不区分大小写的示例匹配项可能是:microsoft、microSoft、MICROSOFT。 |
defaultAccentSensitive |
boolean |
更改此实体的默认重音敏感度值。 它用于更改所有别名重音敏感值的默认值。 |
defaultCaseSensitive |
boolean |
更改此实体的默认区分大小写值。 它用于更改所有别名 caseSensitive 值的默认值。 |
defaultFuzzyEditDistance |
integer |
更改此实体的默认模糊编辑距离值。 它可用于更改所有别名 fuzzyEditDistance 值的默认值。 |
description |
string |
此字段可用作有关匹配文本 () 的自定义元数据的传递。 此字段的值将连同其在技能输出中的实体的每个匹配项一起显示。 |
fuzzyEditDistance |
integer |
默认值为 0。 最大值为 5。 表示仍看作与实体名称匹配的可接受分歧字符数。 将返回任意给定匹配项的最小可能模糊匹配数。 例如,如果编辑距离设置为 3,“Windows10”仍将匹配“Windows”、“Windows10”和“Windows 7”。 如果区分大小写设置为 false,则大小写差异不会计入模糊匹配容差;否则会计入。 |
id |
string |
此字段可用作有关匹配文本 () 的自定义元数据的传递。 此字段的值将连同其在技能输出中的实体的每个匹配项一起显示。 |
name |
string |
顶级实体描述符。 技能输出中的匹配项将按此名称分组,此名称应表示所找到的文本的“规范化”形式。 |
subtype |
string |
此字段可用作有关匹配文本 () 的自定义元数据的传递。 此字段的值将连同其在技能输出中的实体的每个匹配项一起显示。 |
type |
string |
此字段可用作有关匹配文本 () 的自定义元数据的传递。 此字段的值将连同其在技能输出中的实体的每个匹配项一起显示。 |
一个复杂对象,可用于指定根实体名称的替代拼写或同义词。
名称 | 类型 | 说明 |
---|---|---|
accentSensitive |
boolean |
确定别名是否区分重音。 |
caseSensitive |
boolean |
确定别名是否区分大小写。 |
fuzzyEditDistance |
integer |
确定别名的模糊编辑距离。 |
text |
string |
别名的文本。 |
技能从用户定义的自定义字词和短语列表中查找文本。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
一个值,该值指示要使用的语言代码。 默认为 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
entitiesDefinitionUri |
string |
JSON 或 CSV 文件的路径,该文件包含要匹配的所有目标文本。 此实体定义在索引器运行开始时读取。 索引器运行期间对此文件的任何更新在后续运行之前不会生效。 必须可以通过 HTTPS 访问此配置。 |
globalDefaultAccentSensitive |
boolean |
AccentSensitive 的全局标志。 如果未在 CustomEntity 中设置 AccentSensitive,则此值将是默认值。 |
globalDefaultCaseSensitive |
boolean |
CaseSensitive 的全局标志。 如果未在 CustomEntity 中设置 CaseSensitive,此值将是默认值。 |
globalDefaultFuzzyEditDistance |
integer |
FuzzyEditDistance 的全局标志。 如果未在 CustomEntity 中设置 FuzzyEditDistance,则此值将是默认值。 |
inlineEntitiesDefinition |
内联 CustomEntity 定义。 |
|
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能集中唯一标识技能的技能的名称。 未定义名称的技能将在 skills 数组中为其基于 1 的索引提供默认名称,前缀为 字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
CustomEntityLookupSkill 支持的输入文本的语言代码。
名称 | 类型 | 说明 |
---|---|---|
da |
string |
丹麦语 |
de |
string |
德语 |
en |
string |
英语 |
es |
string |
西班牙语 |
fi |
string |
芬兰语 |
fr |
string |
法语 |
it |
string |
意大利语 |
ko |
string |
朝鲜语 |
pt |
string |
葡萄牙语 |
一个空对象,表示技能组的默认 Azure AI 服务资源。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定附加到技能组的 Azure AI 服务资源类型的 URI 片段。 |
description |
string |
附加到技能组的 Azure AI 服务资源的说明。 |
一种技能,用于从扩充管道中的文件中提取内容。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
configuration |
object |
技能配置字典。 |
context |
string |
表示执行操作的级别,例如文档根或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
dataToExtract |
string |
要为技能提取的数据类型。 如果未定义,则将设置为“contentAndMetadata”。 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能集中唯一标识技能的技能的名称。 未定义名称的技能将在 skills 数组中为其基于 1 的索引提供默认名称,前缀为 字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
|
parsingMode |
string |
技能的 parsingMode。 如果未定义,则将设置为“default”。 |
一个字符串,指示要返回的实体类别。
名称 | 类型 | 说明 |
---|---|---|
datetime |
string |
描述日期和时间的实体。 |
string |
描述电子邮件地址的实体。 |
|
location |
string |
描述物理位置的实体。 |
organization |
string |
描述组织的实体。 |
person |
string |
描述人员的实体。 |
quantity |
string |
描述数量的实体。 |
url |
string |
描述 URL 的实体。 |
使用 文本分析 API 从文本中提取链接的实体。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
string |
一个 值,该值指示要使用哪种语言代码。 默认为 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
minimumPrecision |
number |
一个介于 0 和 1 之间的值,用于仅包含置信度分数大于指定值的实体。 如果未设置 (默认) ,或者显式设置为 null,则将包括所有实体。 |
modelVersion |
string |
调用文本分析服务时要使用的模型版本。 如果未指定,将默认为最新可用版本。 建议不要指定此值,除非绝对必要。 |
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
文本分析实体识别。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
categories |
应提取的实体类别的列表。 |
|
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
一个 值,该值指示要使用哪种语言代码。 默认为 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
includeTypelessEntities |
boolean |
确定是否包含已知但不符合预定义类型的实体。 如果未将此配置 (默认) 、设置为 null 或设置为 false,则不符合预定义类型之一的实体将不会显示。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
minimumPrecision |
number |
一个介于 0 和 1 之间的值,用于仅包含置信度分数大于指定值的实体。 如果未设置 (默认) ,或者显式设置为 null,则将包括所有实体。 |
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
EntityRecognitionSkill 支持的输入文本的语言代码。
名称 | 类型 | 说明 |
---|---|---|
ar |
string |
阿拉伯语 |
cs |
string |
捷克语 |
da |
string |
丹麦语 |
de |
string |
德语 |
el |
string |
希腊语 |
en |
string |
英语 |
es |
string |
西班牙语 |
fi |
string |
芬兰语 |
fr |
string |
法语 |
hu |
string |
匈牙利语 |
it |
string |
意大利语 |
ja |
string |
日语 |
ko |
string |
韩语 |
nl |
string |
荷兰语 |
no |
string |
挪威语 (博克马尔语) |
pl |
string |
波兰语 |
pt-BR |
string |
葡萄牙语(巴西) |
pt-PT |
string |
葡萄牙语(葡萄牙) |
ru |
string |
俄语 |
sv |
string |
瑞典语 |
tr |
string |
土耳其语 |
zh-Hans |
string |
简体中文 |
zh-Hant |
string |
繁体中文 |
使用 文本分析 API 从文本中提取不同类型的实体。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
categories |
string[] |
应提取的实体类别的列表。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
string |
一个 值,该值指示要使用哪种语言代码。 默认为 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
minimumPrecision |
number |
一个介于 0 和 1 之间的值,用于仅包含置信度分数大于指定值的实体。 如果未设置 (默认) ,或者显式设置为 null,则将包括所有实体。 |
modelVersion |
string |
调用文本分析服务时要使用的模型版本。 如果未指定,将默认为最新可用版本。 建议不要指定此值,除非绝对必要。 |
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
分析图像文件的技能。 它基于图像内容提取一组丰富的视觉特征。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
一个 值,该值指示要使用哪种语言代码。 默认为 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
details |
一个字符串,指示要返回哪些特定于域的详细信息。 |
|
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
|
visualFeatures |
视觉特征的列表。 |
ImageAnalysisSkill 支持输入的语言代码。
名称 | 类型 | 说明 |
---|---|---|
ar |
string |
阿拉伯语 |
az |
string |
阿塞拜疆语 |
bg |
string |
保加利亚语 |
bs |
string |
波斯尼亚语(拉丁语系) |
ca |
string |
加泰罗尼亚语 |
cs |
string |
捷克语 |
cy |
string |
威尔士语 |
da |
string |
丹麦语 |
de |
string |
德语 |
el |
string |
希腊语 |
en |
string |
英语 |
es |
string |
西班牙语 |
et |
string |
爱沙尼亚语 |
eu |
string |
巴斯克语 |
fi |
string |
芬兰语 |
fr |
string |
法语 |
ga |
string |
爱尔兰语 |
gl |
string |
加利西亚语 |
he |
string |
希伯来语 |
hi |
string |
Hindi |
hr |
string |
克罗地亚语 |
hu |
string |
匈牙利语 |
id |
string |
印度尼西亚语 |
it |
string |
意大利语 |
ja |
string |
日语 |
kk |
string |
哈萨克语 |
ko |
string |
韩语 |
lt |
string |
立陶宛语 |
lv |
string |
拉脱维亚语 |
mk |
string |
马其顿语 |
ms |
string |
马来语 - 马来西亚 |
nb |
string |
挪威语(博克马尔语) |
nl |
string |
荷兰语 |
pl |
string |
波兰语 |
prs |
string |
达里语 |
pt |
string |
葡萄牙语 - 葡萄牙 |
pt-BR |
string |
葡萄牙语 - 巴西 |
pt-PT |
string |
葡萄牙语 - 葡萄牙 |
ro |
string |
罗马尼亚语 |
ru |
string |
俄语 |
sk |
string |
斯洛伐克语 |
sl |
string |
斯洛文尼亚语 |
sr-Cyrl |
string |
塞尔维亚语 - 西里尔语 |
sr-Latn |
string |
塞尔维亚语 - 拉丁语 |
sv |
string |
瑞典语 |
th |
string |
泰语 |
tr |
string |
土耳其语 |
uk |
string |
乌克兰语 |
vi |
string |
越南语 |
zh |
string |
简体中文 |
zh-Hans |
string |
简体中文 |
zh-Hant |
string |
中文(繁体) |
一个字符串,指示要返回哪些特定于域的详细信息。
名称 | 类型 | 说明 |
---|---|---|
celebrities |
string |
识别为名人的详细信息。 |
landmarks |
string |
识别为陆标的详细信息。 |
技能的输入字段映射。
名称 | 类型 | 说明 |
---|---|---|
inputs |
创建复杂类型时使用的递归输入。 |
|
name |
string |
输入的名称。 |
source |
string |
输入的源。 |
sourceContext |
string |
用于选择递归输入的源上下文。 |
使用文本分析提取关键短语的技能。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
一个 值,该值指示要使用哪种语言代码。 默认为 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
maxKeyPhraseCount |
integer |
一个数字,指示要返回的关键短语数。 如果不存在,将返回所有标识的关键短语。 |
modelVersion |
string |
调用文本分析服务时要使用的模型版本。 如果未指定,将默认为最新可用版本。 建议不要指定此值,除非绝对必要。 |
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
KeyPhraseExtractionSkill 支持的输入文本的语言代码。
名称 | 类型 | 说明 |
---|---|---|
da |
string |
丹麦语 |
de |
string |
德语 |
en |
string |
英语 |
es |
string |
西班牙语 |
fi |
string |
芬兰语 |
fr |
string |
法语 |
it |
string |
意大利语 |
ja |
string |
日语 |
ko |
string |
韩语 |
nl |
string |
荷兰语 |
no |
string |
挪威语 (博克马尔语) |
pl |
string |
波兰语 |
pt-BR |
string |
葡萄牙语(巴西) |
pt-PT |
string |
葡萄牙语(葡萄牙) |
ru |
string |
俄语 |
sv |
string |
瑞典语 |
一种技能,用于检测输入文本的语言,并为请求中提交的每个文档报告单个语言代码。 语言代码与指示分析置信度分数配对。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultCountryHint |
string |
如果语言检测模型无法消除语言歧义,则用作语言检测模型的提示的国家/地区代码。 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
modelVersion |
string |
调用文本分析服务时要使用的模型版本。 如果未指定,将默认为最新可用版本。 建议不要指定此值,除非绝对必要。 |
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
一种技能,用于将两个或多个字符串合并为单个统一字符串,并使用可选的用户定义的分隔符分隔每个组件部分。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
|
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
|
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
||
insertPostTag |
string |
标记指示合并文本的结尾。 默认情况下, 标记是一个空白区域。 |
|
insertPreTag |
string |
标记指示合并文本的开头。 默认情况下, 标记是一个空白区域。 |
|
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
|
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
一种从图像文件中提取文本的技能。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
|
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
|
defaultLanguageCode |
一个 值,该值指示要使用哪种语言代码。 默认为 |
||
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
|
detectOrientation |
boolean |
False |
一个 值,该值指示是否打开方向检测。 默认值为 false。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
||
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
|
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
OcrSkill 输入支持的语言代码。
名称 | 类型 | 说明 |
---|---|---|
Jns |
string |
贾恩萨里语(天城文) |
af |
string |
南非荷兰语 |
anp |
string |
昂加语(天城文) |
ar |
string |
阿拉伯语 |
ast |
string |
阿斯图里亚斯语 |
awa |
string |
阿瓦德语-印地语(天城文) |
az |
string |
阿塞拜疆语(拉丁语) |
be |
string |
白俄罗斯语 (西里尔文和拉丁文) |
be-cyrl |
string |
白俄罗斯语(西里尔语) |
be-latn |
string |
白俄罗斯语(拉丁语) |
bfy |
string |
巴格里语 |
bfz |
string |
玛哈苏帕哈里(天城文) |
bg |
string |
保加利亚语 |
bgc |
string |
哈里亚维 |
bho |
string |
博杰普尔语-印地语(天城文) |
bi |
string |
比斯拉马语 |
bns |
string |
本德利语 |
br |
string |
布列塔尼语 |
bra |
string |
布拉伊巴语 |
brx |
string |
博多语(天城文) |
bs |
string |
波斯尼亚语(拉丁语系) |
bua |
string |
布里亚特语(西里尔语) |
ca |
string |
加泰罗尼亚语 |
ceb |
string |
宿雾语 |
ch |
string |
查莫罗语 |
cnr-cyrl |
string |
蒙特内哥罗语(西里尔语) |
cnr-latn |
string |
蒙特内哥罗语(拉丁语) |
co |
string |
柯西嘉语 |
crh |
string |
克里米亚鞑靼语(拉丁语) |
cs |
string |
捷克语 |
csb |
string |
卡舒比语 |
cy |
string |
威尔士语 |
da |
string |
丹麦语 |
de |
string |
德语 |
dhi |
string |
迪马尔语(天城文) |
doi |
string |
多格拉语(天城文) |
dsb |
string |
下索布语 |
el |
string |
希腊语 |
en |
string |
英语 |
es |
string |
西班牙语 |
et |
string |
爱沙尼亚语 |
eu |
string |
巴斯克语 |
fa |
string |
波斯语 |
fi |
string |
芬兰语 |
fil |
string |
菲律宾语 |
fj |
string |
斐济语 |
fo |
string |
法罗语 |
fr |
string |
法语 |
fur |
string |
弗鲁利亚语 |
fy |
string |
西弗里西亚语 |
ga |
string |
爱尔兰语 |
gag |
string |
嘎嘎乌孜语(拉丁语) |
gd |
string |
苏格兰盖尔语 |
gil |
string |
吉尔伯特斯语 |
gl |
string |
加利西亚语 |
gon |
string |
贡迪语(天城文) |
gv |
string |
马恩岛语 |
gvr |
string |
古隆语(天城文) |
haw |
string |
夏威夷语 |
hi |
string |
Hindi |
hlb |
string |
哈尔比语(天城文) |
hne |
string |
恰蒂斯加尔希语(天城文) |
hni |
string |
哈尼语 |
hoc |
string |
霍· (·德瓦纳吉里·) |
hr |
string |
克罗地亚语 |
hsb |
string |
上索布语 |
ht |
string |
海地克里奥尔语 |
hu |
string |
匈牙利语 |
ia |
string |
国际语 |
id |
string |
印度尼西亚语 |
is |
string |
冰岛语 |
it |
string |
意大利语 |
iu |
string |
因纽特语(拉丁语) |
ja |
string |
日语 |
jv |
string |
爪哇文 |
kaa |
string |
卡拉卡巴克语(拉丁语) |
kaa-cyrl |
string |
卡拉卡巴克语(西里尔语) |
kac |
string |
克钦语(拉丁语) |
kea |
string |
卡布佛得鲁语 |
kfq |
string |
科尔库语 |
kha |
string |
卡西语 |
kk-cyrl |
string |
哈萨克语(西里尔语) |
kk-latn |
string |
哈萨克语(拉丁语) |
kl |
string |
格陵兰语 |
klr |
string |
哈林语 |
kmj |
string |
马尔托语(天城文) |
ko |
string |
韩语 |
kos |
string |
科斯拉伊语 |
kpy |
string |
科里亚克语 |
krc |
string |
卡巴尔达语 |
kru |
string |
库鲁克语(天城文) |
ksh |
string |
利普里安语 |
ku-arab |
string |
库尔德语(阿拉伯语) |
ku-latn |
string |
库尔德语(拉丁语) |
kum |
string |
库梅克语(西里尔语) |
kw |
string |
康沃尔语 |
ky |
string |
吉尔吉斯语(西里尔语) |
la |
string |
拉丁语 |
lb |
string |
卢森堡语 |
lkt |
string |
拉科塔语 |
lt |
string |
立陶宛语 |
mi |
string |
毛利语 |
mn |
string |
蒙古语(西里尔文) |
mr |
string |
马拉地语 |
ms |
string |
马来语(拉丁语系) |
mt |
string |
马耳他语 |
mww |
string |
白苗语(拉丁语) |
myv |
string |
厄尔兹亚语(西里尔语) |
nap |
string |
那不勒斯语 |
nb |
string |
挪威语 |
ne |
string |
尼泊尔语 |
niu |
string |
纽埃语 |
nl |
string |
荷兰语 |
no |
string |
挪威语 |
nog |
string |
诺盖语 |
oc |
string |
奥克西唐语 |
os |
string |
奥塞丁语 |
pa |
string |
旁遮普语(阿拉伯语) |
pl |
string |
波兰语 |
prs |
string |
达里语 |
ps |
string |
普什图语 |
pt |
string |
葡萄牙语 |
quc |
string |
基切语 |
rab |
string |
查姆林语 |
rm |
string |
罗曼什语 |
ro |
string |
罗马尼亚语 |
ru |
string |
俄语 |
sa |
string |
梵文 (德瓦纳吉里) |
sat |
string |
桑塔利 (德瓦纳吉里) |
sck |
string |
萨德里语(天城文) |
sco |
string |
苏格兰语 |
sk |
string |
斯洛伐克语 |
sl |
string |
斯洛文尼亚语 |
sm |
string |
萨摩亚语(拉丁语) |
sma |
string |
南萨米语 |
sme |
string |
北萨米语(拉丁语) |
smj |
string |
律勒萨米语 |
smn |
string |
伊纳里萨米语 |
sms |
string |
斯科特萨米语 |
so |
string |
索马里语(阿拉伯语) |
sq |
string |
阿尔巴尼亚语 |
sr |
string |
塞尔维亚语(拉丁) |
sr-Cyrl |
string |
塞尔维亚语(西里尔) |
sr-Latn |
string |
塞尔维亚语(拉丁) |
srx |
string |
西尔毛里语(天城文) |
sv |
string |
瑞典语 |
sw |
string |
斯瓦希里语(拉丁语) |
tet |
string |
德顿语 |
tg |
string |
塔吉克语(西里尔文) |
thf |
string |
汤米语 |
tk |
string |
土库曼语(拉丁语) |
to |
string |
汤加语 |
tr |
string |
土耳其语 |
tt |
string |
鞑靼语(拉丁语) |
tyv |
string |
图瓦语 |
ug |
string |
维吾尔语(阿拉伯语) |
unk |
string |
未知 (所有) |
ur |
string |
乌尔都语 |
uz |
string |
乌兹别克语(拉丁文) |
uz-arab |
string |
乌兹别克语(阿拉伯语) |
uz-cyrl |
string |
乌兹别克语(西里尔文) |
vo |
string |
沃拉普克语 |
wae |
string |
瓦尔瑟语 |
xnr |
string |
康格里语(天城文) |
xsr |
string |
夏尔巴语(天城文) |
yua |
string |
尤卡坦玛雅语 |
za |
string |
壮语 |
zh-Hans |
string |
简体中文 |
zh-Hant |
string |
中文(繁体) |
zu |
string |
祖鲁语 |
技能的输出字段映射。
名称 | 类型 | 说明 |
---|---|---|
name |
string |
技能定义的输出的名称。 |
targetName |
string |
输出的目标名称。 它是可选的,默认为 name。 |
使用 文本分析 API 从输入文本中提取个人信息,并提供屏蔽选项。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
string |
一个 值,该值指示要使用哪种语言代码。 默认为 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
domain |
string |
如果指定,则会将 PII 域设置为仅包含实体类别的子集。 可能的值包括:“phi”、“none”。 默认值为“none”。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
maskingCharacter |
string |
如果 maskingMode 参数设置为替换,则用于屏蔽文本的字符。 默认为 |
maskingMode |
一个参数,提供各种方法来屏蔽在输入文本中检测到的个人信息。 默认值为“none”。 |
|
minimumPrecision |
number |
一个介于 0 和 1 之间的值,用于仅包含置信度分数大于指定值的实体。 如果未设置 (默认) ,或者显式设置为 null,则将包括所有实体。 |
modelVersion |
string |
调用 文本分析 服务时要使用的模型版本。 如果未指定,将默认为最新可用版本。 建议不要指定此值,除非绝对必要。 |
name |
string |
在技能集中唯一标识技能的技能的名称。 未定义名称的技能将在 skills 数组中为其基于 1 的索引提供默认名称,前缀为 字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
|
piiCategories |
string[] |
应提取和屏蔽的 PII 实体类别列表。 |
一个字符串,指示用于屏蔽输入文本中检测到的个人信息的 maskingMode。
名称 | 类型 | 说明 |
---|---|---|
none |
string |
不会发生掩码,并且不会返回 maskedText 输出。 |
replace |
string |
将检测到的实体替换为 maskingCharacter 参数中给定的字符。 字符将重复到检测到的实体的长度,以便偏移量正确对应于输入文本和输出 maskedText。 |
描述 API 的错误条件。
名称 | 类型 | 说明 |
---|---|---|
code |
string |
服务器定义的一组错误代码中的一个。 |
details |
有关导致此项报告错误的特定错误的详细信息数组。 |
|
message |
string |
错误的用户可读表示形式。 |
定义扩充数据的 Azure Blob、表或文件的其他投影。
名称 | 类型 | 说明 |
---|---|---|
projections |
索引编制期间要执行的其他投影的列表。 |
|
storageConnectionString |
string |
存储帐户投影连接字符串将存储在 中。 |
要存储在Azure 文件存储中的数据的投影定义。
名称 | 类型 | 说明 |
---|---|---|
generatedKeyName |
string |
要存储投影的生成密钥的名称。 |
inputs |
复杂投影的嵌套输入。 |
|
referenceKeyName |
string |
不同投影的引用键的名称。 |
source |
string |
将数据源到项目。 |
sourceContext |
string |
复杂投影的源上下文。 |
storageContainer |
string |
要存储投影的 Blob 容器。 |
要存储在 Azure Blob 中的数据的投影定义。
名称 | 类型 | 说明 |
---|---|---|
generatedKeyName |
string |
要存储投影的生成密钥的名称。 |
inputs |
复杂投影的嵌套输入。 |
|
referenceKeyName |
string |
不同投影的引用键的名称。 |
source |
string |
将数据源到项目。 |
sourceContext |
string |
复杂投影的源上下文。 |
storageContainer |
string |
要存储投影的 Blob 容器。 |
各种投影选择器的容器对象。
名称 | 类型 | 说明 |
---|---|---|
files |
投影到 Azure 文件存储。 |
|
objects |
投影到 Azure Blob 存储。 |
|
tables |
投影到 Azure 表存储。 |
有关要在 Azure 表中存储的数据的说明。
名称 | 类型 | 说明 |
---|---|---|
generatedKeyName |
string |
要存储投影的生成密钥的名称。 |
inputs |
复杂投影的嵌套输入。 |
|
referenceKeyName |
string |
不同投影的引用键的名称。 |
source |
string |
将数据源到项目。 |
sourceContext |
string |
复杂投影的源上下文。 |
tableName |
string |
要在其中存储投影数据的 Azure 表的名称。 |
技能列表。
名称 | 类型 | 说明 |
---|---|---|
@odata.etag |
string |
技能组的 ETag。 |
cognitiveServices | CognitiveServicesAccount: |
有关运行技能时要使用的 Azure AI 服务的详细信息。 |
description |
string |
技能组的说明。 |
encryptionKey |
在 Azure 密钥保管库 中创建的加密密钥的说明。 当你希望完全保证任何人都(甚至 Microsoft)无法解密技能集定义时,此密钥用于为技能组定义提供额外的静态加密级别。 加密技能集定义后,它将始终保持加密状态。 搜索服务将忽略将此属性设置为 null 的尝试。 如果要轮换加密密钥,可以根据需要更改此属性;技能集定义将不受影响。 使用客户管理的密钥加密不适用于免费搜索服务,并且仅适用于 2019 年 1 月 1 日或之后创建的付费服务。 |
|
knowledgeStore |
定义扩充数据的 Azure Blob、表或文件的其他投影。 |
|
name |
string |
技能组的名称。 |
skills |
SearchIndexerSkill[]:
|
技能组中的技能列表。 |
Azure 密钥保管库中客户管理的加密密钥。 创建和管理的密钥可用于加密或解密搜索服务上的静态数据,例如索引和同义词映射。
名称 | 类型 | 说明 |
---|---|---|
accessCredentials |
用于访问 Azure 密钥保管库的可选 Azure Active Directory 凭据。 如果改用托管标识,则不需要。 |
|
keyVaultKeyName |
string |
用于加密静态数据的 Azure 密钥保管库密钥的名称。 |
keyVaultKeyVersion |
string |
Azure 密钥保管库密钥的版本,用于加密静态数据。 |
keyVaultUri |
string |
Azure 密钥保管库的 URI(也称为 DNS 名称),其中包含用于加密静态数据的密钥。 URI 示例可能是 |
文本分析正负情绪分析,评分为 0 到 1 范围内的浮点值。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
一个 值,该值指示要使用哪种语言代码。 默认为 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
SentimentSkill 支持的输入文本的语言代码。
名称 | 类型 | 说明 |
---|---|---|
da |
string |
丹麦语 |
de |
string |
德语 |
el |
string |
希腊语 |
en |
string |
英语 |
es |
string |
西班牙语 |
fi |
string |
芬兰语 |
fr |
string |
法语 |
it |
string |
意大利语 |
nl |
string |
荷兰语 |
no |
string |
挪威语 (博克马尔语) |
pl |
string |
波兰语 |
pt-PT |
string |
葡萄牙语(葡萄牙) |
ru |
string |
俄语 |
sv |
string |
瑞典语 |
tr |
string |
土耳其语 |
使用 文本分析 API 评估非结构化文本,并根据服务在句子和文档级别找到的最高置信度分数,提供情绪标签 (,如“负面”、“中性”和“积极”) 。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
|
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
|
defaultLanguageCode |
string |
一个 值,该值指示要使用哪种语言代码。 默认为 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
|
includeOpinionMining |
boolean |
False |
如果设置为 true,则技能输出将包括来自文本分析中用于观点挖掘的信息,即针对) (名词或动词及其在文本中的关联评估 (形容词) 。 默认值为 false。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
||
modelVersion |
string |
调用文本分析服务时要使用的模型版本。 如果未指定,将默认为最新可用版本。 建议不要指定此值,除非绝对必要。 |
|
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
|
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
用于重塑输出的技能。 它创建一个复杂类型以支持复合字段 (也称为多部分字段) 。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根目录或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能组中唯一标识它的技能的名称。 未定义名称的技能将在技能数组中指定其从 1 开始的索引的默认名称,前缀为字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
将字符串拆分为文本块的技能。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultLanguageCode |
一个值,该值指示要使用的语言代码。 默认为 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
maximumPageLength |
integer |
所需的最大页长度。 默认值为 10000。 |
name |
string |
在技能集中唯一标识技能的技能的名称。 未定义名称的技能将在 skills 数组中为其基于 1 的索引提供默认名称,前缀为 字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
|
textSplitMode |
指示要执行的拆分模式的值。 |
SplitSkill 支持的输入文本的语言代码。
名称 | 类型 | 说明 |
---|---|---|
am |
string |
阿姆哈拉语 |
bs |
string |
波斯尼亚语 |
cs |
string |
捷克语 |
da |
string |
丹麦语 |
de |
string |
德语 |
en |
string |
英语 |
es |
string |
西班牙语 |
et |
string |
爱沙尼亚语 |
fi |
string |
芬兰语 |
fr |
string |
法语 |
he |
string |
希伯来语 |
hi |
string |
Hindi |
hr |
string |
克罗地亚语 |
hu |
string |
匈牙利语 |
id |
string |
印度尼西亚语 |
is |
string |
冰岛语 |
it |
string |
意大利语 |
ja |
string |
日语 |
ko |
string |
韩语 |
lv |
string |
拉脱维亚语 |
nb |
string |
挪威语 |
nl |
string |
荷兰语 |
pl |
string |
波兰语 |
pt |
string |
葡萄牙语(葡萄牙) |
pt-br |
string |
葡萄牙语(巴西) |
ru |
string |
俄语 |
sk |
string |
斯洛伐克语 |
sl |
string |
斯洛文尼亚语 |
sr |
string |
塞尔维亚语 |
sv |
string |
瑞典语 |
tr |
string |
土耳其语 |
ur |
string |
乌尔都语 |
zh |
string |
中文(简体) |
指示要执行的拆分模式的值。
名称 | 类型 | 说明 |
---|---|---|
pages |
string |
将文本拆分为单独的页面。 |
sentences |
string |
将文本拆分为单独的句子。 |
将文本从一种语言翻译到另一种语言的技能。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
context |
string |
表示执行操作的级别,例如文档根或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
defaultFromLanguageCode |
对于未显式指定 from 语言的文档,要从中翻译文档的语言代码。 |
|
defaultToLanguageCode |
对于未显式指定语言的文档,用于将文档转换为的语言代码。 |
|
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能集中唯一标识技能的技能的名称。 未定义名称的技能将在 skills 数组中为其基于 1 的索引提供默认名称,前缀为 字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
|
suggestedFrom |
当未提供 fromLanguageCode 输入和 defaultFromLanguageCode 参数且自动语言检测失败时,要从中翻译文档的语言代码。 默认为 |
TextTranslationSkill 支持的输入文本的语言代码。
名称 | 类型 | 说明 |
---|---|---|
af |
string |
南非荷兰语 |
ar |
string |
阿拉伯语 |
bg |
string |
保加利亚语 |
bn |
string |
Bangla |
bs |
string |
波斯尼亚语(拉丁语系) |
ca |
string |
加泰罗尼亚语 |
cs |
string |
捷克语 |
cy |
string |
威尔士语 |
da |
string |
丹麦语 |
de |
string |
德语 |
el |
string |
希腊语 |
en |
string |
英语 |
es |
string |
西班牙语 |
et |
string |
爱沙尼亚语 |
fa |
string |
波斯语 |
fi |
string |
芬兰语 |
fil |
string |
菲律宾语 |
fj |
string |
斐济语 |
fr |
string |
法语 |
he |
string |
希伯来语 |
hi |
string |
Hindi |
hr |
string |
克罗地亚语 |
ht |
string |
海地克里奥尔语 |
hu |
string |
匈牙利语 |
id |
string |
印度尼西亚语 |
is |
string |
冰岛语 |
it |
string |
意大利语 |
ja |
string |
日语 |
ko |
string |
韩语 |
lt |
string |
立陶宛语 |
lv |
string |
拉脱维亚语 |
mg |
string |
马达加斯加语 |
ms |
string |
马来语 |
mt |
string |
马耳他语 |
mww |
string |
白苗文 |
nb |
string |
挪威语 |
nl |
string |
荷兰语 |
otq |
string |
克雷塔罗奥托米语 |
pl |
string |
波兰语 |
pt |
string |
葡萄牙语 |
ro |
string |
罗马尼亚语 |
ru |
string |
俄语 |
sk |
string |
斯洛伐克语 |
sl |
string |
斯洛文尼亚语 |
sm |
string |
萨摩亚语 |
sr-Cyrl |
string |
塞尔维亚语(西里尔) |
sr-Latn |
string |
塞尔维亚语(拉丁) |
sv |
string |
瑞典语 |
sw |
string |
斯瓦希里语 |
ta |
string |
泰米尔语 |
te |
string |
泰卢固语 |
th |
string |
泰语 |
tlh |
string |
克林贡语 |
to |
string |
汤加语 |
tr |
string |
土耳其语 |
ty |
string |
塔希提语 |
uk |
string |
乌克兰语 |
ur |
string |
乌尔都语 |
vi |
string |
越南语 |
yua |
string |
尤卡坦玛雅语 |
yue |
string |
粤语(繁体) |
zh-Hans |
string |
简体中文 |
zh-Hant |
string |
中文(繁体) |
指示要返回的视觉特征类型的字符串。
名称 | 类型 | 说明 |
---|---|---|
adult |
string |
识别为成人的视觉特征。 |
brands |
string |
识别为商业品牌的视觉特征。 |
categories |
string |
类别。 |
description |
string |
说明。 |
faces |
string |
识别为人脸的视觉特征。 |
objects |
string |
识别为对象的视觉特征。 |
tags |
string |
标记。 |
一种可以调用 Web API 终结点的技能,允许你通过调用自定义代码来扩展技能集。
名称 | 类型 | 说明 |
---|---|---|
@odata.type |
string:
#Microsoft. |
指定技能类型的 URI 片段。 |
batchSize |
integer |
指示文档数的所需批大小。 |
context |
string |
表示执行操作的级别,例如文档根或文档内容 (例如 /document 或 /document/content) 。 默认值为 /document。 |
degreeOfParallelism |
integer |
如果设置,则表示可以对 Web API 进行的并行调用数。 |
description |
string |
技能的说明,描述技能的输入、输出和用法。 |
httpHeaders |
object |
发出 http 请求所需的标头。 |
httpMethod |
string |
http 请求的 方法。 |
inputs |
技能的输入可以是源数据集中的列,也可以是上游技能的输出。 |
|
name |
string |
在技能集中唯一标识技能的技能的名称。 未定义名称的技能将在 skills 数组中为其基于 1 的索引提供默认名称,前缀为 字符 |
outputs |
技能的输出要么是搜索索引中的字段,要么是另一个技能可以用作输入的值。 |
|
timeout |
string |
请求的所需超时。 默认值为 30 秒。 |
uri |
string |
Web API 的 URL。 |