你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Text Analysis Authoring - Import
触发作业以导入项目。 如果已存在同名的项目,则替换该项目的数据。
POST {Endpoint}/language/authoring/analyze-text/projects/{projectName}/:import?api-version=2023-04-01
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
Endpoint
|
path | True |
string |
支持的认知服务终结点 (例如 https://.api.cognitiveservices.azure.com). |
project
|
path | True |
string |
要使用的项目的名称。 |
api-version
|
query | True |
string |
客户端 API 版本。 |
请求正文
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
metadata | True |
表示项目元数据。 |
|
projectFileVersion | True |
string |
导出的文件的版本。 |
stringIndexType | True |
指定用于解释字符串偏移量的方法。 有关其他信息,请参见 https://aka.ms/text-analytics-offsets。 |
|
assets | TextAnalysisAuthoringExportedProjectAssets: |
表示项目资产。 |
响应
名称 | 类型 | 说明 |
---|---|---|
202 Accepted |
带有用于检查作业状态的 Operation-Location 标头的成功调用结果。 标头 operation-location: string |
|
Other Status Codes |
错误响应。 |
安全性
AADToken
这些是 Azure Active Directory OAuth2 流。 与 Azure 基于角色的访问控制配对时,它可用于控制对Azure Maps REST API 的访问。 Azure 基于角色的访问控制用于指定对一个或多个Azure Maps资源帐户或子资源的访问权限。 可以通过内置角色或由一个或多个权限组成的自定义角色授予任何用户、组或服务主体的访问权限,以Azure Maps REST API。
若要实现方案,建议查看 身份验证概念。 总之,此安全定义提供了一种解决方案,用于通过能够对特定 API 和作用域进行访问控制的对象对应用程序 () 建模。
备注
- 此安全定义需要使用
x-ms-client-id
标头来指示应用程序请求访问的Azure Maps资源。 这可以从 地图管理 API 获取。
Authorization URL
特定于 Azure 公有云实例。 主权云具有唯一的授权 URL 和 Azure Active Directory 配置。
* Azure 基于角色的访问控制是通过 Azure 门户、PowerShell、CLI、Azure SDK 或 REST API 从 Azure 管理平面配置的。
* 使用 Azure Maps Web SDK 允许针对多个用例对应用程序进行基于配置的设置。
- 目前,Azure Active Directory v1.0 或 v2.0 支持工作、学校和来宾,但不支持个人帐户。
类型:
oauth2
流向:
implicit
授权 URL:
https://login.microsoftonline.com/common/oauth2/authorize
作用域
名称 | 说明 |
---|---|
https://cognitiveservices.azure.com/.default | https://cognitiveservices.azure.com/.default |
Ocp-Apim-Subscription-Key
语言服务资源的订阅密钥。
类型:
apiKey
在:
header
示例
Successful Import Project
示例请求
POST {Endpoint}/language/authoring/analyze-text/projects/LoanAgreements/:import?api-version=2023-04-01
{
"projectFileVersion": "2022-05-01",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectKind": "CustomEntityRecognition",
"storageInputContainerName": "loanagreements",
"settings": {},
"projectName": "LoanAgreements",
"multilingual": false,
"description": "This is a sample dataset provided by the Azure Language service team to help users get started with [Custom named entity recognition](https://aka.ms/ct-docs). The provided sample dataset contains 20 loan agreements drawn up between two entities.",
"language": "en"
},
"assets": {
"projectKind": "CustomEntityRecognition",
"entities": [
{
"category": "Date"
},
{
"category": "LenderName"
},
{
"category": "LenderAddress"
}
],
"documents": [
{
"location": "01.txt",
"language": "en-us",
"entities": [
{
"regionOffset": 0,
"regionLength": 1793,
"labels": [
{
"category": "Date",
"offset": 5,
"length": 9
},
{
"category": "LenderName",
"offset": 273,
"length": 14
},
{
"category": "LenderAddress",
"offset": 314,
"length": 15
}
]
}
]
},
{
"location": "02.txt",
"language": "en-us",
"entities": [
{
"regionOffset": 0,
"regionLength": 1804,
"labels": [
{
"category": "Date",
"offset": 5,
"length": 10
},
{
"category": "LenderName",
"offset": 284,
"length": 10
},
{
"category": "LenderAddress",
"offset": 321,
"length": 20
}
]
}
]
}
]
}
}
示例响应
operation-location: {Endpoint}/language/authoring/analyze-text/projects/LoanAgreements/import/jobs/4d37982f-fded-4c2c-afe3-15953b5919b6_637858368000000000?api-version=2022-05-01
定义
Error
错误对象。
名称 | 类型 | 说明 |
---|---|---|
code |
服务器定义的一组错误代码中的一个。 |
|
details |
Error[] |
有关导致此项报告错误的特定错误的详细信息数组。 |
innererror |
一个 对象,该对象包含比当前对象更具体的错误信息。 |
|
message |
string |
错误的用户可读表示形式。 |
target |
string |
错误的目标。 |
ErrorCode
人类可读的错误代码。
名称 | 类型 | 说明 |
---|---|---|
AzureCognitiveSearchIndexLimitReached |
string |
|
AzureCognitiveSearchIndexNotFound |
string |
|
AzureCognitiveSearchNotFound |
string |
|
AzureCognitiveSearchThrottling |
string |
|
Conflict |
string |
|
Forbidden |
string |
|
InternalServerError |
string |
|
InvalidArgument |
string |
|
InvalidRequest |
string |
|
NotFound |
string |
|
OperationNotFound |
string |
|
ProjectNotFound |
string |
|
QuotaExceeded |
string |
|
ServiceUnavailable |
string |
|
Timeout |
string |
|
TooManyRequests |
string |
|
Unauthorized |
string |
|
Warning |
string |
ErrorResponse
错误响应。
名称 | 类型 | 说明 |
---|---|---|
error |
错误对象。 |
InnerErrorCode
人类可读的错误代码。
名称 | 类型 | 说明 |
---|---|---|
AzureCognitiveSearchNotFound |
string |
|
AzureCognitiveSearchThrottling |
string |
|
EmptyRequest |
string |
|
ExtractionFailure |
string |
|
InvalidCountryHint |
string |
|
InvalidDocument |
string |
|
InvalidDocumentBatch |
string |
|
InvalidParameterValue |
string |
|
InvalidRequest |
string |
|
InvalidRequestBodyFormat |
string |
|
KnowledgeBaseNotFound |
string |
|
MissingInputDocuments |
string |
|
ModelVersionIncorrect |
string |
|
UnsupportedLanguageCode |
string |
InnerErrorModel
包含有关错误的更具体信息的对象。 根据 Microsoft One API 指南 - https://github.com/Microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses。
名称 | 类型 | 说明 |
---|---|---|
code |
服务器定义的一组错误代码中的一个。 |
|
details |
object |
错误详细信息。 |
innererror |
一个 对象,该对象包含比当前对象更具体的错误信息。 |
|
message |
string |
错误消息。 |
target |
string |
错误目标。 |
ProjectKind
项目类型。
名称 | 类型 | 说明 |
---|---|---|
CustomEntityRecognition |
string |
用于生成提取模型,以使用自己的数据标识域类别。 |
CustomMultiLabelClassification |
string |
用于生成分类模型以使用自己的数据对文本进行分类。 每个文件可以有一个或多个标签。 例如,文件 1 分类为 A、B 和 C,文件 2 分类为 B 和 C。 |
CustomSingleLabelClassification |
string |
用于生成分类模型以使用自己的数据对文本进行分类。 每个文件将只有一个标签。 例如,文件 1 分类为 A,文件 2 分类为 B。 |
StringIndexType
指定用于解释字符串偏移量的方法。 有关其他信息,请参见 https://aka.ms/text-analytics-offsets。
名称 | 类型 | 说明 |
---|---|---|
Utf16CodeUnit |
string |
偏移量和长度值将对应于 UTF-16 代码单位。 如果应用程序是使用支持 Unicode 的语言编写的,例如 Java、JavaScript,请使用此选项。 |
TextAnalysisAuthoringCreateProjectOptions
表示用于创建或更新项目的选项。
名称 | 类型 | 说明 |
---|---|---|
description |
string |
项目说明。 |
language |
string |
项目语言。 这是语言的 BCP-47 表示形式。 例如,将“en”用于英语,“en-gb”用于英语 (英国) ,“es”用于西班牙语等。 |
multilingual |
boolean |
项目是否将用于多种语言。 |
projectKind |
项目类型。 |
|
projectName |
string |
新项目名称。 |
settings |
项目设置。 |
|
storageInputContainerName |
string |
存储容器名称。 |
TextAnalysisAuthoringExportedClass
表示已导出项目的类。
名称 | 类型 | 说明 |
---|---|---|
category |
string |
类类别。 |
TextAnalysisAuthoringExportedCustomEntityRecognitionDocument
表示自定义实体识别项目的导出文档。
名称 | 类型 | 说明 |
---|---|---|
dataset |
string |
本文档的数据集。 允许的值为“Train”和“Test”。 |
entities |
属于文档的实体标签列表。 |
|
language |
string |
表示文档语言。 这是语言的 BCP-47 表示形式。 例如,将“en”用于英语,“en-gb”用于英语 (英国) ,“es”用于西班牙语等。 |
location |
string |
文档在存储中的位置。 |
TextAnalysisAuthoringExportedCustomEntityRecognitionProjectAssets
表示实体识别项目的导出资产。
名称 | 类型 | 说明 |
---|---|---|
documents |
Text |
属于项目的文档列表。 |
entities |
属于项目的实体列表。 |
|
projectKind |
string:
Custom |
资产所属的项目的类型。 |
TextAnalysisAuthoringExportedCustomMultiLabelClassificationDocument
表示自定义多标签分类项目的导出文档。
名称 | 类型 | 说明 |
---|---|---|
classes |
文档类。 |
|
dataset |
string |
本文档的数据集。 允许的值为“Train”和“Test”。 |
language |
string |
表示文档语言。 这是语言的 BCP-47 表示形式。 例如,将“en”用于英语,“en-gb”用于英语 (英国) ,“es”用于西班牙语等。 |
location |
string |
文档在存储中的位置。 |
TextAnalysisAuthoringExportedCustomMultiLabelClassificationProjectAssets
表示自定义多标签分类项目的导出资产。
名称 | 类型 | 说明 |
---|---|---|
classes |
项目中的类列表。 |
|
documents |
Text |
项目中的文档列表。 |
projectKind |
string:
Custom |
资产所属的项目的类型。 |
TextAnalysisAuthoringExportedCustomSingleLabelClassificationDocument
表示自定义单标签分类项目的导出文档。
名称 | 类型 | 说明 |
---|---|---|
class |
文档的类。 |
|
dataset |
string |
本文档的数据集。 允许的值为“Train”和“Test”。 |
language |
string |
表示文档语言。 这是语言的 BCP-47 表示形式。 例如,将“en”用于英语,“en-gb”用于英语 (英国) ,“es”用于西班牙语等。 |
location |
string |
文档在存储中的位置。 |
TextAnalysisAuthoringExportedCustomSingleLabelClassificationProjectAssets
表示单标签分类项目的导出资产。
名称 | 类型 | 说明 |
---|---|---|
classes |
属于此项目的类列表。 |
|
documents |
Text |
属于此项目的文档列表。 |
projectKind |
string:
Custom |
资产所属的项目的类型。 |
TextAnalysisAuthoringExportedDocumentClass
表示文档的分类标签。
名称 | 类型 | 说明 |
---|---|---|
category |
string |
TextAnalysisAuthoringExportedDocumentEntityLabel
表示文档的实体标签。
名称 | 类型 | 说明 |
---|---|---|
category |
string |
实体类别。 |
length |
integer |
实体文本的长度。 |
offset |
integer |
实体文本的起始位置。 |
TextAnalysisAuthoringExportedDocumentRegion
表示文档中用于实体标记的区域。
名称 | 类型 | 说明 |
---|---|---|
labels |
属于此区域的实体标签列表。 |
|
regionLength |
integer |
区域文本的长度。 |
regionOffset |
integer |
区域的起始位置。 |
TextAnalysisAuthoringExportedEntity
表示导出项目中的实体。
名称 | 类型 | 说明 |
---|---|---|
category |
string |
实体类别。 |
TextAnalysisAuthoringExportedProject
表示导出的项目。
名称 | 类型 | 说明 |
---|---|---|
assets | TextAnalysisAuthoringExportedProjectAssets: |
表示项目资产。 |
metadata |
表示项目元数据。 |
|
projectFileVersion |
string |
导出的文件的版本。 |
stringIndexType |
指定用于解释字符串偏移量的方法。 有关其他信息,请参见 https://aka.ms/text-analytics-offsets。 |
TextAnalysisAuthoringProjectSettings
表示用于定义项目行为的设置。
名称 | 类型 | 说明 |
---|---|---|
confidenceThreshold |
number |
置信度最高的类的阈值,在此阈值下,预测将自动更改为“无”。 阈值的值应介于 0 和 1(含 1)之间。 |