你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Text Independent - Create Enrollment

注册配置文件
向现有配置文件添加注册。 第一个注册必须是可以使用 /phrases/{locale} API 列出的预定义激活短语。 如果达到请求的注册音频的最小数量,则会创建语音打印。 进一步注册将用于改进语音打印。

的限制:

  • 每个请求的最小音频输入长度为 1 秒

  • 每个请求的最大音频输入长度为 120 秒

  • 最小有效语音长度 (不包括静音和其他非语音帧,) 创建声纹为 20 秒 此限制,可以通过将 ignoreMinLength 设置为 true 来禁用。

  • 创建声纹时允许的最大音频输入长度为 300 秒

  • 最小音频信噪比 (SNR) 为 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI 参数

名称 必需 类型 说明
endpoint
path True

string

支持的认知服务终结点 (协议和主机名,例如: https://westus.api.cognitive.microsoft.com) 。

profileId
path True

string

uuid

配置文件 ID (guid) 的唯一标识符。

api-version
query True

string

指定用于此请求的操作的版本。

ignoreMinLength
query

boolean

如果为 true,将立即为此配置文件创建语音打印,而不考虑提供或存储了多少语音。 默认值为 false。

请求头

Media Types: "audio/wav; codecs=audio/pcm"

名称 必需 类型 说明
Ocp-Apim-Subscription-Key True

string

请求正文

Media Types: "audio/wav; codecs=audio/pcm"

名称 类型 说明
audioData

object

二进制音频文件。 支持的格式为 audio/wav;codecs=audio/pcm。 支持最大 5MB 的音频。

响应

名称 类型 说明
201 Created

TiEnrollmentInfo

创建

Other Status Codes

SpeakerErrorInfo

失败

标头

x-ms-error-code: string

安全性

Ocp-Apim-Subscription-Key

类型: apiKey
在: header

示例

Successful Query

示例请求

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

示例响应

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

定义

名称 说明
Error
SpeakerErrorInfo

扬声器错误消息

TiEnrollmentInfo

演讲者个人资料注册信息

TrainingStatusType

表示配置文件注册的当前状态的状态。 可用值为:

  • 正在注册:配置文件没有语音打印,也没有准备好进行识别请求。
  • 培训:正在创建配置文件的语音打印,目前无法用于识别。
  • 已注册:配置文件具有语音打印,并已准备好接受识别请求。

Error

名称 类型 说明
code

string

message

string

SpeakerErrorInfo

扬声器错误消息

名称 类型 说明
error

Error

TiEnrollmentInfo

演讲者个人资料注册信息

名称 类型 说明
audioLengthInSec

number

此注册音频长度(以秒为单位)。

audioSpeechLengthInSec

number

此注册音频纯语音 (这是删除静音和非语音段后音频的数量,) 长度(以秒为单位)。

enrollmentStatus

TrainingStatusType

表示配置文件注册的当前状态的状态。 可用值为:

  • 正在注册:配置文件没有语音打印,也没有准备好进行识别请求。
  • 培训:正在创建配置文件的语音打印,目前无法用于识别。
  • 已注册:配置文件具有语音打印,并已准备好接受识别请求。
enrollmentsCount

integer

此配置文件接受的注册音频数。

enrollmentsLengthInSec

number

此配置文件接受的注册音频的总长度(以秒为单位)。

enrollmentsSpeechLengthInSec

number

纯语音 (,即删除所有配置文件注册的静音和非语音段后) 的音频量(以秒为单位)。

profileId

string

配置文件 ID (guid) 的唯一标识符。

remainingEnrollmentsSpeechLengthInSec

number

纯语音 (量,即删除静音和非语音段后) 在几秒钟内完成配置文件注册所需的音频量。

TrainingStatusType

表示配置文件注册的当前状态的状态。 可用值为:

  • 正在注册:配置文件没有语音打印,也没有准备好进行识别请求。
  • 培训:正在创建配置文件的语音打印,目前无法用于识别。
  • 已注册:配置文件具有语音打印,并已准备好接受识别请求。
名称 类型 说明
Enrolled

string

Enrolling

string

Training

string