Text Dependent - Create Enrollment
註冊配置檔
將註冊新增至現有的配置檔。
如果達到要求的註冊音訊數目下限,則會建立語音列印。
如果之前已建立語音列印,它會從包括新音訊在內的所有現有註冊音訊重新建立。
限制:
- 每個要求的音訊輸入長度下限為 1秒
- 每個要求的音訊輸入長度上限為 10秒
- 建立語音列印的註冊數目下限為 3
- 建立語音列印的註冊數目上限為 50
- (SNR) 的最小音訊號與雜訊比率為 2dB
約束:
- 第一個註冊必須符合現有的複雜密碼。
- 第一個註冊之後的所有註冊都必須使用第一個註冊中使用的相同複雜密碼。
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05
URI 參數
名稱 | 位於 | 必要 | 類型 | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
支援的認知服務端點 (通訊協定和主機名,例如: https://westus.api.cognitive.microsoft.com) 。 |
profile
|
path | True |
string uuid |
配置文件標識碼的唯一標識碼 (guid) 。 |
api-version
|
query | True |
string |
指定用於這個要求的作業版本。 |
要求標頭
Media Types: "audio/wav; codecs=audio/pcm"
名稱 | 必要 | 類型 | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
要求本文
Media Types: "audio/wav; codecs=audio/pcm"
名稱 | 類型 | Description |
---|---|---|
audioData |
object |
二進位音訊檔案。 支援的格式為音訊/wav;codecs=audio/pcm。 支援最多 5 MB 的音訊。 |
回應
名稱 | 類型 | Description |
---|---|---|
201 Created |
建立時間 |
|
Other Status Codes |
失敗 Headers x-ms-error-code: string |
安全性
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
範例
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsCount": 2,
"passPhrase": "my voice is my passport verify me",
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
定義
名稱 | Description |
---|---|
Error | |
Speaker |
說話者錯誤訊息 |
Td |
Text-Dependent 說話者配置檔註冊資訊 |
Training |
表示配置檔目前狀態的狀態。 可用值為:
|
Error
名稱 | 類型 | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
說話者錯誤訊息
名稱 | 類型 | Description |
---|---|---|
error |
TdEnrollmentInfo
Text-Dependent 說話者配置檔註冊資訊
名稱 | 類型 | Description |
---|---|---|
audioLengthInSec |
number |
此註冊音訊長度以秒為單位。 |
audioSpeechLengthInSec |
number |
此註冊音訊純語音 (,這是移除無聲和非語音區段後音訊量,以秒為單位) 長度。 |
enrollmentStatus |
表示配置檔目前狀態的狀態。 可用值為:
|
|
enrollmentsCount |
integer |
此設定檔接受的註冊音訊數目。 |
enrollmentsLengthInSec |
number |
此配置檔接受的註冊音訊總長度,以秒為單位。 |
enrollmentsSpeechLengthInSec |
number |
純語音 (的總和,這是移除無聲和非語音區段之後,) 在幾秒內所有配置檔註冊后的音頻數量。 |
passPhrase |
string |
與此註冊相關聯的複雜密碼。 |
profileId |
string |
配置文件標識碼的唯一標識碼 (guid) 。 |
remainingEnrollmentsCount |
integer |
完成配置檔註冊所需的註冊音訊數目。 |
TrainingStatusType
表示配置檔目前狀態的狀態。 可用值為:
- 註冊:配置文件沒有語音列印,且尚未準備好進行辨識要求。
- 訓練:正在建立配置文件的語音列印,目前無法用於辨識。
- 已註冊:配置檔具有語音列印,並準備好進行辨識要求。
名稱 | 類型 | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |