Text Dependent - Create Enrollment

註冊配置檔
將註冊新增至現有的配置檔。 如果達到要求的註冊音訊數目下限,則會建立語音列印。 如果之前已建立語音列印,它會從包括新音訊在內的所有現有註冊音訊重新建立。

限制:

  • 每個要求的音訊輸入長度下限為 1秒
  • 每個要求的音訊輸入長度上限為 10秒
  • 建立語音列印的註冊數目下限為 3
  • 建立語音列印的註冊數目上限為 50
  • (SNR) 的最小音訊號與雜訊比率為 2dB

約束:

  • 第一個註冊必須符合現有的複雜密碼。
  • 第一個註冊之後的所有註冊都必須使用第一個註冊中使用的相同複雜密碼。
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

URI 參數

名稱 位於 必要 類型 Description
endpoint
path True

string

支援的認知服務端點 (通訊協定和主機名,例如: https://westus.api.cognitive.microsoft.com) 。

profileId
path True

string

uuid

配置文件標識碼的唯一標識碼 (guid) 。

api-version
query True

string

指定用於這個要求的作業版本。

要求標頭

Media Types: "audio/wav; codecs=audio/pcm"

名稱 必要 類型 Description
Ocp-Apim-Subscription-Key True

string

要求本文

Media Types: "audio/wav; codecs=audio/pcm"

名稱 類型 Description
audioData

object

二進位音訊檔案。 支援的格式為音訊/wav;codecs=audio/pcm。 支援最多 5 MB 的音訊。

回應

名稱 類型 Description
201 Created

TdEnrollmentInfo

建立時間

Other Status Codes

SpeakerErrorInfo

失敗

Headers

x-ms-error-code: string

安全性

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

範例

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

定義

名稱 Description
Error
SpeakerErrorInfo

說話者錯誤訊息

TdEnrollmentInfo

Text-Dependent 說話者配置檔註冊資訊

TrainingStatusType

表示配置檔目前狀態的狀態。 可用值為:

  • 註冊:配置文件沒有語音列印,且尚未準備好進行辨識要求。
  • 訓練:正在建立配置文件的語音列印,目前無法用於辨識。
  • 已註冊:配置檔具有語音列印,並準備好進行辨識要求。

Error

名稱 類型 Description
code

string

message

string

SpeakerErrorInfo

說話者錯誤訊息

名稱 類型 Description
error

Error

TdEnrollmentInfo

Text-Dependent 說話者配置檔註冊資訊

名稱 類型 Description
audioLengthInSec

number

此註冊音訊長度以秒為單位。

audioSpeechLengthInSec

number

此註冊音訊純語音 (,這是移除無聲和非語音區段後音訊量,以秒為單位) 長度。

enrollmentStatus

TrainingStatusType

表示配置檔目前狀態的狀態。 可用值為:

  • 註冊:配置文件沒有語音列印,且尚未準備好進行辨識要求。
  • 訓練:正在建立配置文件的語音列印,目前無法用於辨識。
  • 已註冊:配置檔具有語音列印,並準備好進行辨識要求。
enrollmentsCount

integer

此設定檔接受的註冊音訊數目。

enrollmentsLengthInSec

number

此配置檔接受的註冊音訊總長度,以秒為單位。

enrollmentsSpeechLengthInSec

number

純語音 (的總和,這是移除無聲和非語音區段之後,) 在幾秒內所有配置檔註冊后的音頻數量。

passPhrase

string

與此註冊相關聯的複雜密碼。

profileId

string

配置文件標識碼的唯一標識碼 (guid) 。

remainingEnrollmentsCount

integer

完成配置檔註冊所需的註冊音訊數目。

TrainingStatusType

表示配置檔目前狀態的狀態。 可用值為:

  • 註冊:配置文件沒有語音列印,且尚未準備好進行辨識要求。
  • 訓練:正在建立配置文件的語音列印,目前無法用於辨識。
  • 已註冊:配置檔具有語音列印,並準備好進行辨識要求。
名稱 類型 Description
Enrolled

string

Enrolling

string

Training

string