Text Dependent - Create Enrollment

リファレンス

Service:: Speaker Recognition

API Version:: 2021-09-05

プロファイルの登録
既存のプロファイルに登録を追加します。要求された登録オーディオの最小数に達すると、音声印刷が作成されます。以前に音声印刷が作成された場合は、新しいオーディオを含むすべての既存の登録オーディオから再作成されます。

制限事項:

要求あたりのオーディオ入力の最小長は 1 秒です
要求あたりのオーディオ入力の最大長は 10 秒です
ボイスプリントを作成するための登録の最小数は 3 です
ボイスプリントを作成するための登録の最大数は 50 です
最小オーディオ信号対ノイズ比 (SNR) は 2dB です

制約:

最初の登録は、既存のパスフレーズと一致している必要があります。
最初の登録の後のすべての登録では、最初の登録で使用されたものと同じパスフレーズを使用する必要があります。

POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

URI パラメーター

名前	/	必須	型	説明
endpoint	path	True	string	サポートされている Cognitive Services エンドポイント (プロトコルとホスト名など)。 https://westus.api.cognitive.microsoft.com
profileId	path	True	string uuid	プロファイル ID (guid) の一意識別子。
api-version	query	True	string	この要求に使用する操作のバージョンを指定します。

要求ヘッダー

Media Types: "audio/wav; codecs=audio/pcm"

名前	必須	型	説明
Ocp-Apim-Subscription-Key	True	string

要求本文

Media Types: "audio/wav; codecs=audio/pcm"

名前	型	説明
audioData	object	バイナリオーディオファイル。サポートされている形式はオーディオ/wav です。codecs=audio/pcm。最大 5 MB のオーディオをサポートします。

応答

名前	型	説明
201 Created	TdEnrollmentInfo	作成済み
Other Status Codes	SpeakerErrorInfo	障害 Headers x-ms-error-code: string

名前

型

説明

201 Created

TdEnrollmentInfo

作成済み

Other Status Codes

SpeakerErrorInfo

障害

Headers

x-ms-error-code: string

セキュリティ

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

例

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Status code:: 201

Content-Type: application/json

Response Body

{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

定義

名前	説明
Error
SpeakerErrorInfo	話者のエラーメッセージ
TdEnrollmentInfo	Text-Dependent Speaker プロファイルの登録情報
TrainingStatusType	プロファイルの現在の状態を表す状態。使用可能な値は次のとおりです。登録中: プロファイルには音声印刷がなく、認識要求の準備ができていません。トレーニング: プロファイルの音声印刷が作成されており、現時点では認識に使用できません。登録済み: プロファイルには音声印刷があり、認識要求の準備ができています。

Error

名前	型	説明
code	string
message	string

SpeakerErrorInfo

話者のエラーメッセージ

名前	型	説明
error	Error

TdEnrollmentInfo

Text-Dependent Speaker プロファイルの登録情報

名前	型	説明
audioLengthInSec	number	この登録オーディオの長さ (秒単位)。
audioSpeechLengthInSec	number	この登録オーディオの純粋音声 (無音セグメントと非音声セグメントを削除した後のオーディオの量) の長さ (秒単位)。
enrollmentStatus	TrainingStatusType	プロファイルの現在の状態を表す状態。使用可能な値は次のとおりです。登録中: プロファイルには音声印刷がなく、認識要求の準備ができていません。トレーニング: プロファイルの音声印刷が作成されており、現時点では認識に使用できません。登録済み: プロファイルには音声印刷があり、認識要求の準備ができています。
enrollmentsCount	integer	このプロファイルで受け入れられる登録オーディオの数。
enrollmentsLengthInSec	number	このプロファイルで受け入れられる登録オーディオの合計長 (秒単位)。
enrollmentsSpeechLengthInSec	number	すべてのプロファイル登録で、純粋な音声 (無音と音声以外のセグメントを削除した後のオーディオの量) を秒単位で合計します。
passPhrase	string	この登録に関連付けられているパスフレーズ。
profileId	string	プロファイル ID (guid) の一意識別子。
remainingEnrollmentsCount	integer	プロファイルの登録を完了するために必要な登録オーディオの数。

TrainingStatusType

プロファイルの現在の状態を表す状態。使用可能な値は次のとおりです。

登録中: プロファイルには音声印刷がなく、認識要求の準備ができていません。
トレーニング: プロファイルの音声印刷が作成されており、現時点では認識に使用できません。
登録済み: プロファイルには音声印刷があり、認識要求の準備ができています。

名前	型	説明
Enrolled	string
Enrolling	string
Training	string

Text Dependent - Create Enrollment

URI パラメーター

要求ヘッダー

要求本文

応答

セキュリティ

Ocp-Apim-Subscription-Key

例

Successful Query

Sample Request

Sample Response

定義

Error

SpeakerErrorInfo

TdEnrollmentInfo

TrainingStatusType

その他のリソース