Text Dependent - Create Enrollment

プロファイルの登録
既存のプロファイルに登録を追加します。 要求された登録オーディオの最小数に達すると、音声印刷が作成されます。 以前に音声印刷が作成された場合は、新しいオーディオを含むすべての既存の登録オーディオから再作成されます。

制限事項:

  • 要求あたりのオーディオ入力の最小長は 1 秒です
  • 要求あたりのオーディオ入力の最大長は 10 秒です
  • ボイスプリントを作成するための登録の最小数は 3 です
  • ボイスプリントを作成するための登録の最大数は 50 です
  • 最小オーディオ信号対ノイズ比 (SNR) は 2dB です

制約:

  • 最初の登録は、既存のパスフレーズと一致している必要があります。
  • 最初の登録の後のすべての登録では、最初の登録で使用されたものと同じパスフレーズを使用する必要があります。
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

URI パラメーター

名前 / 必須 説明
endpoint
path True

string

サポートされている Cognitive Services エンドポイント (プロトコルとホスト名など)。 https://westus.api.cognitive.microsoft.com

profileId
path True

string

uuid

プロファイル ID (guid) の一意識別子。

api-version
query True

string

この要求に使用する操作のバージョンを指定します。

要求ヘッダー

Media Types: "audio/wav; codecs=audio/pcm"

名前 必須 説明
Ocp-Apim-Subscription-Key True

string

要求本文

Media Types: "audio/wav; codecs=audio/pcm"

名前 説明
audioData

object

バイナリ オーディオ ファイル。 サポートされている形式はオーディオ/wav です。codecs=audio/pcm。 最大 5 MB のオーディオをサポートします。

応答

名前 説明
201 Created

TdEnrollmentInfo

作成済み

Other Status Codes

SpeakerErrorInfo

障害

Headers

x-ms-error-code: string

セキュリティ

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

定義

名前 説明
Error
SpeakerErrorInfo

話者のエラー メッセージ

TdEnrollmentInfo

Text-Dependent Speaker プロファイルの登録情報

TrainingStatusType

プロファイルの現在の状態を表す状態。 使用可能な値は次のとおりです。

  • 登録中: プロファイルには音声印刷がなく、認識要求の準備ができていません。
  • トレーニング: プロファイルの音声印刷が作成されており、現時点では認識に使用できません。
  • 登録済み: プロファイルには音声印刷があり、認識要求の準備ができています。

Error

名前 説明
code

string

message

string

SpeakerErrorInfo

話者のエラー メッセージ

名前 説明
error

Error

TdEnrollmentInfo

Text-Dependent Speaker プロファイルの登録情報

名前 説明
audioLengthInSec

number

この登録オーディオの長さ (秒単位)。

audioSpeechLengthInSec

number

この登録オーディオの純粋音声 (無音セグメントと非音声セグメントを削除した後のオーディオの量) の長さ (秒単位)。

enrollmentStatus

TrainingStatusType

プロファイルの現在の状態を表す状態。 使用可能な値は次のとおりです。

  • 登録中: プロファイルには音声印刷がなく、認識要求の準備ができていません。
  • トレーニング: プロファイルの音声印刷が作成されており、現時点では認識に使用できません。
  • 登録済み: プロファイルには音声印刷があり、認識要求の準備ができています。
enrollmentsCount

integer

このプロファイルで受け入れられる登録オーディオの数。

enrollmentsLengthInSec

number

このプロファイルで受け入れられる登録オーディオの合計長 (秒単位)。

enrollmentsSpeechLengthInSec

number

すべてのプロファイル登録で、純粋な音声 (無音と音声以外のセグメントを削除した後のオーディオの量) を秒単位で合計します。

passPhrase

string

この登録に関連付けられているパスフレーズ。

profileId

string

プロファイル ID (guid) の一意識別子。

remainingEnrollmentsCount

integer

プロファイルの登録を完了するために必要な登録オーディオの数。

TrainingStatusType

プロファイルの現在の状態を表す状態。 使用可能な値は次のとおりです。

  • 登録中: プロファイルには音声印刷がなく、認識要求の準備ができていません。
  • トレーニング: プロファイルの音声印刷が作成されており、現時点では認識に使用できません。
  • 登録済み: プロファイルには音声印刷があり、認識要求の準備ができています。
名前 説明
Enrolled

string

Enrolling

string

Training

string