Text Dependent - Create Enrollment
プロファイルの登録
既存のプロファイルに登録を追加します。
要求された登録オーディオの最小数に達すると、音声印刷が作成されます。
以前に音声印刷が作成された場合は、新しいオーディオを含むすべての既存の登録オーディオから再作成されます。
制限事項:
- 要求あたりのオーディオ入力の最小長は 1 秒です
- 要求あたりのオーディオ入力の最大長は 10 秒です
- ボイスプリントを作成するための登録の最小数は 3 です
- ボイスプリントを作成するための登録の最大数は 50 です
- 最小オーディオ信号対ノイズ比 (SNR) は 2dB です
制約:
- 最初の登録は、既存のパスフレーズと一致している必要があります。
- 最初の登録の後のすべての登録では、最初の登録で使用されたものと同じパスフレーズを使用する必要があります。
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05
URI パラメーター
名前 | / | 必須 | 型 | 説明 |
---|---|---|---|---|
endpoint
|
path | True |
string |
サポートされている Cognitive Services エンドポイント (プロトコルとホスト名など)。 https://westus.api.cognitive.microsoft.com |
profile
|
path | True |
string uuid |
プロファイル ID (guid) の一意識別子。 |
api-version
|
query | True |
string |
この要求に使用する操作のバージョンを指定します。 |
要求ヘッダー
Media Types: "audio/wav; codecs=audio/pcm"
名前 | 必須 | 型 | 説明 |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
要求本文
Media Types: "audio/wav; codecs=audio/pcm"
名前 | 型 | 説明 |
---|---|---|
audioData |
object |
バイナリ オーディオ ファイル。 サポートされている形式はオーディオ/wav です。codecs=audio/pcm。 最大 5 MB のオーディオをサポートします。 |
応答
名前 | 型 | 説明 |
---|---|---|
201 Created |
作成済み |
|
Other Status Codes |
障害 Headers x-ms-error-code: string |
セキュリティ
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
例
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsCount": 2,
"passPhrase": "my voice is my passport verify me",
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
定義
名前 | 説明 |
---|---|
Error | |
Speaker |
話者のエラー メッセージ |
Td |
Text-Dependent Speaker プロファイルの登録情報 |
Training |
プロファイルの現在の状態を表す状態。 使用可能な値は次のとおりです。
|
Error
名前 | 型 | 説明 |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
話者のエラー メッセージ
名前 | 型 | 説明 |
---|---|---|
error |
TdEnrollmentInfo
Text-Dependent Speaker プロファイルの登録情報
名前 | 型 | 説明 |
---|---|---|
audioLengthInSec |
number |
この登録オーディオの長さ (秒単位)。 |
audioSpeechLengthInSec |
number |
この登録オーディオの純粋音声 (無音セグメントと非音声セグメントを削除した後のオーディオの量) の長さ (秒単位)。 |
enrollmentStatus |
プロファイルの現在の状態を表す状態。 使用可能な値は次のとおりです。
|
|
enrollmentsCount |
integer |
このプロファイルで受け入れられる登録オーディオの数。 |
enrollmentsLengthInSec |
number |
このプロファイルで受け入れられる登録オーディオの合計長 (秒単位)。 |
enrollmentsSpeechLengthInSec |
number |
すべてのプロファイル登録で、純粋な音声 (無音と音声以外のセグメントを削除した後のオーディオの量) を秒単位で合計します。 |
passPhrase |
string |
この登録に関連付けられているパスフレーズ。 |
profileId |
string |
プロファイル ID (guid) の一意識別子。 |
remainingEnrollmentsCount |
integer |
プロファイルの登録を完了するために必要な登録オーディオの数。 |
TrainingStatusType
プロファイルの現在の状態を表す状態。 使用可能な値は次のとおりです。
- 登録中: プロファイルには音声印刷がなく、認識要求の準備ができていません。
- トレーニング: プロファイルの音声印刷が作成されており、現時点では認識に使用できません。
- 登録済み: プロファイルには音声印刷があり、認識要求の準備ができています。
名前 | 型 | 説明 |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |