Text Dependent - Create Enrollment
Profil d’inscription
Ajoute une inscription à un profil existant.
Si le nombre minimal d’enregistrements audio d’inscription demandés est atteint, une empreinte vocale est créée.
Si l’impression vocale a été créée avant, elle est recréée à partir de tous les fichiers audio d’inscription existants, y compris le nouveau.
Limites :
- La longueur minimale d’entrée audio par requête est de 1 seconde
- La longueur maximale d’entrée audio par requête est de 10 secondes
- Le nombre minimal d’inscriptions pour la création d’une empreinte vocale est de 3
- Le nombre maximal d’inscriptions pour la création d’une empreinte vocale est de 50
- Le rapport signal/bruit (SNR) audio minimal est de 2 dB
Contraintes :
- La première inscription doit correspondre à une phrase secrète existante.
- Toutes les inscriptions après la première doivent utiliser la même phrase secrète que dans la première inscription.
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Identificateur unique pour l’ID de profil (guid). |
api-version
|
query | True |
string |
Spécifie la version de l'opération à utiliser pour cette demande. |
En-tête de la demande
Media Types: "audio/wav; codecs=audio/pcm"
Nom | Obligatoire | Type | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Corps de la demande
Media Types: "audio/wav; codecs=audio/pcm"
Nom | Type | Description |
---|---|---|
audioData |
object |
Fichier audio binaire. Les formats pris en charge sont audio/wav ; codecs=audio/pcm. Prend en charge l’audio jusqu’à 5 Mo. |
Réponses
Nom | Type | Description |
---|---|---|
201 Created |
Date de création |
|
Other Status Codes |
Échec Headers x-ms-error-code: string |
Sécurité
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exemples
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsCount": 2,
"passPhrase": "my voice is my passport verify me",
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Définitions
Nom | Description |
---|---|
Error | |
Speaker |
Message d’erreur de l’orateur |
Td |
Text-Dependent informations d’inscription au profil Speaker |
Training |
État représentant l’état actuel du profil. Les valeurs disponibles sont :
|
Error
Nom | Type | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Message d’erreur de l’orateur
Nom | Type | Description |
---|---|---|
error |
TdEnrollmentInfo
Text-Dependent informations d’inscription au profil Speaker
Nom | Type | Description |
---|---|---|
audioLengthInSec |
number |
Cette durée audio d’inscription en secondes. |
audioSpeechLengthInSec |
number |
Cette inscription audio pure speech (qui correspond à la quantité d’audio après la suppression des segments de silence et non vocaux) en secondes. |
enrollmentStatus |
État représentant l’état actuel du profil. Les valeurs disponibles sont :
|
|
enrollmentsCount |
integer |
Nombre d’audios d’inscription acceptés pour ce profil. |
enrollmentsLengthInSec |
number |
Durée totale des enregistrements audio d’inscription acceptés pour ce profil en secondes. |
enrollmentsSpeechLengthInSec |
number |
Somme de la parole pure (qui correspond à la quantité d’audio après la suppression des segments silence et non vocaux) pour toutes les inscriptions de profil en quelques secondes. |
passPhrase |
string |
Phrase secrète associée à cette inscription. |
profileId |
string |
Identificateur unique pour l’ID de profil (guid). |
remainingEnrollmentsCount |
integer |
Nombre d’enregistrements audio d’inscription nécessaires pour terminer l’inscription du profil. |
TrainingStatusType
État représentant l’état actuel du profil. Les valeurs disponibles sont :
- Inscription : le profil n’a pas d’empreinte vocale et n’est pas prêt pour les demandes de reconnaissance.
- Formation : l’impression vocale du profil est en cours de création et ne peut pas être utilisée pour la reconnaissance pour le moment.
- Inscrit : le profil a une empreinte vocale et est prêt pour les demandes de reconnaissance.
Nom | Type | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |