Text Independent - Create Enrollment
Profil d’inscription
Ajoute une inscription à un profil existant.
La première inscription doit être une expression d’activation prédéfinie qui peut être répertoriée à l’aide de l’API /phrases/{locale}.
Si le nombre minimal d’audios d’inscription demandés est atteint, une impression vocale est créée.
Toute inscription supplémentaire sera utilisée pour améliorer l’impression vocale.
Limites :
La longueur d’entrée audio minimale par demande est de 1 seconde
La longueur maximale d’entrée audio par requête est de 120 secondes
La longueur totale effective minimale de la voix (à l’exception du silence et des autres trames non vocales) pour la création d’une empreinte vocale est de 20 secondes Cette limitation peut être désactivée en définissant « ignoreMinLength » sur true.
La longueur totale maximale d’entrée audio autorisée pour la création d’une empreinte vocale est de 300 secondes
Le rapport signal/bruit (SNR) audio minimal est de 2 dB
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Identificateur unique pour l’ID de profil (GUID). |
api-version
|
query | True |
string |
Spécifie la version de l'opération à utiliser pour cette demande. |
ignore
|
query |
boolean |
Si la valeur est true, une impression vocale est créée immédiatement pour ce profil, quelle que soit la quantité de parole fournie ou stockée. La valeur par défaut est false. |
En-tête de la demande
Media Types: "audio/wav; codecs=audio/pcm"
Nom | Obligatoire | Type | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Corps de la demande
Media Types: "audio/wav; codecs=audio/pcm"
Nom | Type | Description |
---|---|---|
audioData |
object |
Fichier audio binaire. Les formats pris en charge sont audio/wav ; codecs=audio/pcm. Prend en charge l’audio jusqu’à 5 Mo. |
Réponses
Nom | Type | Description |
---|---|---|
201 Created |
Date de création |
|
Other Status Codes |
Échec Headers x-ms-error-code: string |
Sécurité
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exemples
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Définitions
Nom | Description |
---|---|
Error | |
Speaker |
Message d’erreur de l’orateur |
Ti |
Text-Independent informations d’inscription du profil Speaker |
Training |
État représentant l’état actuel du profil. Les valeurs disponibles sont :
|
Error
Nom | Type | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Message d’erreur de l’orateur
Nom | Type | Description |
---|---|---|
error |
TiEnrollmentInfo
Text-Independent informations d’inscription du profil Speaker
Nom | Type | Description |
---|---|---|
audioLengthInSec |
number |
Cette durée audio d’inscription est en secondes. |
audioSpeechLengthInSec |
number |
Cette voix audio pure d’inscription (qui correspond à la quantité d’audio après la suppression des segments de silence et non vocaux) est longue en secondes. |
enrollmentStatus |
État représentant l’état actuel du profil. Les valeurs disponibles sont :
|
|
enrollmentsCount |
integer |
Nombre d’audios d’inscription acceptés pour ce profil. |
enrollmentsLengthInSec |
number |
Durée totale des enregistrements audio d’inscription acceptés pour ce profil en secondes. |
enrollmentsSpeechLengthInSec |
number |
Somme de la parole pure (qui correspond à la quantité d’audio après la suppression des segments de silence et non vocaux) sur toutes les inscriptions de profil en quelques secondes. |
profileId |
string |
Identificateur unique pour l’ID de profil (GUID). |
remainingEnrollmentsSpeechLengthInSec |
number |
Quantité de voix pure (qui correspond à la quantité d’audio après la suppression des segments de silence et non vocaux) nécessaire pour terminer l’inscription du profil en quelques secondes. |
TrainingStatusType
État représentant l’état actuel du profil. Les valeurs disponibles sont :
- Inscription : le profil n’a pas d’impression vocale et n’est pas prêt pour les demandes de reconnaissance.
- Formation : l’impression vocale du profil est en cours de création et ne peut pas être utilisée pour la reconnaissance pour le moment.
- Inscrit : le profil a une impression vocale et prêt pour les demandes de reconnaissance.
Nom | Type | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |