Text Dependent - Create Enrollment
Inscribir perfil
Agrega una inscripción al perfil existente.
Si se alcanza el número mínimo de audios de inscripción solicitados, se crea una impresión de voz.
Si la impresión de voz se creó antes, se vuelve a crear a partir de todos los audios de inscripción existentes, incluido el nuevo.
Limitaciones:
- La longitud mínima de entrada de audio por solicitud es de 1 segundo
- La longitud máxima de entrada de audio por solicitud es de 10 segundos.
- El número mínimo de inscripciones para crear una huella de voz es 3
- El número máximo de inscripciones para crear una huella de voz es de 50
- La relación mínima de señal a ruido de audio (SNR) es 2dB
Restricciones:
- La primera inscripción debe coincidir con una frase de contraseña existente.
- Todas las inscripciones después de la primera, deben usar la misma frase de contraseña usada en la primera inscripción.
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05
Parámetros de identificador URI
Nombre | En | Requerido | Tipo | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Identificador único del identificador de perfil (GUID). |
api-version
|
query | True |
string |
Especifica la versión de la operación que se utiliza para esta solicitud. |
Encabezado de la solicitud
Media Types: "audio/wav; codecs=audio/pcm"
Nombre | Requerido | Tipo | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Cuerpo de la solicitud
Media Types: "audio/wav; codecs=audio/pcm"
Nombre | Tipo | Description |
---|---|---|
audioData |
object |
Archivo de audio binario. Los formatos admitidos son audio/wav; codecs=audio/pcm. Admite audio de hasta 5 MB. |
Respuestas
Nombre | Tipo | Description |
---|---|---|
201 Created |
Creado |
|
Other Status Codes |
Error Headers x-ms-error-code: string |
Seguridad
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Ejemplos
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsCount": 2,
"passPhrase": "my voice is my passport verify me",
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definiciones
Nombre | Description |
---|---|
Error | |
Speaker |
Mensaje de error del hablante |
Td |
Text-Dependent información de inscripción del perfil de Speaker |
Training |
Estado que representa el estado actual del perfil. Valores disponibles:
|
Error
Nombre | Tipo | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Mensaje de error del hablante
Nombre | Tipo | Description |
---|---|---|
error |
TdEnrollmentInfo
Text-Dependent información de inscripción del perfil de Speaker
Nombre | Tipo | Description |
---|---|---|
audioLengthInSec |
number |
Esta longitud de audio de inscripción en segundos. |
audioSpeechLengthInSec |
number |
Esta inscripción de voz pura de audio (que es la cantidad de audio después de quitar el silencio y los segmentos que no son de voz) dura en segundos. |
enrollmentStatus |
Estado que representa el estado actual del perfil. Valores disponibles:
|
|
enrollmentsCount |
integer |
Número de audios de inscripción aceptados para este perfil. |
enrollmentsLengthInSec |
number |
Longitud total de los audios de inscripción aceptados para este perfil en segundos. |
enrollmentsSpeechLengthInSec |
number |
Suma de voz pura (que es la cantidad de audio después de quitar el silencio y los segmentos que no son de voz) en todas las inscripciones de perfil en segundos. |
passPhrase |
string |
Frase de contraseña asociada a esta inscripción. |
profileId |
string |
Identificador único del identificador de perfil (GUID). |
remainingEnrollmentsCount |
integer |
Número de audios de inscripción necesarios para completar la inscripción de perfiles. |
TrainingStatusType
Estado que representa el estado actual del perfil. Valores disponibles:
- Inscripción: el perfil no tiene impresión de voz y no está listo para las solicitudes de reconocimiento.
- Entrenamiento: se está creando la impresión de voz del perfil y no se puede usar para el reconocimiento en este momento.
- Inscrito: el perfil tiene una impresión de voz y está lista para las solicitudes de reconocimiento.
Nombre | Tipo | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |