Text Dependent - Create Enrollment

Referencia

Service:: Speaker Recognition

API Version:: 2021-09-05

Inscribir perfil
Agrega una inscripción al perfil existente. Si se alcanza el número mínimo de audios de inscripción solicitados, se crea una impresión de voz. Si la impresión de voz se creó antes, se vuelve a crear a partir de todos los audios de inscripción existentes, incluido el nuevo.

Limitaciones:

La longitud mínima de entrada de audio por solicitud es de 1 segundo
La longitud máxima de entrada de audio por solicitud es de 10 segundos.
El número mínimo de inscripciones para crear una huella de voz es 3
El número máximo de inscripciones para crear una huella de voz es de 50
La relación mínima de señal a ruido de audio (SNR) es 2dB

Restricciones:

La primera inscripción debe coincidir con una frase de contraseña existente.
Todas las inscripciones después de la primera, deben usar la misma frase de contraseña usada en la primera inscripción.

POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

Parámetros de identificador URI

Nombre	En	Requerido	Tipo	Description
endpoint	path	True	string	Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).
profileId	path	True	string uuid	Identificador único del identificador de perfil (GUID).
api-version	query	True	string	Especifica la versión de la operación que se utiliza para esta solicitud.

Encabezado de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre	Requerido	Tipo	Description
Ocp-Apim-Subscription-Key	True	string

Cuerpo de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre	Tipo	Description
audioData	object	Archivo de audio binario. Los formatos admitidos son audio/wav; codecs=audio/pcm. Admite audio de hasta 5 MB.

Respuestas

Nombre	Tipo	Description
201 Created	TdEnrollmentInfo	Creado
Other Status Codes	SpeakerErrorInfo	Error Headers x-ms-error-code: string

Nombre

Tipo

Description

201 Created

TdEnrollmentInfo

Creado

Other Status Codes

SpeakerErrorInfo

Error

Headers

x-ms-error-code: string

Seguridad

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Ejemplos

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Status code:: 201

Content-Type: application/json

Response Body

{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definiciones

Nombre	Description
Error
SpeakerErrorInfo	Mensaje de error del hablante
TdEnrollmentInfo	Text-Dependent información de inscripción del perfil de Speaker
TrainingStatusType	Estado que representa el estado actual del perfil. Valores disponibles: Inscripción: el perfil no tiene impresión de voz y no está listo para las solicitudes de reconocimiento. Entrenamiento: se está creando la impresión de voz del perfil y no se puede usar para el reconocimiento en este momento. Inscrito: el perfil tiene una impresión de voz y está lista para las solicitudes de reconocimiento.

Error

Nombre	Tipo	Description
code	string
message	string

SpeakerErrorInfo

Mensaje de error del hablante

Nombre	Tipo	Description
error	Error

TdEnrollmentInfo

Text-Dependent información de inscripción del perfil de Speaker

Nombre	Tipo	Description
audioLengthInSec	number	Esta longitud de audio de inscripción en segundos.
audioSpeechLengthInSec	number	Esta inscripción de voz pura de audio (que es la cantidad de audio después de quitar el silencio y los segmentos que no son de voz) dura en segundos.
enrollmentStatus	TrainingStatusType	Estado que representa el estado actual del perfil. Valores disponibles: Inscripción: el perfil no tiene impresión de voz y no está listo para las solicitudes de reconocimiento. Entrenamiento: se está creando la impresión de voz del perfil y no se puede usar para el reconocimiento en este momento. Inscrito: el perfil tiene una impresión de voz y está lista para las solicitudes de reconocimiento.
enrollmentsCount	integer	Número de audios de inscripción aceptados para este perfil.
enrollmentsLengthInSec	number	Longitud total de los audios de inscripción aceptados para este perfil en segundos.
enrollmentsSpeechLengthInSec	number	Suma de voz pura (que es la cantidad de audio después de quitar el silencio y los segmentos que no son de voz) en todas las inscripciones de perfil en segundos.
passPhrase	string	Frase de contraseña asociada a esta inscripción.
profileId	string	Identificador único del identificador de perfil (GUID).
remainingEnrollmentsCount	integer	Número de audios de inscripción necesarios para completar la inscripción de perfiles.

TrainingStatusType

Estado que representa el estado actual del perfil. Valores disponibles:

Inscripción: el perfil no tiene impresión de voz y no está listo para las solicitudes de reconocimiento.
Entrenamiento: se está creando la impresión de voz del perfil y no se puede usar para el reconocimiento en este momento.
Inscrito: el perfil tiene una impresión de voz y está lista para las solicitudes de reconocimiento.

Nombre	Tipo	Description
Enrolled	string
Enrolling	string
Training	string

Share via

Text Dependent - Create Enrollment

Parámetros de identificador URI

Encabezado de la solicitud

Cuerpo de la solicitud

Respuestas

Seguridad

Ocp-Apim-Subscription-Key

Ejemplos

Successful Query

Sample Request

Sample Response

Definiciones

Error

SpeakerErrorInfo

TdEnrollmentInfo

TrainingStatusType

Recursos adicionales