Share via


Text Dependent - Create Enrollment

Inscribir perfil
Agrega una inscripción al perfil existente. Si se alcanza el número mínimo de audios de inscripción solicitados, se crea una impresión de voz. Si la impresión de voz se creó antes, se vuelve a crear a partir de todos los audios de inscripción existentes, incluido el nuevo.

Limitaciones:

  • La longitud mínima de entrada de audio por solicitud es de 1 segundo
  • La longitud máxima de entrada de audio por solicitud es de 10 segundos.
  • El número mínimo de inscripciones para crear una huella de voz es 3
  • El número máximo de inscripciones para crear una huella de voz es de 50
  • La relación mínima de señal a ruido de audio (SNR) es 2dB

Restricciones:

  • La primera inscripción debe coincidir con una frase de contraseña existente.
  • Todas las inscripciones después de la primera, deben usar la misma frase de contraseña usada en la primera inscripción.
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

Parámetros de identificador URI

Nombre En Requerido Tipo Description
endpoint
path True

string

Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Identificador único del identificador de perfil (GUID).

api-version
query True

string

Especifica la versión de la operación que se utiliza para esta solicitud.

Encabezado de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre Requerido Tipo Description
Ocp-Apim-Subscription-Key True

string

Cuerpo de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre Tipo Description
audioData

object

Archivo de audio binario. Los formatos admitidos son audio/wav; codecs=audio/pcm. Admite audio de hasta 5 MB.

Respuestas

Nombre Tipo Description
201 Created

TdEnrollmentInfo

Creado

Other Status Codes

SpeakerErrorInfo

Error

Headers

x-ms-error-code: string

Seguridad

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Ejemplos

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definiciones

Nombre Description
Error
SpeakerErrorInfo

Mensaje de error del hablante

TdEnrollmentInfo

Text-Dependent información de inscripción del perfil de Speaker

TrainingStatusType

Estado que representa el estado actual del perfil. Valores disponibles:

  • Inscripción: el perfil no tiene impresión de voz y no está listo para las solicitudes de reconocimiento.
  • Entrenamiento: se está creando la impresión de voz del perfil y no se puede usar para el reconocimiento en este momento.
  • Inscrito: el perfil tiene una impresión de voz y está lista para las solicitudes de reconocimiento.

Error

Nombre Tipo Description
code

string

message

string

SpeakerErrorInfo

Mensaje de error del hablante

Nombre Tipo Description
error

Error

TdEnrollmentInfo

Text-Dependent información de inscripción del perfil de Speaker

Nombre Tipo Description
audioLengthInSec

number

Esta longitud de audio de inscripción en segundos.

audioSpeechLengthInSec

number

Esta inscripción de voz pura de audio (que es la cantidad de audio después de quitar el silencio y los segmentos que no son de voz) dura en segundos.

enrollmentStatus

TrainingStatusType

Estado que representa el estado actual del perfil. Valores disponibles:

  • Inscripción: el perfil no tiene impresión de voz y no está listo para las solicitudes de reconocimiento.
  • Entrenamiento: se está creando la impresión de voz del perfil y no se puede usar para el reconocimiento en este momento.
  • Inscrito: el perfil tiene una impresión de voz y está lista para las solicitudes de reconocimiento.
enrollmentsCount

integer

Número de audios de inscripción aceptados para este perfil.

enrollmentsLengthInSec

number

Longitud total de los audios de inscripción aceptados para este perfil en segundos.

enrollmentsSpeechLengthInSec

number

Suma de voz pura (que es la cantidad de audio después de quitar el silencio y los segmentos que no son de voz) en todas las inscripciones de perfil en segundos.

passPhrase

string

Frase de contraseña asociada a esta inscripción.

profileId

string

Identificador único del identificador de perfil (GUID).

remainingEnrollmentsCount

integer

Número de audios de inscripción necesarios para completar la inscripción de perfiles.

TrainingStatusType

Estado que representa el estado actual del perfil. Valores disponibles:

  • Inscripción: el perfil no tiene impresión de voz y no está listo para las solicitudes de reconocimiento.
  • Entrenamiento: se está creando la impresión de voz del perfil y no se puede usar para el reconocimiento en este momento.
  • Inscrito: el perfil tiene una impresión de voz y está lista para las solicitudes de reconocimiento.
Nombre Tipo Description
Enrolled

string

Enrolling

string

Training

string