Text Independent - Identify Single Speaker

Referencia

Servicio:: Speaker Recognition

Versión de la API:: 2021-09-05

Identificación del perfil de hablante único
Identifica quién habla en audio de entrada entre una lista de perfiles candidatos.

Limitaciones:

La longitud mínima de entrada de audio es de 1 segundo
La longitud máxima de entrada de audio es de 120 segundos
El número mínimo de hablantes candidatos es 1
El número máximo de hablantes candidatos es de 50
La longitud de voz mínima efectiva (excepto el silencio y otros fotogramas que no son de voz) es de 4 segundos . Esta limitación se puede deshabilitar estableciendo "ignoreMinLength" en true.
La relación mínima de señal a ruido de audio (SNR) es 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}

Con parámetros opcionales:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parámetros de identificador URI

Nombre	En	Requerido	Tipo	Description
endpoint	path	True	string	Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	Especifica la versión de la operación que se utiliza para esta solicitud.
profileIds	query	True	string[]	Identificadores de perfil delimitados por comas. El número máximo admitido es de 50 identificadores.
ignoreMinLength	query		boolean	Si es true, se omite la cantidad mínima de voz necesaria para la identificación. El valor predeterminado es False.

Encabezado de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre	Requerido	Tipo	Description
Ocp-Apim-Subscription-Key	True	string

Cuerpo de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre	Tipo	Description
audioData	object	Archivo de audio binario. Los formatos admitidos son audio/wav; codecs=audio/pcm. Admite audio de hasta 5 MB.

Respuestas

Nombre	Tipo	Description
200 OK	IdentifiedSingleSpeakerInfo	Aceptar
Other Status Codes	SpeakerErrorInfo	Error Encabezados x-ms-error-code: string

Nombre

Tipo

Description

200 OK

IdentifiedSingleSpeakerInfo

Aceptar

Other Status Codes

SpeakerErrorInfo

Error

Encabezados

x-ms-error-code: string

Seguridad

Ocp-Apim-Subscription-Key

Tipo: apiKey
En: header

Ejemplos

Successful Query

Solicitud de ejemplo

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Respuesta de muestra

status code:: 200

Content-Type: application/json

{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}

status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definiciones

Nombre	Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo	Información del hablante identificada
SpeakerErrorInfo	Mensaje de error del hablante

Error

Nombre	Tipo	Description
code	string
message	string

IdentifiedSingleSpeakerInfo

Nombre	Tipo	Description
identifiedProfile	IdentifyInfo	Objeto que contiene datos de perfil identificado.
profilesRanking	IdentifyInfo[]	Objeto que contiene los datos de los cinco perfiles principales (incluido el perfil identificado) ordenados en orden descendente por puntuación.

IdentifyInfo

Información del hablante identificada

Nombre	Tipo	Description
profileId	string	Identificador de identificado de perfil. Si no se identifica ningún candidato como altavoz derecho, el valor se establece en GUID vacío.
score	number	Número flotante que indica la similitud entre el audio de entrada y la impresión de voz de destino. Este número debe estar comprendido entre 0 y 1. Un número mayor significa una similitud mayor.

SpeakerErrorInfo

Mensaje de error del hablante

Nombre	Tipo	Description
error	Error

Compartir a través de

Text Independent - Identify Single Speaker

Parámetros de identificador URI

Encabezado de la solicitud

Cuerpo de la solicitud

Respuestas

Seguridad

Ocp-Apim-Subscription-Key

Ejemplos

Successful Query

Solicitud de ejemplo

Respuesta de muestra

Definiciones

Error

IdentifiedSingleSpeakerInfo

IdentifyInfo

SpeakerErrorInfo

Recursos adicionales