Share via


Text Independent - Identify Single Speaker

Identificación del perfil de hablante único
Identifica quién habla en audio de entrada entre una lista de perfiles candidatos.

Limitaciones:

  • La longitud mínima de entrada de audio es de 1 segundo

  • La longitud máxima de entrada de audio es de 120 segundos

  • El número mínimo de hablantes candidatos es 1

  • El número máximo de hablantes candidatos es de 50

  • La longitud de voz mínima efectiva (excepto el silencio y otros fotogramas que no son de voz) es de 4 segundos . Esta limitación se puede deshabilitar estableciendo "ignoreMinLength" en true.

  • La relación mínima de señal a ruido de audio (SNR) es 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parámetros de identificador URI

Nombre En Requerido Tipo Description
endpoint
path True

string

Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Especifica la versión de la operación que se utiliza para esta solicitud.

profileIds
query True

string[]

Identificadores de perfil delimitados por comas. El número máximo admitido es de 50 identificadores.

ignoreMinLength
query

boolean

Si es true, se omite la cantidad mínima de voz necesaria para la identificación. El valor predeterminado es False.

Encabezado de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre Requerido Tipo Description
Ocp-Apim-Subscription-Key True

string

Cuerpo de la solicitud

Media Types: "audio/wav; codecs=audio/pcm"

Nombre Tipo Description
audioData

object

Archivo de audio binario. Los formatos admitidos son audio/wav; codecs=audio/pcm. Admite audio de hasta 5 MB.

Respuestas

Nombre Tipo Description
200 OK

IdentifiedSingleSpeakerInfo

Aceptar

Other Status Codes

SpeakerErrorInfo

Error

Headers

x-ms-error-code: string

Seguridad

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Ejemplos

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definiciones

Nombre Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Información del hablante identificada

SpeakerErrorInfo

Mensaje de error del hablante

Error

Nombre Tipo Description
code

string

message

string

IdentifiedSingleSpeakerInfo

Nombre Tipo Description
identifiedProfile

IdentifyInfo

Objeto que contiene datos de perfil identificado.

profilesRanking

IdentifyInfo[]

Objeto que contiene los datos de los cinco perfiles principales (incluido el perfil identificado) ordenados en orden descendente por puntuación.

IdentifyInfo

Información del hablante identificada

Nombre Tipo Description
profileId

string

Identificador de identificado de perfil. Si no se identifica ningún candidato como altavoz derecho, el valor se establece en GUID vacío.

score

number

Número flotante que indica la similitud entre el audio de entrada y la impresión de voz de destino. Este número debe estar comprendido entre 0 y 1. Un número mayor significa una similitud mayor.

SpeakerErrorInfo

Mensaje de error del hablante

Nombre Tipo Description
error

Error