Text Independent - Identify Single Speaker
Identificación del perfil de hablante único
Identifica quién habla en audio de entrada entre una lista de perfiles candidatos.
Limitaciones:
La longitud mínima de entrada de audio es de 1 segundo
La longitud máxima de entrada de audio es de 120 segundos
El número mínimo de hablantes candidatos es 1
El número máximo de hablantes candidatos es de 50
La longitud de voz mínima efectiva (excepto el silencio y otros fotogramas que no son de voz) es de 4 segundos . Esta limitación se puede deshabilitar estableciendo "ignoreMinLength" en true.
La relación mínima de señal a ruido de audio (SNR) es 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
Parámetros de identificador URI
Nombre | En | Requerido | Tipo | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
Especifica la versión de la operación que se utiliza para esta solicitud. |
profile
|
query | True |
string[] |
Identificadores de perfil delimitados por comas. El número máximo admitido es de 50 identificadores. |
ignore
|
query |
boolean |
Si es true, se omite la cantidad mínima de voz necesaria para la identificación. El valor predeterminado es False. |
Encabezado de la solicitud
Media Types: "audio/wav; codecs=audio/pcm"
Nombre | Requerido | Tipo | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Cuerpo de la solicitud
Media Types: "audio/wav; codecs=audio/pcm"
Nombre | Tipo | Description |
---|---|---|
audioData |
object |
Archivo de audio binario. Los formatos admitidos son audio/wav; codecs=audio/pcm. Admite audio de hasta 5 MB. |
Respuestas
Nombre | Tipo | Description |
---|---|---|
200 OK |
Aceptar |
|
Other Status Codes |
Error Headers x-ms-error-code: string |
Seguridad
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Ejemplos
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Sample Response
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definiciones
Nombre | Description |
---|---|
Error | |
Identified |
|
Identify |
Información del hablante identificada |
Speaker |
Mensaje de error del hablante |
Error
Nombre | Tipo | Description |
---|---|---|
code |
string |
|
message |
string |
IdentifiedSingleSpeakerInfo
Nombre | Tipo | Description |
---|---|---|
identifiedProfile |
Objeto que contiene datos de perfil identificado. |
|
profilesRanking |
Objeto que contiene los datos de los cinco perfiles principales (incluido el perfil identificado) ordenados en orden descendente por puntuación. |
IdentifyInfo
Información del hablante identificada
Nombre | Tipo | Description |
---|---|---|
profileId |
string |
Identificador de identificado de perfil. Si no se identifica ningún candidato como altavoz derecho, el valor se establece en GUID vacío. |
score |
number |
Número flotante que indica la similitud entre el audio de entrada y la impresión de voz de destino. Este número debe estar comprendido entre 0 y 1. Un número mayor significa una similitud mayor. |
SpeakerErrorInfo
Mensaje de error del hablante
Nombre | Tipo | Description |
---|---|---|
error |