Text Independent - Identify Single Speaker
Identifier le profil d’orateur unique
Identifie la personne qui parle dans l’audio d’entrée parmi une liste de profils de candidats.
Limites :
La longueur minimale d’entrée audio est de 1 seconde
La longueur maximale d’entrée audio est de 120 secondes
Le nombre minimal d’orateurs candidats est de 1
Le nombre maximal d’orateurs candidats est de 50
La longueur minimale effective de la parole (à l’exception du silence et d’autres images non vocales) est de 4 secondes Cette limitation peut être désactivée en définissant « ignoreMinLength » sur true.
Le rapport signal/bruit (SNR) audio minimal est de 2 dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
Spécifie la version de l'opération à utiliser pour cette demande. |
profile
|
query | True |
string[] |
ID de profil délimité par des virgules. Le nombre maximal pris en charge est de 50 ID. |
ignore
|
query |
boolean |
Si la valeur est true, la quantité minimale de parole nécessaire à l’identification est ignorée. La valeur par défaut est false. |
En-tête de la demande
Media Types: "audio/wav; codecs=audio/pcm"
Nom | Obligatoire | Type | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Corps de la demande
Media Types: "audio/wav; codecs=audio/pcm"
Nom | Type | Description |
---|---|---|
audioData |
object |
Fichier audio binaire. Les formats pris en charge sont audio/wav ; codecs=audio/pcm. Prend en charge l’audio jusqu’à 5 Mo. |
Réponses
Nom | Type | Description |
---|---|---|
200 OK |
Ok |
|
Other Status Codes |
Échec Headers x-ms-error-code: string |
Sécurité
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exemples
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Sample Response
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Définitions
Nom | Description |
---|---|
Error | |
Identified |
|
Identify |
Informations sur l’orateur identifié |
Speaker |
Message d’erreur de l’orateur |
Error
Nom | Type | Description |
---|---|---|
code |
string |
|
message |
string |
IdentifiedSingleSpeakerInfo
Nom | Type | Description |
---|---|---|
identifiedProfile |
Objet contenant des données de profil identifié. |
|
profilesRanking |
Objet contenant les données des 5 premiers profils (y compris le profil identifié) triés dans l’ordre décroissant par score. |
IdentifyInfo
Informations sur l’orateur identifié
Nom | Type | Description |
---|---|---|
profileId |
string |
ID de identifié du profil. Si aucun candidat n’est identifié comme le bon orateur, la valeur est définie sur GUID vide. |
score |
number |
Nombre float indiquant la similarité entre l’audio d’entrée et l’impression vocale ciblée. Ce nombre doit être compris entre 0 et 1. Un nombre plus élevé signifie une similarité plus élevée. |
SpeakerErrorInfo
Message d’erreur de l’orateur
Nom | Type | Description |
---|---|---|
error |