Text Independent - Identify Single Speaker
Identificare il profilo a voce singola
Identifica chi sta parlando nell'audio di input tra un elenco di profili candidati.
Limitazioni:
La lunghezza minima dell'input audio è 1 secondo
La lunghezza massima dell'input audio è 120 secondi
Il numero minimo di relatori candidati è 1
Il numero massimo di relatori candidati è 50
La lunghezza minima del parlato effettivo (escluso il silenzio e altri fotogrammi non vocali) è 4 secondi Questa limitazione può essere disabilitata impostando "ignoreMinLength" su true.
Il rapporto minimo tra segnale audio e rumore (SNR) è 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
Parametri dell'URI
| Nome | In | Necessario | Tipo | Descrizione |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Endpoint di Servizi cognitivi supportati (protocollo e nome host, ad esempio: https://westus.api.cognitive.microsoft.com). |
|
api-version
|
query | True |
string |
Specifica la versione dell'operazione da utilizzare per questa richiesta. |
|
profile
|
query | True |
string[] |
ID profilo delimitati da virgole. Il numero massimo supportato è 50 ID. |
|
ignore
|
query |
boolean |
Se true, viene ignorata la quantità minima di parlato necessaria per l'identificazione. Il valore predefinito è false. |
Intestazione della richiesta
Media Types: "audio/wav; codecs=audio/pcm"
| Nome | Necessario | Tipo | Descrizione |
|---|---|---|---|
| Ocp-Apim-Subscription-Key | True |
string |
Corpo della richiesta
Media Types: "audio/wav; codecs=audio/pcm"
| Nome | Tipo | Descrizione |
|---|---|---|
| audioData |
object (file) |
File audio binario. I formati supportati sono audio/wav; codecs=audio/pcm. Supporta audio fino a 5 MB. |
Risposte
| Nome | Tipo | Descrizione |
|---|---|---|
| 200 OK |
OK |
|
| Other Status Codes |
Fallimento Intestazioni x-ms-error-code: string |
Sicurezza
Ocp-Apim-Subscription-Key
Tipo:
apiKey
In:
header
Esempio
Successful Query
Esempio di richiesta
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Risposta di esempio
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definizioni
| Nome | Descrizione |
|---|---|
| Error | |
|
Identified |
|
|
Identify |
Informazioni sull'altoparlante identificato |
|
Speaker |
Messaggio di errore del parlante |
Error
| Nome | Tipo | Descrizione |
|---|---|---|
| code |
string |
|
| message |
string |
IdentifiedSingleSpeakerInfo
| Nome | Tipo | Descrizione |
|---|---|---|
| identifiedProfile |
Oggetto contenente i dati del profilo identificato. |
|
| profilesRanking |
Oggetto contenente i dati dei primi 5 profili (incluso il profilo identificato) ordinati in ordine decrescente in base al punteggio. |
IdentifyInfo
Informazioni sull'altoparlante identificato
| Nome | Tipo | Descrizione |
|---|---|---|
| profileId |
string (uuid) |
ID del profilo identificato. Se nessun candidato viene identificato come altoparlante destro, il valore viene impostato su GUID vuoto. |
| score |
number |
Numero float che indica la somiglianza tra l'audio di input e la stampa vocale di destinazione. Questo numero deve essere compreso tra 0 e 1. Un numero maggiore indica una maggiore somiglianza. |
SpeakerErrorInfo
Messaggio di errore del parlante
| Nome | Tipo | Descrizione |
|---|---|---|
| error |