Condividi tramite


Text Independent - Identify Single Speaker

Identificare il profilo a voce singola
Identifica chi sta parlando nell'audio di input tra un elenco di profili candidati.

Limitazioni:

  • La lunghezza minima dell'input audio è 1 secondo

  • La lunghezza massima dell'input audio è 120 secondi

  • Il numero minimo di relatori candidati è 1

  • Il numero massimo di relatori candidati è 50

  • La lunghezza minima del parlato effettivo (escluso il silenzio e altri fotogrammi non vocali) è 4 secondi Questa limitazione può essere disabilitata impostando "ignoreMinLength" su true.

  • Il rapporto minimo tra segnale audio e rumore (SNR) è 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parametri dell'URI

Nome In Necessario Tipo Descrizione
endpoint
path True

string

Endpoint di Servizi cognitivi supportati (protocollo e nome host, ad esempio: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Specifica la versione dell'operazione da utilizzare per questa richiesta.

profileIds
query True

string[]

ID profilo delimitati da virgole. Il numero massimo supportato è 50 ID.

ignoreMinLength
query

boolean

Se true, viene ignorata la quantità minima di parlato necessaria per l'identificazione. Il valore predefinito è false.

Intestazione della richiesta

Media Types: "audio/wav; codecs=audio/pcm"

Nome Necessario Tipo Descrizione
Ocp-Apim-Subscription-Key True

string

Corpo della richiesta

Media Types: "audio/wav; codecs=audio/pcm"

Nome Tipo Descrizione
audioData

object (file)

File audio binario. I formati supportati sono audio/wav; codecs=audio/pcm. Supporta audio fino a 5 MB.

Risposte

Nome Tipo Descrizione
200 OK

IdentifiedSingleSpeakerInfo

OK

Other Status Codes

SpeakerErrorInfo

Fallimento

Intestazioni

x-ms-error-code: string

Sicurezza

Ocp-Apim-Subscription-Key

Tipo: apiKey
In: header

Esempio

Successful Query

Esempio di richiesta

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Risposta di esempio

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definizioni

Nome Descrizione
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Informazioni sull'altoparlante identificato

SpeakerErrorInfo

Messaggio di errore del parlante

Error

Nome Tipo Descrizione
code

string

message

string

IdentifiedSingleSpeakerInfo

Nome Tipo Descrizione
identifiedProfile

IdentifyInfo

Oggetto contenente i dati del profilo identificato.

profilesRanking

IdentifyInfo[]

Oggetto contenente i dati dei primi 5 profili (incluso il profilo identificato) ordinati in ordine decrescente in base al punteggio.

IdentifyInfo

Informazioni sull'altoparlante identificato

Nome Tipo Descrizione
profileId

string (uuid)

ID del profilo identificato. Se nessun candidato viene identificato come altoparlante destro, il valore viene impostato su GUID vuoto.

score

number

Numero float che indica la somiglianza tra l'audio di input e la stampa vocale di destinazione. Questo numero deve essere compreso tra 0 e 1. Un numero maggiore indica una maggiore somiglianza.

SpeakerErrorInfo

Messaggio di errore del parlante

Nome Tipo Descrizione
error

Error