Text Independent - Identify Single Speaker

Identyfikowanie profilu pojedynczego osoby mówiącej
Określa, kto mówi w dźwiękach wejściowych wśród listy profilów kandydatów.

Ograniczenia:

  • Minimalna długość wejścia audio wynosi 1 sekundę

  • Maksymalna długość wejścia audio wynosi 120 sekund

  • Minimalna liczba prelegentów kandydatów wynosi 1

  • Maksymalna liczba prelegentów kandydatów wynosi 50

  • Minimalna efektywna długość mowy (z wyłączeniem ciszy i innych ramek innych niż mowa) to 4 sekundy To ograniczenie można wyłączyć, ustawiając wartość "ignoreMinLength" na true.

  • Minimalny współczynnik sygnału audio do szumu (SNR) to 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parametry identyfikatora URI

Nazwa W Wymagane Typ Opis
endpoint
path True

string

Obsługiwane punkty końcowe usług Cognitive Services (protokół i nazwa hosta, na przykład: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Określa wersję operacji do użycia dla tego żądania.

profileIds
query True

string[]

Identyfikatory profilów rozdzielanych przecinkami. Maksymalna obsługiwana liczba to 50 identyfikatorów.

ignoreMinLength
query

boolean

Jeśli wartość true, minimalna ilość mowy wymagana do identyfikacji zostanie pominięta. Wartość domyślna to false.

Nagłówek żądania

Media Types: "audio/wav; codecs=audio/pcm"

Nazwa Wymagane Typ Opis
Ocp-Apim-Subscription-Key True

string

Treść żądania

Media Types: "audio/wav; codecs=audio/pcm"

Nazwa Typ Opis
audioData

object

Binarny plik audio. Obsługiwane formaty to audio/wav; codecs=audio/pcm. Obsługuje dźwięk do 5 MB.

Odpowiedzi

Nazwa Typ Opis
200 OK

IdentifiedSingleSpeakerInfo

OK

Other Status Codes

SpeakerErrorInfo

Niepowodzenie

Headers

x-ms-error-code: string

Zabezpieczenia

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Przykłady

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definicje

Nazwa Opis
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Zidentyfikowane informacje o osoby mówiącej

SpeakerErrorInfo

Komunikat o błędzie osoby mówiącej

Error

Nazwa Typ Opis
code

string

message

string

IdentifiedSingleSpeakerInfo

Nazwa Typ Opis
identifiedProfile

IdentifyInfo

Obiekt zawierający dane zidentyfikowanego profilu.

profilesRanking

IdentifyInfo[]

Obiekt zawierający dane z 5 najważniejszych profilów (w tym zidentyfikowany profil) posortowany w kolejności malejącej według wyniku.

IdentifyInfo

Zidentyfikowane informacje o osoby mówiącej

Nazwa Typ Opis
profileId

string

Identyfikator zidentyfikowanego profilu. Jeśli żaden kandydat nie zostanie zidentyfikowany jako właściwy mówca, wartość jest ustawiona na pusty identyfikator GUID.

score

number

Liczba zmiennoprzecinkowa wskazująca podobieństwo między wejściowym dźwiękiem a docelowym drukowaniem głosowym. Ta liczba musi należeć do zakresu od 0 do 1. Wyższa liczba oznacza większą podobieństwo.

SpeakerErrorInfo

Komunikat o błędzie osoby mówiącej

Nazwa Typ Opis
error

Error