Text Independent - Identify Single Speaker

Odwołanie

Service:: Speaker Recognition

API Version:: 2021-09-05

Identyfikowanie profilu pojedynczego osoby mówiącej
Określa, kto mówi w dźwiękach wejściowych wśród listy profilów kandydatów.

Ograniczenia:

Minimalna długość wejścia audio wynosi 1 sekundę
Maksymalna długość wejścia audio wynosi 120 sekund
Minimalna liczba prelegentów kandydatów wynosi 1
Maksymalna liczba prelegentów kandydatów wynosi 50
Minimalna efektywna długość mowy (z wyłączeniem ciszy i innych ramek innych niż mowa) to 4 sekundy To ograniczenie można wyłączyć, ustawiając wartość "ignoreMinLength" na true.
Minimalny współczynnik sygnału audio do szumu (SNR) to 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}

With optional parameters:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parametry identyfikatora URI

Nazwa	W	Wymagane	Typ	Opis
endpoint	path	True	string	Obsługiwane punkty końcowe usług Cognitive Services (protokół i nazwa hosta, na przykład: https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	Określa wersję operacji do użycia dla tego żądania.
profileIds	query	True	string[]	Identyfikatory profilów rozdzielanych przecinkami. Maksymalna obsługiwana liczba to 50 identyfikatorów.
ignoreMinLength	query		boolean	Jeśli wartość true, minimalna ilość mowy wymagana do identyfikacji zostanie pominięta. Wartość domyślna to false.

Nagłówek żądania

Media Types: "audio/wav; codecs=audio/pcm"

Nazwa	Wymagane	Typ	Opis
Ocp-Apim-Subscription-Key	True	string

Treść żądania

Media Types: "audio/wav; codecs=audio/pcm"

Nazwa	Typ	Opis
audioData	object	Binarny plik audio. Obsługiwane formaty to audio/wav; codecs=audio/pcm. Obsługuje dźwięk do 5 MB.

Odpowiedzi

Nazwa	Typ	Opis
200 OK	IdentifiedSingleSpeakerInfo	OK
Other Status Codes	SpeakerErrorInfo	Niepowodzenie Headers x-ms-error-code: string

Nazwa

Typ

Opis

200 OK

IdentifiedSingleSpeakerInfo

Other Status Codes

SpeakerErrorInfo

Niepowodzenie

Headers

x-ms-error-code: string

Zabezpieczenia

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Przykłady

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Status code:: 200

Content-Type: application/json

Response Body

{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definicje

Nazwa	Opis
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo	Zidentyfikowane informacje o osoby mówiącej
SpeakerErrorInfo	Komunikat o błędzie osoby mówiącej

Error

Nazwa	Typ	Opis
code	string
message	string

IdentifiedSingleSpeakerInfo

Nazwa	Typ	Opis
identifiedProfile	IdentifyInfo	Obiekt zawierający dane zidentyfikowanego profilu.
profilesRanking	IdentifyInfo[]	Obiekt zawierający dane z 5 najważniejszych profilów (w tym zidentyfikowany profil) posortowany w kolejności malejącej według wyniku.

IdentifyInfo

Zidentyfikowane informacje o osoby mówiącej

Nazwa	Typ	Opis
profileId	string	Identyfikator zidentyfikowanego profilu. Jeśli żaden kandydat nie zostanie zidentyfikowany jako właściwy mówca, wartość jest ustawiona na pusty identyfikator GUID.
score	number	Liczba zmiennoprzecinkowa wskazująca podobieństwo między wejściowym dźwiękiem a docelowym drukowaniem głosowym. Ta liczba musi należeć do zakresu od 0 do 1. Wyższa liczba oznacza większą podobieństwo.

SpeakerErrorInfo

Komunikat o błędzie osoby mówiącej

Nazwa	Typ	Opis
error	Error

Share via

Text Independent - Identify Single Speaker

Parametry identyfikatora URI

Nagłówek żądania

Treść żądania

Odpowiedzi

Zabezpieczenia

Ocp-Apim-Subscription-Key

Przykłady

Successful Query

Sample Request

Sample Response

Definicje

Error

IdentifiedSingleSpeakerInfo

IdentifyInfo

SpeakerErrorInfo

Dodatkowe zasoby