Text Independent - Verify Profile
Weryfikowanie profilu
Weryfikuje istniejące profile pod kątem wejściowego dźwięku.
Ograniczenia:
- Minimalna długość wejścia audio wynosi 1 sekundę
- Maksymalna długość wejścia audio wynosi 120 sekund
- Minimalna efektywna długość mowy (z wyłączeniem ciszy i innych ramek "innych niż mowa") to 4 sekundy To ograniczenie może zostać wyłączone przez ustawienie "ignoreMinLength" na wartość true.
- Minimalny współczynnik sygnału audio do szumu (SNR) to 2dB
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
Parametry identyfikatora URI
Nazwa | W | Wymagane | Typ | Opis |
---|---|---|---|---|
endpoint
|
path | True |
string |
Obsługiwane punkty końcowe usług Cognitive Services (protokół i nazwa hosta, na przykład: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Unikatowy identyfikator identyfikatora profilu (guid). |
api-version
|
query | True |
string |
Określa wersję operacji do użycia dla tego żądania. |
ignore
|
query |
boolean |
W przypadku wartości true wydruk głosowy zostanie utworzony natychmiast dla tego profilu niezależnie od tego, ile mowy jest dostarczanych lub przechowywanych. Wartość domyślna to false. |
Nagłówek żądania
Media Types: "audio/wav; codecs=audio/pcm"
Nazwa | Wymagane | Typ | Opis |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Treść żądania
Media Types: "audio/wav; codecs=audio/pcm"
Nazwa | Typ | Opis |
---|---|---|
audioData |
object |
Binarny plik audio. Obsługiwane formaty to audio/wav; codecs=audio/pcm. Obsługuje dźwięk do 5 MB. |
Odpowiedzi
Nazwa | Typ | Opis |
---|---|---|
200 OK |
OK |
|
Other Status Codes |
Niepowodzenie Nagłówki x-ms-error-code: string |
Zabezpieczenia
Ocp-Apim-Subscription-Key
Typ:
apiKey
W:
header
Przykłady
Successful Query
Przykładowe żądanie
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f:verify?api-version=2021-09-05
"{binary file date}"
Przykładowa odpowiedź
Content-Type: application/json
{
"recognitionResult": "accept",
"score": 0.63
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definicje
Nazwa | Opis |
---|---|
Error | |
Recognition |
Wynik rozpoznawania osoby mówiącej |
Result |
Czy dźwięk należy do profilu docelowego? |
Speaker |
Komunikat o błędzie osoby mówiącej |
Error
Nazwa | Typ | Opis |
---|---|---|
code |
string |
|
message |
string |
RecognitionInfo
Wynik rozpoznawania osoby mówiącej
Nazwa | Typ | Opis |
---|---|---|
recognitionResult |
Czy dźwięk należy do profilu docelowego? |
|
score |
number |
Liczba zmiennoprzecinkowa wskazująca podobieństwo między wejściowym dźwiękiem a docelowym drukowaniem głosowym. Ta liczba musi należeć do zakresu od 0 do 1. Wyższa liczba oznacza większą podobieństwo. |
ResultType
Czy dźwięk należy do profilu docelowego?
Nazwa | Typ | Opis |
---|---|---|
accept |
string |
|
reject |
string |
SpeakerErrorInfo
Komunikat o błędzie osoby mówiącej
Nazwa | Typ | Opis |
---|---|---|
error |