Text Independent - Verify Profile
Profil überprüfen
Überprüft vorhandene Profile basierend auf Audioeingabedaten.
Einschränkungen:
- Die minimale Audioeingabelänge beträgt 1 Sekunde
- Die maximale Audioeingabelänge beträgt 120 Sekunden
- Die minimale effektive Sprachlänge (ohne Stille und andere Nicht-Spracherkennungsframes) beträgt 4 Sekunden Diese Einschränkung kann deaktiviert werden, indem Sie "ignoreMinLength" auf true festlegen.
- Minimales Audiosignal-Rausch-Verhältnis (SNR) beträgt 2dB
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
endpoint
|
path | True |
string |
Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. ). https://westus.api.cognitive.microsoft.com |
profile
|
path | True |
string uuid |
Eindeutiger Bezeichner für die Profil-ID (guid). |
api-version
|
query | True |
string |
Gibt die Version des für die Anforderung zu verwendenden Vorgangs an. |
ignore
|
query |
boolean |
Wenn true, wird sofort ein Sprachdruck für dieses Profil erstellt, unabhängig davon, wie viel Sprache bereitgestellt oder gespeichert wird. Der Standardwert ist "false". |
Anforderungsheader
Media Types: "audio/wav; codecs=audio/pcm"
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Anforderungstext
Media Types: "audio/wav; codecs=audio/pcm"
Name | Typ | Beschreibung |
---|---|---|
audioData |
object |
Binäre Audiodatei. Unterstützte Formate sind Audio/WAV; codecs=audio/pcm. Unterstützt Audio bis zu 5 MB. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
200 OK |
OK |
|
Other Status Codes |
Fehler Header x-ms-error-code: string |
Sicherheit
Ocp-Apim-Subscription-Key
Typ:
apiKey
In:
header
Beispiele
Successful Query
Beispielanforderung
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f:verify?api-version=2021-09-05
"{binary file date}"
Beispiel für eine Antwort
Content-Type: application/json
{
"recognitionResult": "accept",
"score": 0.63
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definitionen
Name | Beschreibung |
---|---|
Error | |
Recognition |
Ergebnis der Sprechererkennung |
Result |
Gehört Audio zum Zielprofil? |
Speaker |
Sprecherfehlermeldung |
Error
Name | Typ | Beschreibung |
---|---|---|
code |
string |
|
message |
string |
RecognitionInfo
Ergebnis der Sprechererkennung
Name | Typ | Beschreibung |
---|---|---|
recognitionResult |
Gehört Audio zum Zielprofil? |
|
score |
number |
Eine Floatzahl, die die Ähnlichkeit zwischen Eingabeaudio und zielorientiertem Sprachdruck angibt. Diese Zahl muss zwischen 0 und 1 sein. Eine höhere Zahl bedeutet eine höhere Ähnlichkeit. |
ResultType
Gehört Audio zum Zielprofil?
Name | Typ | Beschreibung |
---|---|---|
accept |
string |
|
reject |
string |
SpeakerErrorInfo
Sprecherfehlermeldung
Name | Typ | Beschreibung |
---|---|---|
error |