Freigeben über


Text Independent - Verify Profile

Profil überprüfen
Überprüft vorhandene Profile basierend auf Audioeingabedaten.

Einschränkungen:

  • Die minimale Audioeingabelänge beträgt 1 Sekunde
  • Die maximale Audioeingabelänge beträgt 120 Sekunden
  • Die minimale effektive Sprachlänge (ohne Stille und andere Nicht-Spracherkennungsframes) beträgt 4 Sekunden Diese Einschränkung kann deaktiviert werden, indem Sie "ignoreMinLength" auf true festlegen.
  • Minimales Audiosignal-Rausch-Verhältnis (SNR) beträgt 2dB
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint
path True

string

Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. ). https://westus.api.cognitive.microsoft.com

profileId
path True

string

uuid

Eindeutiger Bezeichner für die Profil-ID (guid).

api-version
query True

string

Gibt die Version des für die Anforderung zu verwendenden Vorgangs an.

ignoreMinLength
query

boolean

Wenn true, wird sofort ein Sprachdruck für dieses Profil erstellt, unabhängig davon, wie viel Sprache bereitgestellt oder gespeichert wird. Der Standardwert ist "false".

Anforderungsheader

Media Types: "audio/wav; codecs=audio/pcm"

Name Erforderlich Typ Beschreibung
Ocp-Apim-Subscription-Key True

string

Anforderungstext

Media Types: "audio/wav; codecs=audio/pcm"

Name Typ Beschreibung
audioData

object

Binäre Audiodatei. Unterstützte Formate sind Audio/WAV; codecs=audio/pcm. Unterstützt Audio bis zu 5 MB.

Antworten

Name Typ Beschreibung
200 OK

RecognitionInfo

OK

Other Status Codes

SpeakerErrorInfo

Fehler

Header

x-ms-error-code: string

Sicherheit

Ocp-Apim-Subscription-Key

Typ: apiKey
In: header

Beispiele

Successful Query

Beispielanforderung

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f:verify?api-version=2021-09-05


"{binary file date}"

Beispiel für eine Antwort

Content-Type: application/json
{
  "recognitionResult": "accept",
  "score": 0.63
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definitionen

Name Beschreibung
Error
RecognitionInfo

Ergebnis der Sprechererkennung

ResultType

Gehört Audio zum Zielprofil?

SpeakerErrorInfo

Sprecherfehlermeldung

Error

Name Typ Beschreibung
code

string

message

string

RecognitionInfo

Ergebnis der Sprechererkennung

Name Typ Beschreibung
recognitionResult

ResultType

Gehört Audio zum Zielprofil?

score

number

Eine Floatzahl, die die Ähnlichkeit zwischen Eingabeaudio und zielorientiertem Sprachdruck angibt. Diese Zahl muss zwischen 0 und 1 sein. Eine höhere Zahl bedeutet eine höhere Ähnlichkeit.

ResultType

Gehört Audio zum Zielprofil?

Name Typ Beschreibung
accept

string

reject

string

SpeakerErrorInfo

Sprecherfehlermeldung

Name Typ Beschreibung
error

Error