Text Independent - Identify Single Speaker
Identifizieren eines Einzellautsprecherprofils
Gibt an, wer in Eingabeaudio unter einer Liste von Kandidatenprofilen spricht.
Begrenzungen:
Die minimale Audioeingabelänge beträgt 1 Sekunde
Die maximale Audioeingabelänge beträgt 120 Sekunden
Die Mindestanzahl der Kandidatenlautsprecher ist 1
Die maximale Anzahl von Kandidatenlautsprechern beträgt 50
Die minimale effektive Sprachlänge (ohne Stummschaltung und andere Nicht-Sprachframes) ist 4 Sekunden Diese Einschränkung kann deaktiviert werden, indem "ignoreMinLength" auf truefestgelegt wird.
Das minimale Audiosignal-zu-Rausch-Verhältnis (SNR) ist 2dB-
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
endpoint
|
path | True |
string |
Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
Gibt die Version des Vorgangs an, der für diese Anforderung verwendet werden soll. |
profile
|
query | True |
string[] |
Durch Trennzeichen getrennte Profil-IDs. Die maximal unterstützte Zahl beträgt 50 IDs. |
ignore
|
query |
boolean |
Bei "true" wird die für die Identifizierung erforderliche Mindestmenge an Sprache übersprungen. Der Standardwert ist "false". |
Anforderungsheader
Media Types: "audio/wav; codecs=audio/pcm"
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Anforderungstext
Media Types: "audio/wav; codecs=audio/pcm"
Name | Typ | Beschreibung |
---|---|---|
audioData |
object (file) |
Binäre Audiodatei. Unterstützte Formate sind Audio/Wav; codecs=audio/pcm. Unterstützt Audio bis zu 5 MB. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
200 OK |
OKAY |
|
Other Status Codes |
Versagen Header x-ms-error-code: string |
Sicherheit
Ocp-Apim-Subscription-Key
Typ:
apiKey
In:
header
Beispiele
Successful Query
Beispielanforderung
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Beispiel für eine Antwort
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definitionen
Name | Beschreibung |
---|---|
Error | |
Identified |
|
Identify |
Identifizierte Sprecherinformationen |
Speaker |
Sprecherfehlermeldung |
Error
Name | Typ | Beschreibung |
---|---|---|
code |
string |
|
message |
string |
IdentifiedSingleSpeakerInfo
Name | Typ | Beschreibung |
---|---|---|
identifiedProfile |
Objekt, das Daten des identifizierten Profils enthält. |
|
profilesRanking |
Objekt, das Daten der top 5 Profile (einschließlich identifizierter Profile) enthält, sortiert nach Bewertung in absteigender Reihenfolge. |
IdentifyInfo
Identifizierte Sprecherinformationen
Name | Typ | Beschreibung |
---|---|---|
profileId |
string (uuid) |
ID des angegebenen Profils. Wenn kein Kandidat als der richtige Sprecher identifiziert wird, wird der Wert auf leere GUID festgelegt. |
score |
number |
Eine Float-Nummer, die die Ähnlichkeit zwischen Eingabeaudio und zielorientiertem Sprachdruck angibt. Diese Zahl muss zwischen 0 und 1 sein. Eine höhere Zahl bedeutet eine höhere Ähnlichkeit. |
SpeakerErrorInfo
Sprecherfehlermeldung
Name | Typ | Beschreibung |
---|---|---|
error |