Freigeben über


Text Independent - Identify Single Speaker

Identifizieren eines Einzellautsprecherprofils
Gibt an, wer in Eingabeaudio unter einer Liste von Kandidatenprofilen spricht.

Begrenzungen:

  • Die minimale Audioeingabelänge beträgt 1 Sekunde

  • Die maximale Audioeingabelänge beträgt 120 Sekunden

  • Die Mindestanzahl der Kandidatenlautsprecher ist 1

  • Die maximale Anzahl von Kandidatenlautsprechern beträgt 50

  • Die minimale effektive Sprachlänge (ohne Stummschaltung und andere Nicht-Sprachframes) ist 4 Sekunden Diese Einschränkung kann deaktiviert werden, indem "ignoreMinLength" auf truefestgelegt wird.

  • Das minimale Audiosignal-zu-Rausch-Verhältnis (SNR) ist 2dB-

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint
path True

string

Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Gibt die Version des Vorgangs an, der für diese Anforderung verwendet werden soll.

profileIds
query True

string[]

Durch Trennzeichen getrennte Profil-IDs. Die maximal unterstützte Zahl beträgt 50 IDs.

ignoreMinLength
query

boolean

Bei "true" wird die für die Identifizierung erforderliche Mindestmenge an Sprache übersprungen. Der Standardwert ist "false".

Anforderungsheader

Media Types: "audio/wav; codecs=audio/pcm"

Name Erforderlich Typ Beschreibung
Ocp-Apim-Subscription-Key True

string

Anforderungstext

Media Types: "audio/wav; codecs=audio/pcm"

Name Typ Beschreibung
audioData

object (file)

Binäre Audiodatei. Unterstützte Formate sind Audio/Wav; codecs=audio/pcm. Unterstützt Audio bis zu 5 MB.

Antworten

Name Typ Beschreibung
200 OK

IdentifiedSingleSpeakerInfo

OKAY

Other Status Codes

SpeakerErrorInfo

Versagen

Header

x-ms-error-code: string

Sicherheit

Ocp-Apim-Subscription-Key

Typ: apiKey
In: header

Beispiele

Successful Query

Beispielanforderung

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Beispiel für eine Antwort

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definitionen

Name Beschreibung
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Identifizierte Sprecherinformationen

SpeakerErrorInfo

Sprecherfehlermeldung

Error

Name Typ Beschreibung
code

string

message

string

IdentifiedSingleSpeakerInfo

Name Typ Beschreibung
identifiedProfile

IdentifyInfo

Objekt, das Daten des identifizierten Profils enthält.

profilesRanking

IdentifyInfo[]

Objekt, das Daten der top 5 Profile (einschließlich identifizierter Profile) enthält, sortiert nach Bewertung in absteigender Reihenfolge.

IdentifyInfo

Identifizierte Sprecherinformationen

Name Typ Beschreibung
profileId

string (uuid)

ID des angegebenen Profils. Wenn kein Kandidat als der richtige Sprecher identifiziert wird, wird der Wert auf leere GUID festgelegt.

score

number

Eine Float-Nummer, die die Ähnlichkeit zwischen Eingabeaudio und zielorientiertem Sprachdruck angibt. Diese Zahl muss zwischen 0 und 1 sein. Eine höhere Zahl bedeutet eine höhere Ähnlichkeit.

SpeakerErrorInfo

Sprecherfehlermeldung

Name Typ Beschreibung
error

Error