Sdílet prostřednictvím


Text Independent - Identify Single Speaker

Identifikace profilu jednoho mluvčího
Identifikuje, kdo mluví ve vstupním zvuku mezi seznamem kandidátských profilů.

Omezení:

  • Minimální délka zvukového vstupu je 1 sekunda

  • Maximální délka zvukového vstupu je 120 sekund

  • Minimální počet kandidátských mluvčích je 1

  • Maximální počet kandidátských mluvčích je 50

  • Minimální efektivní délka řeči (s výjimkou ticha a jiných neslovných snímků) je 4 sekundy Toto omezení může být zakázáno nastavením ignorovatMinLength na true.

  • Minimální poměr zvuku signálu k šumu (SNR) je 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
endpoint
path True

string

Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Určuje verzi operace, která se má pro tento požadavek použít.

profileIds
query True

string[]

ID profilů oddělených čárkami. Maximální podporované číslo je 50 ID.

ignoreMinLength
query

boolean

Pokud je pravda, minimální množství řeči potřebné k identifikaci se přeskočí. Výchozí hodnota je false.

Hlavička požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name Vyžadováno Typ Description
Ocp-Apim-Subscription-Key True

string

Text požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name Typ Description
audioData

object (file)

Binární zvukový soubor. Podporované formáty jsou audio/wav; kodeky=audio/pcm. Podporuje zvuk až 5 MB.

Odpovědi

Name Typ Description
200 OK

IdentifiedSingleSpeakerInfo

OK

Other Status Codes

SpeakerErrorInfo

Selhání

Hlavičky

x-ms-error-code: string

Zabezpečení

Ocp-Apim-Subscription-Key

Typ: apiKey
V: header

Příklady

Successful Query

Ukázkový požadavek

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Ukázková odpověď

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definice

Name Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Informace o identifikovaném mluvčím

SpeakerErrorInfo

Chybová zpráva mluvčího

Error

Name Typ Description
code

string

message

string

IdentifiedSingleSpeakerInfo

Name Typ Description
identifiedProfile

IdentifyInfo

Objekt obsahující data identifikovaného profilu

profilesRanking

IdentifyInfo[]

Objekt obsahující data prvních 5 profilů (včetně identifikovaných profilů) seřazených sestupně podle skóre

IdentifyInfo

Informace o identifikovaném mluvčím

Name Typ Description
profileId

string (uuid)

ID identifikovaného profilu. Pokud není žádný kandidát identifikován jako správný mluvčí, hodnota je nastavena na prázdný identifikátor GUID.

score

number

Číslo float označující podobnost mezi vstupním zvukem a cílovým hlasovým tiskem. Toto číslo musí být v rozmezí od 0 do 1. Vyšší číslo znamená vyšší podobnost.

SpeakerErrorInfo

Chybová zpráva mluvčího

Name Typ Description
error

Error