Megosztás a következőn keresztül:


Text Independent - Identify Single Speaker

Egy hangszórós profil azonosítása
Azonosítja, hogy ki beszél a bemeneti hangban a jelölt profilok listájában.

Korlátozások:

  • A hangbemenet minimális hossza 1 másodperc

  • A hangbemenet maximális hossza 120 másodperc

  • A jelöltek minimális száma 1

  • A jelöltek maximális száma 50

  • Minimális tényleges beszédhossz (a csend és más nem beszédkeretek kivételével) 4 másodperc Ez a korlátozás letiltható úgy, hogy az "ignoreMinLength" értéket a valódi .

  • A minimális hangjel-zaj arány (SNR) 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

URI-paraméterek

Name In Kötelező Típus Description
endpoint
path True

string

Támogatott Cognitive Services-végpontok (protokoll és állomásnév, például: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

A kérelemhez használni kívánt művelet verzióját adja meg.

profileIds
query True

string[]

Vesszőkkel tagolt profilazonosítók. A maximális támogatott szám 50 azonosító.

ignoreMinLength
query

boolean

Ha igaz, a program kihagyja az azonosításhoz szükséges minimális beszédmennyiséget. Az alapértelmezett érték hamis.

Kérelem fejléce

Media Types: "audio/wav; codecs=audio/pcm"

Name Kötelező Típus Description
Ocp-Apim-Subscription-Key True

string

Kérelem törzse

Media Types: "audio/wav; codecs=audio/pcm"

Name Típus Description
audioData

object (file)

Bináris hangfájl. A támogatott formátumok a hang/wav; codecs=audio/pcm. Legfeljebb 5 MB-os hangminőséget támogat.

Válaszok

Name Típus Description
200 OK

IdentifiedSingleSpeakerInfo

OKÉ

Other Status Codes

SpeakerErrorInfo

Nem sikerült

Fejlécek

x-ms-error-code: string

Biztonság

Ocp-Apim-Subscription-Key

Típus: apiKey
In: header

Példák

Successful Query

Mintakérelem

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Mintaválasz

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definíciók

Name Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Azonosított előadói adatok

SpeakerErrorInfo

Előadói hibaüzenet

Error

Name Típus Description
code

string

message

string

IdentifiedSingleSpeakerInfo

Name Típus Description
identifiedProfile

IdentifyInfo

Azonosított profil adatait tartalmazó objektum.

profilesRanking

IdentifyInfo[]

Az első 5 profil adatait tartalmazó objektum (beleértve az azonosított profilt is) csökkenő sorrendben, pontszám szerint rendezve.

IdentifyInfo

Azonosított előadói adatok

Name Típus Description
profileId

string (uuid)

A profil azonosításának azonosítója. Ha a rendszer nem azonosít jelöltet a megfelelő hangszóróként, az érték üres GUID értékre van állítva.

score

number

Lebegőpontos szám, amely a bemeneti hang és a célzott hangnyomtatás közötti hasonlóságot jelzi. Ennek a számnak 0 és 1 közöttinek kell lennie. A magasabb szám nagyobb hasonlóságot jelent.

SpeakerErrorInfo

Előadói hibaüzenet

Name Típus Description
error

Error