Share via


Text Independent - Create Enrollment

Profil regisztrálása
Regisztrációt ad hozzá a meglévő profilhoz. Az első regisztrációnak egy előre definiált aktiválási kifejezésnek kell lennie, amely a /phrases/{locale} api használatával listázható. Ha eléri a kért regisztrációs hangok minimális számát, a rendszer hangnyomatot hoz létre. A további regisztrációk a hangnyomtatás javítására szolgálnak.

Korlátozások:

  • A hangbemenet minimális hossza kérésenként 1 másodperc

  • A hangbemenet maximális hossza kérelemenként 120 másodperc

  • A hanglenyomat létrehozásához szükséges minimális teljes tényleges beszédhossz (a csend és más nem beszédkeretek kivételével) 20 másodperc . Ez a korlátozás az "ignoreMinLength" érték igaz értékre állításával tiltható le.

  • A hanglenyomat létrehozásához megengedett maximális hangbemeneti hossz 300 másodperc

  • A hang jel-zaj arányának (SNR) minimális értéke 2dB

POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI-paraméterek

Name In Kötelező Típus Description
endpoint
path True

string

Támogatott Cognitive Services-végpontok (protokoll és állomásnév, például: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Egyedi azonosító a profilazonosítóhoz (guid).

api-version
query True

string

A kérelemhez használni kívánt művelet verzióját adja meg.

ignoreMinLength
query

boolean

Ha igaz, a rendszer azonnal létrehoz egy hangnyomatot ehhez a profilhoz, függetlenül attól, hogy mennyi beszédet ad meg vagy tárol. Az alapértelmezett érték a false (hamis).

Kérelem fejléce

Media Types: "audio/wav; codecs=audio/pcm"

Name Kötelező Típus Description
Ocp-Apim-Subscription-Key True

string

Kérelem törzse

Media Types: "audio/wav; codecs=audio/pcm"

Name Típus Description
audioData

object

Bináris hangfájl. A támogatott formátumok a hang/wav; codecs=audio/pcm. Támogatja az 5 MB-ig tartó hangminőséget.

Válaszok

Name Típus Description
201 Created

TiEnrollmentInfo

Létrehozva

Other Status Codes

SpeakerErrorInfo

Hiba

Headers

x-ms-error-code: string

Biztonság

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Példák

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definíciók

Name Description
Error
SpeakerErrorInfo

Előadói hibaüzenet

TiEnrollmentInfo

Text-Independent Speaker-profil regisztrációs adatai

TrainingStatusType

A profil aktuális állapotát jelző állapot. Lehetséges értékek:

  • Regisztráció: a profil nem rendelkezik hangnyomatokkal, és nem áll készen a felismerési kérelmekre.
  • Oktatás: a profil hangnyomata létrejön, és jelenleg nem használható a felismeréshez.
  • Regisztrálva: a profil rendelkezik hangnyomatokkal, és készen áll a felismerési kérelmekre.

Error

Name Típus Description
code

string

message

string

SpeakerErrorInfo

Előadói hibaüzenet

Name Típus Description
error

Error

TiEnrollmentInfo

Text-Independent Speaker-profil regisztrációs adatai

Name Típus Description
audioLengthInSec

number

Ez a regisztráció hanghossza másodpercben.

audioSpeechLengthInSec

number

Ez a regisztrációs hang tiszta beszéd (amely a hang mennyisége a csend és a nem beszéd szegmensek eltávolítása után) hossza másodpercben.

enrollmentStatus

TrainingStatusType

A profil aktuális állapotát jelző állapot. Lehetséges értékek:

  • Regisztráció: a profil nem rendelkezik hangnyomatokkal, és nem áll készen a felismerési kérelmekre.
  • Oktatás: a profil hangnyomata létrejön, és jelenleg nem használható a felismeréshez.
  • Regisztrálva: a profil rendelkezik hangnyomatokkal, és készen áll a felismerési kérelmekre.
enrollmentsCount

integer

A profilhoz elfogadott regisztrációs hanganyagok száma.

enrollmentsLengthInSec

number

A profilhoz elfogadott regisztrációs hanganyagok teljes hossza másodpercben.

enrollmentsSpeechLengthInSec

number

A tiszta beszéd összegzése (ez a hangmennyiség a csend és a nem beszéd szegmensek eltávolítása után) az összes profilregisztrációban másodpercek alatt.

profileId

string

Egyedi azonosító a profilazonosítóhoz (guid).

remainingEnrollmentsSpeechLengthInSec

number

A profilregisztráció másodpercek alatt történő elvégzéséhez szükséges tiszta beszéd mennyisége (amely a hallgatás és a nem beszédszegmensek eltávolítása után eltelt hangmennyiség).

TrainingStatusType

A profil aktuális állapotát jelző állapot. Lehetséges értékek:

  • Regisztráció: a profil nem rendelkezik hangnyomatokkal, és nem áll készen a felismerési kérelmekre.
  • Oktatás: a profil hangnyomata létrejön, és jelenleg nem használható a felismeréshez.
  • Regisztrálva: a profil rendelkezik hangnyomatokkal, és készen áll a felismerési kérelmekre.
Name Típus Description
Enrolled

string

Enrolling

string

Training

string