Text Dependent - Create Enrollment

Zaregistrovat profil
Přidá registraci do existujícího profilu. Pokud je dosaženo minimálního počtu požadovaných zvuků registrace, vytvoří se hlasový tisk. Pokud byl hlasový tisk vytvořen dříve, vytvoří se znovu ze všech existujících zvuků registrace, včetně nového.

Omezení:

  • Minimální délka zvukového vstupu na požadavek je 1 sekunda.
  • Maximální délka zvukového vstupu na požadavek je 10 sekund
  • Minimální počet registrací pro vytvoření hlasového otisku je 3.
  • Maximální počet registrací pro vytvoření hlasového otisku je 50
  • Minimální poměr signálu k šumu (SNR) zvuku je 2 dB.

Omezení:

  • První registrace se musí shodovat s existujícím heslem.
  • Všechny registrace po první registraci musí používat stejné heslo jako při první registraci.
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
endpoint
path True

string

Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Jedinečný identifikátor id profilu (GUID).

api-version
query True

string

Určuje verzi operace, která se má použít pro tento požadavek.

Hlavička požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name Vyžadováno Typ Description
Ocp-Apim-Subscription-Key True

string

Text požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name Typ Description
audioData

object

Binární zvukový soubor. Podporované formáty jsou audio/wav; codecs=audio/pcm. Podporuje zvuk až 5 MB.

Odpovědi

Name Typ Description
201 Created

TdEnrollmentInfo

Vytvořeno

Other Status Codes

SpeakerErrorInfo

Selhání

Headers

x-ms-error-code: string

Zabezpečení

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Příklady

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definice

Name Description
Error
SpeakerErrorInfo

Chybová zpráva mluvčího

TdEnrollmentInfo

informace o registraci profilu mluvčího Text-Dependent

TrainingStatusType

Stav představující aktuální stav profilu Dostupné hodnoty:

  • Registrace: Profil nemá tisk hlasu a není připravený pro žádosti o rozpoznávání.
  • Školení: Vytváří se hlasový tisk profilu a v tuto chvíli se nedá použít k rozpoznávání.
  • Zaregistrované: Profil má hlasový tisk a je připravený pro žádosti o rozpoznávání.

Error

Name Typ Description
code

string

message

string

SpeakerErrorInfo

Chybová zpráva mluvčího

Name Typ Description
error

Error

TdEnrollmentInfo

informace o registraci profilu mluvčího Text-Dependent

Name Typ Description
audioLengthInSec

number

Tato délka zvuku registrace v sekundách.

audioSpeechLengthInSec

number

Tato registrace zvuku čisté řeči (což je množství zvuku po odstranění ticha a segmentů bez řeči) délka v sekundách.

enrollmentStatus

TrainingStatusType

Stav představující aktuální stav profilu Dostupné hodnoty:

  • Registrace: Profil nemá tisk hlasu a není připravený pro žádosti o rozpoznávání.
  • Školení: Vytváří se hlasový tisk profilu a v tuto chvíli se nedá použít k rozpoznávání.
  • Zaregistrované: Profil má hlasový tisk a je připravený pro žádosti o rozpoznávání.
enrollmentsCount

integer

Počet přijatých zvukových přenosů registrace pro tento profil

enrollmentsLengthInSec

number

Celková délka registračních zvuků přijatých pro tento profil v sekundách

enrollmentsSpeechLengthInSec

number

Součet čisté řeči (což je množství zvuku po odebrání segmentů ticha a segmentů bez řeči) napříč všemi registracemi profilů během několika sekund.

passPhrase

string

Heslo přidružené k této registraci

profileId

string

Jedinečný identifikátor id profilu (GUID).

remainingEnrollmentsCount

integer

Počet zvuků registrace potřebných k dokončení registrace profilu

TrainingStatusType

Stav představující aktuální stav profilu Dostupné hodnoty:

  • Registrace: Profil nemá tisk hlasu a není připravený pro žádosti o rozpoznávání.
  • Školení: Vytváří se hlasový tisk profilu a v tuto chvíli se nedá použít k rozpoznávání.
  • Zaregistrované: Profil má hlasový tisk a je připravený pro žádosti o rozpoznávání.
Name Typ Description
Enrolled

string

Enrolling

string

Training

string