Text Independent - Create Enrollment

Reference

Service:: Speaker Recognition

API Version:: 2021-09-05

Zaregistrovat profil
Přidá registraci do existujícího profilu. První registrace musí být předdefinovaná aktivační fráze, která může být uvedená pomocí rozhraní API /phrases/{locale}. Pokud se dosáhne minimálního počtu požadovaných zvuků pro registraci, vytvoří se otisk hlasu. Jakákoli další registrace se použije k vylepšení tisku hlasu.

Omezení:

Minimální délka zvukového vstupu na požadavek je 1 sekunda.
Maximální délka zvukového vstupu na požadavek je 120 sekund.
Minimální celková efektivní délka řeči (s výjimkou ticha a jiných nepřeslovných rámců) pro vytvoření hlasového otisku je 20 sekund Toto omezení lze zakázat nastavením ignoreMinLength na true.
Maximální celková délka zvukového vstupu povolená pro vytvoření hlasového otisku je 300 sekund.
Minimální poměr signálu k šumu (SNR) zvuku je 2 dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05

With optional parameters:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

Parametry identifikátoru URI

Name	V	Vyžadováno	Typ	Description
endpoint	path	True	string	Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com).
profileId	path	True	string uuid	Jedinečný identifikátor pro ID profilu (GUID)
api-version	query	True	string	Určuje verzi operace, která se má pro tento požadavek použít.
ignoreMinLength	query		boolean	Pokud je hodnota true, bude pro tento profil okamžitě vytvořen otisk hlasu bez ohledu na to, kolik řeči je dodáno nebo uloženo. Výchozí hodnota je false.

Hlavička požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name	Vyžadováno	Typ	Description
Ocp-Apim-Subscription-Key	True	string

Text požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name	Typ	Description
audioData	object	Binární zvukový soubor. Podporované formáty jsou audio/wav; codecs=audio/pcm. Podporuje zvuk až 5 MB.

Odpovědi

Name	Typ	Description
201 Created	TiEnrollmentInfo	Vytvořeno
Other Status Codes	SpeakerErrorInfo	Selhání Headers x-ms-error-code: string

Name

Typ

Description

201 Created

TiEnrollmentInfo

Vytvořeno

Other Status Codes

SpeakerErrorInfo

Selhání

Headers

x-ms-error-code: string

Zabezpečení

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Příklady

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Status code:: 201

Content-Type: application/json

Response Body

{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definice

Name	Description
Error
SpeakerErrorInfo	Chybová zpráva mluvčího
TiEnrollmentInfo	Informace o registraci profilu mluvčího
TrainingStatusType	Stav představující aktuální stav registrace profilu. Dostupné hodnoty: Registrace: Profil nemá otisk hlasu a není připravený na žádosti o rozpoznání. Školení: Tisk hlasu profilu se vytváří a v tuto chvíli se nedá použít k rozpoznávání. Zaregistrované: Profil má otisk hlasu a je připravený k žádostem o rozpoznávání.

Error

Name	Typ	Description
code	string
message	string

SpeakerErrorInfo

Chybová zpráva mluvčího

Name	Typ	Description
error	Error

TiEnrollmentInfo

Informace o registraci profilu mluvčího

Name	Typ	Description
audioLengthInSec	number	Délka tohoto zvuku registrace v sekundách.
audioSpeechLengthInSec	number	Tato registrace má čistou zvukovou stopu (což je množství zvuku po odebrání ticha a segmentů bez řeči) v sekundách.
enrollmentStatus	TrainingStatusType	Stav představující aktuální stav registrace profilu. Dostupné hodnoty: Registrace: Profil nemá otisk hlasu a není připravený na žádosti o rozpoznání. Školení: Tisk hlasu profilu se vytváří a v tuto chvíli se nedá použít k rozpoznávání. Zaregistrované: Profil má otisk hlasu a je připravený k žádostem o rozpoznávání.
enrollmentsCount	integer	Počet přijatých zvukových připojení pro tento profil
enrollmentsLengthInSec	number	Celková délka zvuků registrace přijatých pro tento profil v sekundách
enrollmentsSpeechLengthInSec	number	Součet čisté řeči (což je množství zvuku po odebrání ticha a segmentů bez řeči) ve všech registracích profilů v sekundách
profileId	string	Jedinečný identifikátor pro ID profilu (GUID)
remainingEnrollmentsSpeechLengthInSec	number	Množství čisté řeči (což je množství zvuku po odebrání ticha a segmentů bez řeči) potřebné k dokončení registrace profilu během několika sekund.

TrainingStatusType

Stav představující aktuální stav registrace profilu. Dostupné hodnoty:

Registrace: Profil nemá otisk hlasu a není připravený na žádosti o rozpoznání.
Školení: Tisk hlasu profilu se vytváří a v tuto chvíli se nedá použít k rozpoznávání.
Zaregistrované: Profil má otisk hlasu a je připravený k žádostem o rozpoznávání.

Name	Typ	Description
Enrolled	string
Enrolling	string
Training	string

Text Independent - Create Enrollment

Parametry identifikátoru URI

Hlavička požadavku

Text požadavku

Odpovědi

Zabezpečení

Ocp-Apim-Subscription-Key

Příklady

Successful Query

Sample Request

Sample Response

Definice

Error

SpeakerErrorInfo

TiEnrollmentInfo

TrainingStatusType

Další materiály