Text Independent - Create Enrollment

Referens

Service:: Speaker Recognition

API Version:: 2021-09-05

Registrera profil
Lägger till en registrering i en befintlig profil. Den första registreringen måste vara en fördefinierad aktiveringsfras som kan anges med api:et /phrases/{locale}. Om det minsta antalet begärda registreringsljud nås skapas ett röstuttryck. Ytterligare registrering kommer att användas för att förbättra röstuttrycket.

Begränsningar:

Minsta ljudinmatningslängd per begäran är 1 sekund
Maximal ljudinmatningslängd per begäran är 120 sekunder
Minsta totala effektiva tallängd (exklusive tystnad och andra icke-talramar) för att skapa ett röstavtryck är 20 sekunder Den här begränsningen kan inaktiveras genom att ange ignoreMinLength till true.
Maximal total ljudinmatningslängd som tillåts för att skapa ett röstavtryck är 300 sekunder
Minsta ljud signal-till-brus-förhållande (SNR) är 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05

With optional parameters:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI-parametrar

Name	I	Obligatorisk	Typ	Description
endpoint	path	True	string	Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com).
profileId	path	True	string uuid	Unik identifierare för profil-ID (GUID).
api-version	query	True	string	Anger vilken version av åtgärden som ska användas för den här begäran.
ignoreMinLength	query		boolean	Om det är sant skapas en röstutskrift omedelbart för den här profilen oavsett hur mycket tal som tillhandahålls eller lagras. Standardvärdet är false.

Begärandehuvud

Media Types: "audio/wav; codecs=audio/pcm"

Name	Obligatorisk	Typ	Description
Ocp-Apim-Subscription-Key	True	string

Begärandetext

Media Types: "audio/wav; codecs=audio/pcm"

Name	Typ	Description
audioData	object	Binär ljudfil. Format som stöds är ljud/wav; codecs=audio/pcm. Stöder ljud upp till 5 MB.

Svar

Name	Typ	Description
201 Created	TiEnrollmentInfo	Skapad
Other Status Codes	SpeakerErrorInfo	Fel Headers x-ms-error-code: string

Name

Typ

Description

201 Created

TiEnrollmentInfo

Skapad

Other Status Codes

SpeakerErrorInfo

Fel

Headers

x-ms-error-code: string

Säkerhet

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exempel

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Status code:: 201

Content-Type: application/json

Response Body

{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definitioner

Name	Description
Error
SpeakerErrorInfo	Talarfelmeddelande
TiEnrollmentInfo	Registreringsinformation för talarprofil
TrainingStatusType	Status som representerar profilregistreringens aktuella tillstånd. Tillgängliga värden är: Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden. Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu. Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.

Error

Name	Typ	Description
code	string
message	string

SpeakerErrorInfo

Talarfelmeddelande

Name	Typ	Description
error	Error

TiEnrollmentInfo

Registreringsinformation för talarprofil

Name	Typ	Description
audioLengthInSec	number	Den här registreringens ljudlängd i sekunder.
audioSpeechLengthInSec	number	Denna registrering ljud ren tal (vilket är mängden ljud efter att ha tagit bort tystnad och icke-tal segment) längd i sekunder.
enrollmentStatus	TrainingStatusType	Status som representerar profilregistreringens aktuella tillstånd. Tillgängliga värden är: Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden. Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu. Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
enrollmentsCount	integer	Antal registreringsljud som godkänts för den här profilen.
enrollmentsLengthInSec	number	Total längd på registreringsljud som godkänts för den här profilen på några sekunder.
enrollmentsSpeechLengthInSec	number	Sammanfattning av rent tal (vilket är mängden ljud efter att ha tagit bort tystnadssegment och icke-talsegment) i alla profilregistreringar på några sekunder.
profileId	string	Unik identifierare för profil-ID (GUID).
remainingEnrollmentsSpeechLengthInSec	number	Mängden rent tal (vilket är mängden ljud efter att ha tagit bort tystnadssegment och icke-talsegment) som behövs för att slutföra profilregistreringen på några sekunder.

TrainingStatusType

Status som representerar profilregistreringens aktuella tillstånd. Tillgängliga värden är:

Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden.
Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu.
Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.

Name	Typ	Description
Enrolled	string
Enrolling	string
Training	string

Share via

Text Independent - Create Enrollment

URI-parametrar

Begärandehuvud

Begärandetext

Svar

Säkerhet

Ocp-Apim-Subscription-Key

Exempel

Successful Query

Sample Request

Sample Response

Definitioner

Error

SpeakerErrorInfo

TiEnrollmentInfo

TrainingStatusType

Ytterligare resurser