Text Independent - Create Enrollment
Registrera profil
Lägger till en registrering i en befintlig profil.
Den första registreringen måste vara en fördefinierad aktiveringsfras som kan anges med api:et /phrases/{locale}.
Om det minsta antalet begärda registreringsljud nås skapas ett röstuttryck.
Ytterligare registrering kommer att användas för att förbättra röstuttrycket.
Begränsningar:
Minsta ljudinmatningslängd per begäran är 1 sekund
Maximal ljudinmatningslängd per begäran är 120 sekunder
Minsta totala effektiva tallängd (exklusive tystnad och andra icke-talramar) för att skapa ett röstavtryck är 20 sekunder Den här begränsningen kan inaktiveras genom att ange ignoreMinLength till true.
Maximal total ljudinmatningslängd som tillåts för att skapa ett röstavtryck är 300 sekunder
Minsta ljud signal-till-brus-förhållande (SNR) är 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Unik identifierare för profil-ID (GUID). |
api-version
|
query | True |
string |
Anger vilken version av åtgärden som ska användas för den här begäran. |
ignore
|
query |
boolean |
Om det är sant skapas en röstutskrift omedelbart för den här profilen oavsett hur mycket tal som tillhandahålls eller lagras. Standardvärdet är false. |
Begärandehuvud
Media Types: "audio/wav; codecs=audio/pcm"
Name | Obligatorisk | Typ | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Begärandetext
Media Types: "audio/wav; codecs=audio/pcm"
Name | Typ | Description |
---|---|---|
audioData |
object |
Binär ljudfil. Format som stöds är ljud/wav; codecs=audio/pcm. Stöder ljud upp till 5 MB. |
Svar
Name | Typ | Description |
---|---|---|
201 Created |
Skapad |
|
Other Status Codes |
Fel Headers x-ms-error-code: string |
Säkerhet
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exempel
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definitioner
Name | Description |
---|---|
Error | |
Speaker |
Talarfelmeddelande |
Ti |
Registreringsinformation för talarprofil |
Training |
Status som representerar profilregistreringens aktuella tillstånd. Tillgängliga värden är:
|
Error
Name | Typ | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Talarfelmeddelande
Name | Typ | Description |
---|---|---|
error |
TiEnrollmentInfo
Registreringsinformation för talarprofil
Name | Typ | Description |
---|---|---|
audioLengthInSec |
number |
Den här registreringens ljudlängd i sekunder. |
audioSpeechLengthInSec |
number |
Denna registrering ljud ren tal (vilket är mängden ljud efter att ha tagit bort tystnad och icke-tal segment) längd i sekunder. |
enrollmentStatus |
Status som representerar profilregistreringens aktuella tillstånd. Tillgängliga värden är:
|
|
enrollmentsCount |
integer |
Antal registreringsljud som godkänts för den här profilen. |
enrollmentsLengthInSec |
number |
Total längd på registreringsljud som godkänts för den här profilen på några sekunder. |
enrollmentsSpeechLengthInSec |
number |
Sammanfattning av rent tal (vilket är mängden ljud efter att ha tagit bort tystnadssegment och icke-talsegment) i alla profilregistreringar på några sekunder. |
profileId |
string |
Unik identifierare för profil-ID (GUID). |
remainingEnrollmentsSpeechLengthInSec |
number |
Mängden rent tal (vilket är mängden ljud efter att ha tagit bort tystnadssegment och icke-talsegment) som behövs för att slutföra profilregistreringen på några sekunder. |
TrainingStatusType
Status som representerar profilregistreringens aktuella tillstånd. Tillgängliga värden är:
- Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden.
- Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu.
- Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
Name | Typ | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |