Text Independent - Create Enrollment
Profil regisztrálása
Regisztrációt ad hozzá a meglévő profilhoz.
Az első regisztrációnak egy előre definiált aktiválási kifejezésnek kell lennie, amely a /phrases/{locale} api használatával listázható.
Ha eléri a kért regisztrációs hangok minimális számát, a rendszer hangnyomatot hoz létre.
A további regisztrációk a hangnyomtatás javítására szolgálnak.
Korlátozások:
A hangbemenet minimális hossza kérésenként 1 másodperc
A hangbemenet maximális hossza kérelemenként 120 másodperc
A hanglenyomat létrehozásához szükséges minimális teljes tényleges beszédhossz (a csend és más nem beszédkeretek kivételével) 20 másodperc . Ez a korlátozás az "ignoreMinLength" érték igaz értékre állításával tiltható le.
A hanglenyomat létrehozásához megengedett maximális hangbemeneti hossz 300 másodperc
A hang jel-zaj arányának (SNR) minimális értéke 2dB
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI-paraméterek
Name | In | Kötelező | Típus | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Támogatott Cognitive Services-végpontok (protokoll és állomásnév, például: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Egyedi azonosító a profilazonosítóhoz (guid). |
api-version
|
query | True |
string |
A kérelemhez használni kívánt művelet verzióját adja meg. |
ignore
|
query |
boolean |
Ha igaz, a rendszer azonnal létrehoz egy hangnyomatot ehhez a profilhoz, függetlenül attól, hogy mennyi beszédet ad meg vagy tárol. Az alapértelmezett érték a false (hamis). |
Kérelem fejléce
Media Types: "audio/wav; codecs=audio/pcm"
Name | Kötelező | Típus | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Kérelem törzse
Media Types: "audio/wav; codecs=audio/pcm"
Name | Típus | Description |
---|---|---|
audioData |
object |
Bináris hangfájl. A támogatott formátumok a hang/wav; codecs=audio/pcm. Támogatja az 5 MB-ig tartó hangminőséget. |
Válaszok
Name | Típus | Description |
---|---|---|
201 Created |
Létrehozva |
|
Other Status Codes |
Hiba Headers x-ms-error-code: string |
Biztonság
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Példák
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definíciók
Name | Description |
---|---|
Error | |
Speaker |
Előadói hibaüzenet |
Ti |
Text-Independent Speaker-profil regisztrációs adatai |
Training |
A profil aktuális állapotát jelző állapot. Lehetséges értékek:
|
Error
Name | Típus | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Előadói hibaüzenet
Name | Típus | Description |
---|---|---|
error |
TiEnrollmentInfo
Text-Independent Speaker-profil regisztrációs adatai
Name | Típus | Description |
---|---|---|
audioLengthInSec |
number |
Ez a regisztráció hanghossza másodpercben. |
audioSpeechLengthInSec |
number |
Ez a regisztrációs hang tiszta beszéd (amely a hang mennyisége a csend és a nem beszéd szegmensek eltávolítása után) hossza másodpercben. |
enrollmentStatus |
A profil aktuális állapotát jelző állapot. Lehetséges értékek:
|
|
enrollmentsCount |
integer |
A profilhoz elfogadott regisztrációs hanganyagok száma. |
enrollmentsLengthInSec |
number |
A profilhoz elfogadott regisztrációs hanganyagok teljes hossza másodpercben. |
enrollmentsSpeechLengthInSec |
number |
A tiszta beszéd összegzése (ez a hangmennyiség a csend és a nem beszéd szegmensek eltávolítása után) az összes profilregisztrációban másodpercek alatt. |
profileId |
string |
Egyedi azonosító a profilazonosítóhoz (guid). |
remainingEnrollmentsSpeechLengthInSec |
number |
A profilregisztráció másodpercek alatt történő elvégzéséhez szükséges tiszta beszéd mennyisége (amely a hallgatás és a nem beszédszegmensek eltávolítása után eltelt hangmennyiség). |
TrainingStatusType
A profil aktuális állapotát jelző állapot. Lehetséges értékek:
- Regisztráció: a profil nem rendelkezik hangnyomatokkal, és nem áll készen a felismerési kérelmekre.
- Oktatás: a profil hangnyomata létrejön, és jelenleg nem használható a felismeréshez.
- Regisztrálva: a profil rendelkezik hangnyomatokkal, és készen áll a felismerési kérelmekre.
Name | Típus | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |