Text Independent - Create Enrollment
Zaregistrovat profil
Přidá registraci do existujícího profilu.
První registrace musí být předdefinovaná aktivační fráze, která může být uvedená pomocí rozhraní API /phrases/{locale}.
Pokud se dosáhne minimálního počtu požadovaných zvuků pro registraci, vytvoří se otisk hlasu.
Jakákoli další registrace se použije k vylepšení tisku hlasu.
Omezení:
Minimální délka zvukového vstupu na požadavek je 1 sekunda.
Maximální délka zvukového vstupu na požadavek je 120 sekund.
Minimální celková efektivní délka řeči (s výjimkou ticha a jiných nepřeslovných rámců) pro vytvoření hlasového otisku je 20 sekund Toto omezení lze zakázat nastavením ignoreMinLength na true.
Maximální celková délka zvukového vstupu povolená pro vytvoření hlasového otisku je 300 sekund.
Minimální poměr signálu k šumu (SNR) zvuku je 2 dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
Parametry identifikátoru URI
Name | V | Vyžadováno | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Jedinečný identifikátor pro ID profilu (GUID) |
api-version
|
query | True |
string |
Určuje verzi operace, která se má pro tento požadavek použít. |
ignore
|
query |
boolean |
Pokud je hodnota true, bude pro tento profil okamžitě vytvořen otisk hlasu bez ohledu na to, kolik řeči je dodáno nebo uloženo. Výchozí hodnota je false. |
Hlavička požadavku
Media Types: "audio/wav; codecs=audio/pcm"
Name | Vyžadováno | Typ | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Text požadavku
Media Types: "audio/wav; codecs=audio/pcm"
Name | Typ | Description |
---|---|---|
audioData |
object |
Binární zvukový soubor. Podporované formáty jsou audio/wav; codecs=audio/pcm. Podporuje zvuk až 5 MB. |
Odpovědi
Name | Typ | Description |
---|---|---|
201 Created |
Vytvořeno |
|
Other Status Codes |
Selhání Headers x-ms-error-code: string |
Zabezpečení
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Příklady
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definice
Name | Description |
---|---|
Error | |
Speaker |
Chybová zpráva mluvčího |
Ti |
Informace o registraci profilu mluvčího |
Training |
Stav představující aktuální stav registrace profilu. Dostupné hodnoty:
|
Error
Name | Typ | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Chybová zpráva mluvčího
Name | Typ | Description |
---|---|---|
error |
TiEnrollmentInfo
Informace o registraci profilu mluvčího
Name | Typ | Description |
---|---|---|
audioLengthInSec |
number |
Délka tohoto zvuku registrace v sekundách. |
audioSpeechLengthInSec |
number |
Tato registrace má čistou zvukovou stopu (což je množství zvuku po odebrání ticha a segmentů bez řeči) v sekundách. |
enrollmentStatus |
Stav představující aktuální stav registrace profilu. Dostupné hodnoty:
|
|
enrollmentsCount |
integer |
Počet přijatých zvukových připojení pro tento profil |
enrollmentsLengthInSec |
number |
Celková délka zvuků registrace přijatých pro tento profil v sekundách |
enrollmentsSpeechLengthInSec |
number |
Součet čisté řeči (což je množství zvuku po odebrání ticha a segmentů bez řeči) ve všech registracích profilů v sekundách |
profileId |
string |
Jedinečný identifikátor pro ID profilu (GUID) |
remainingEnrollmentsSpeechLengthInSec |
number |
Množství čisté řeči (což je množství zvuku po odebrání ticha a segmentů bez řeči) potřebné k dokončení registrace profilu během několika sekund. |
TrainingStatusType
Stav představující aktuální stav registrace profilu. Dostupné hodnoty:
- Registrace: Profil nemá otisk hlasu a není připravený na žádosti o rozpoznání.
- Školení: Tisk hlasu profilu se vytváří a v tuto chvíli se nedá použít k rozpoznávání.
- Zaregistrované: Profil má otisk hlasu a je připravený k žádostem o rozpoznávání.
Name | Typ | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |