Text Independent - Create Enrollment

Zaregistrovat profil
Přidá registraci do existujícího profilu. První registrace musí být předdefinovaná aktivační fráze, která může být uvedená pomocí rozhraní API /phrases/{locale}. Pokud se dosáhne minimálního počtu požadovaných zvuků pro registraci, vytvoří se otisk hlasu. Jakákoli další registrace se použije k vylepšení tisku hlasu.

Omezení:

  • Minimální délka zvukového vstupu na požadavek je 1 sekunda.

  • Maximální délka zvukového vstupu na požadavek je 120 sekund.

  • Minimální celková efektivní délka řeči (s výjimkou ticha a jiných nepřeslovných rámců) pro vytvoření hlasového otisku je 20 sekund Toto omezení lze zakázat nastavením ignoreMinLength na true.

  • Maximální celková délka zvukového vstupu povolená pro vytvoření hlasového otisku je 300 sekund.

  • Minimální poměr signálu k šumu (SNR) zvuku je 2 dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
endpoint
path True

string

Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Jedinečný identifikátor pro ID profilu (GUID)

api-version
query True

string

Určuje verzi operace, která se má pro tento požadavek použít.

ignoreMinLength
query

boolean

Pokud je hodnota true, bude pro tento profil okamžitě vytvořen otisk hlasu bez ohledu na to, kolik řeči je dodáno nebo uloženo. Výchozí hodnota je false.

Hlavička požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name Vyžadováno Typ Description
Ocp-Apim-Subscription-Key True

string

Text požadavku

Media Types: "audio/wav; codecs=audio/pcm"

Name Typ Description
audioData

object

Binární zvukový soubor. Podporované formáty jsou audio/wav; codecs=audio/pcm. Podporuje zvuk až 5 MB.

Odpovědi

Name Typ Description
201 Created

TiEnrollmentInfo

Vytvořeno

Other Status Codes

SpeakerErrorInfo

Selhání

Headers

x-ms-error-code: string

Zabezpečení

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Příklady

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definice

Name Description
Error
SpeakerErrorInfo

Chybová zpráva mluvčího

TiEnrollmentInfo

Informace o registraci profilu mluvčího

TrainingStatusType

Stav představující aktuální stav registrace profilu. Dostupné hodnoty:

  • Registrace: Profil nemá otisk hlasu a není připravený na žádosti o rozpoznání.
  • Školení: Tisk hlasu profilu se vytváří a v tuto chvíli se nedá použít k rozpoznávání.
  • Zaregistrované: Profil má otisk hlasu a je připravený k žádostem o rozpoznávání.

Error

Name Typ Description
code

string

message

string

SpeakerErrorInfo

Chybová zpráva mluvčího

Name Typ Description
error

Error

TiEnrollmentInfo

Informace o registraci profilu mluvčího

Name Typ Description
audioLengthInSec

number

Délka tohoto zvuku registrace v sekundách.

audioSpeechLengthInSec

number

Tato registrace má čistou zvukovou stopu (což je množství zvuku po odebrání ticha a segmentů bez řeči) v sekundách.

enrollmentStatus

TrainingStatusType

Stav představující aktuální stav registrace profilu. Dostupné hodnoty:

  • Registrace: Profil nemá otisk hlasu a není připravený na žádosti o rozpoznání.
  • Školení: Tisk hlasu profilu se vytváří a v tuto chvíli se nedá použít k rozpoznávání.
  • Zaregistrované: Profil má otisk hlasu a je připravený k žádostem o rozpoznávání.
enrollmentsCount

integer

Počet přijatých zvukových připojení pro tento profil

enrollmentsLengthInSec

number

Celková délka zvuků registrace přijatých pro tento profil v sekundách

enrollmentsSpeechLengthInSec

number

Součet čisté řeči (což je množství zvuku po odebrání ticha a segmentů bez řeči) ve všech registracích profilů v sekundách

profileId

string

Jedinečný identifikátor pro ID profilu (GUID)

remainingEnrollmentsSpeechLengthInSec

number

Množství čisté řeči (což je množství zvuku po odebrání ticha a segmentů bez řeči) potřebné k dokončení registrace profilu během několika sekund.

TrainingStatusType

Stav představující aktuální stav registrace profilu. Dostupné hodnoty:

  • Registrace: Profil nemá otisk hlasu a není připravený na žádosti o rozpoznání.
  • Školení: Tisk hlasu profilu se vytváří a v tuto chvíli se nedá použít k rozpoznávání.
  • Zaregistrované: Profil má otisk hlasu a je připravený k žádostem o rozpoznávání.
Name Typ Description
Enrolled

string

Enrolling

string

Training

string