Text Independent - Create Enrollment
프로필 등록
기존 프로필에 등록을 추가합니다.
첫 번째 등록은 /phrases/{locale} api를 사용하여 나열할 수 있는 미리 정의된 활성화 구여야 합니다.
요청된 등록 오디오의 최소 수에 도달하면 음성 인쇄가 만들어집니다.
추가 등록은 음성 인쇄를 개선하는 데 사용됩니다.
제한 사항:
요청당 최소 오디오 입력 길이는 1초입니다.
요청당 최대 오디오 입력 길이는 120초입니다.
음성 인쇄를 만들기 위한 최소 유효 음성 길이(무음 및 기타 비 음성 프레임 제외)는 20초 입니다. ignoreMinLength를 true로 설정하여 이 제한을 사용하지 않도록 설정할 수 있습니다.
음성 인쇄를 만드는 데 허용되는 최대 총 오디오 입력 길이는 300초입니다.
최소 오디오 SNR(신호 대 노이즈 비율)은 2dB입니다.
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI 매개 변수
Name | In(다음 안에) | 필수 | 형식 | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
지원되는 Cognitive Services 엔드포인트(프로토콜 및 호스트 이름( 예: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
프로필 ID(guid)의 고유 식별자입니다. |
api-version
|
query | True |
string |
이 요청에 사용할 작업의 버전을 지정합니다. |
ignore
|
query |
boolean |
true이면 음성이 제공되거나 저장되는 양에 관계없이 이 프로필에 대한 음성 인쇄가 즉시 만들어집니다. 기본값은 false입니다. |
요청 헤더
Media Types: "audio/wav; codecs=audio/pcm"
Name | 필수 | 형식 | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
요청 본문
Media Types: "audio/wav; codecs=audio/pcm"
Name | 형식 | Description |
---|---|---|
audioData |
object |
이진 오디오 파일. 지원되는 형식은 오디오/물결선입니다. codecs=audio/pcm. 최대 5MB의 오디오를 지원합니다. |
응답
Name | 형식 | Description |
---|---|---|
201 Created |
생성일 |
|
Other Status Codes |
실패 헤더 x-ms-error-code: string |
보안
Ocp-Apim-Subscription-Key
형식:
apiKey
In(다음 안에):
header
예제
Successful Query
샘플 요청
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
샘플 응답
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
정의
Name | Description |
---|---|
Error | |
Speaker |
스피커 오류 메시지 |
Ti |
화자 프로필 등록 정보 |
Training |
프로필 등록의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.
|
Error
Name | 형식 | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
스피커 오류 메시지
Name | 형식 | Description |
---|---|---|
error |
TiEnrollmentInfo
화자 프로필 등록 정보
Name | 형식 | Description |
---|---|---|
audioLengthInSec |
number |
이 등록 오디오 길이(초)입니다. |
audioSpeechLengthInSec |
number |
이 등록 오디오 순수 음성(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양) 길이(초)입니다. |
enrollmentStatus |
프로필 등록의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.
|
|
enrollmentsCount |
integer |
이 프로필에 허용되는 등록 오디오 수입니다. |
enrollmentsLengthInSec |
number |
이 프로필에 허용되는 등록 오디오의 총 길이(초)입니다. |
enrollmentsSpeechLengthInSec |
number |
모든 프로필 등록에서 순수 음성(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양)의 합계(초)입니다. |
profileId |
string |
프로필 ID(guid)의 고유 식별자입니다. |
remainingEnrollmentsSpeechLengthInSec |
number |
프로필 등록을 몇 초 만에 완료하는 데 필요한 순수 음성 양(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양)입니다. |
TrainingStatusType
프로필 등록의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.
- 등록: 프로필에 음성 인쇄가 없으며 인식 요청에 사용할 준비가 되지 않았습니다.
- 교육: 프로필의 음성 인쇄가 생성되고 있으며 현재 인식에 사용할 수 없습니다.
- 등록됨: 프로필에 음성 인쇄가 있고 인식 요청에 사용할 준비가 되었습니다.
Name | 형식 | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |