Text Independent - Create Enrollment

프로필 등록
기존 프로필에 등록을 추가합니다. 첫 번째 등록은 /phrases/{locale} api를 사용하여 나열할 수 있는 미리 정의된 활성화 구여야 합니다. 요청된 등록 오디오의 최소 수에 도달하면 음성 인쇄가 만들어집니다. 추가 등록은 음성 인쇄를 개선하는 데 사용됩니다.

제한 사항:

  • 요청당 최소 오디오 입력 길이는 1초입니다.

  • 요청당 최대 오디오 입력 길이는 120초입니다.

  • 음성 인쇄를 만들기 위한 최소 유효 음성 길이(무음 및 기타 비 음성 프레임 제외)는 20초 입니다. 이 제한은 "ignoreMinLength"를 true로 설정하여 사용하지 않도록 설정할 수 있습니다.

  • 음성 인쇄를 만드는 데 허용되는 최대 총 오디오 입력 길이는 300초입니다.

  • 최소 오디오 SNR(신호 대 노이즈 비율)은 2dB입니다.

POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
endpoint
path True

string

지원되는 Cognitive Services 엔드포인트(프로토콜 및 호스트 이름( 예: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

프로필 ID(guid)의 고유 식별자입니다.

api-version
query True

string

이 요청에 사용할 작업의 버전을 지정합니다.

ignoreMinLength
query

boolean

true이면 음성이 제공되거나 저장되는 양에 관계없이 이 프로필에 대한 음성 인쇄가 즉시 만들어집니다. 기본값은 false입니다.

요청 헤더

Media Types: "audio/wav; codecs=audio/pcm"

Name 필수 형식 Description
Ocp-Apim-Subscription-Key True

string

요청 본문

Media Types: "audio/wav; codecs=audio/pcm"

Name 형식 Description
audioData

object

이진 오디오 파일. 지원되는 형식은 오디오/물결선입니다. codecs=audio/pcm. 최대 5MB의 오디오를 지원합니다.

응답

Name 형식 Description
201 Created

TiEnrollmentInfo

생성일

Other Status Codes

SpeakerErrorInfo

실패

Headers

x-ms-error-code: string

보안

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

예제

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

정의

Name Description
Error
SpeakerErrorInfo

스피커 오류 메시지

TiEnrollmentInfo

Text-Independent Speaker 프로필 등록 정보

TrainingStatusType

프로필의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.

  • 등록: 프로필에 음성 인쇄가 없으며 인식 요청에 사용할 준비가 되지 않았습니다.
  • 교육: 프로필의 음성 인쇄가 생성되고 있으며 현재 인식에 사용할 수 없습니다.
  • 등록됨: 프로필에 음성 인쇄가 있고 인식 요청에 사용할 준비가 되었습니다.

Error

Name 형식 Description
code

string

message

string

SpeakerErrorInfo

스피커 오류 메시지

Name 형식 Description
error

Error

TiEnrollmentInfo

Text-Independent Speaker 프로필 등록 정보

Name 형식 Description
audioLengthInSec

number

이 등록 오디오 길이(초)입니다.

audioSpeechLengthInSec

number

이 등록 오디오 순수 음성(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양) 길이(초)입니다.

enrollmentStatus

TrainingStatusType

프로필의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.

  • 등록: 프로필에 음성 인쇄가 없으며 인식 요청에 사용할 준비가 되지 않았습니다.
  • 교육: 프로필의 음성 인쇄가 생성되고 있으며 현재 인식에 사용할 수 없습니다.
  • 등록됨: 프로필에 음성 인쇄가 있고 인식 요청에 사용할 준비가 되었습니다.
enrollmentsCount

integer

이 프로필에 허용되는 등록 오디오 수입니다.

enrollmentsLengthInSec

number

이 프로필에 허용되는 등록 오디오의 총 길이(초)입니다.

enrollmentsSpeechLengthInSec

number

모든 프로필 등록에서 순수 음성(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양)의 합계(초)입니다.

profileId

string

프로필 ID(guid)의 고유 식별자입니다.

remainingEnrollmentsSpeechLengthInSec

number

프로필 등록을 몇 초 만에 완료하는 데 필요한 순수 음성 양(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양)입니다.

TrainingStatusType

프로필의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.

  • 등록: 프로필에 음성 인쇄가 없으며 인식 요청에 사용할 준비가 되지 않았습니다.
  • 교육: 프로필의 음성 인쇄가 생성되고 있으며 현재 인식에 사용할 수 없습니다.
  • 등록됨: 프로필에 음성 인쇄가 있고 인식 요청에 사용할 준비가 되었습니다.
Name 형식 Description
Enrolled

string

Enrolling

string

Training

string