Text Independent - Identify Single Speaker
단일 스피커 프로필 식별
후보 프로필 목록 중에서 입력 오디오로 말하는 사용자를 식별합니다.
제한 사항:
최소 오디오 입력 길이는 1초입니다.
최대 오디오 입력 길이는 120초입니다.
최소 후보 화자 수는 1입니다.
최대 후보 화자 수는 50개입니다.
최소 유효 음성 길이(무음 및 기타 비 음성 프레임 제외)는 4초 입니다. "ignoreMinLength"를 true로 설정하여 이 제한을 사용하지 않도록 설정할 수 있습니다.
최소 오디오 SNR(신호 대 노이즈 비율)은 2dB입니다.
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
URI 매개 변수
Name | In(다음 안에) | 필수 | 형식 | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
지원되는 Cognitive Services 엔드포인트(프로토콜 및 호스트 이름( 예: https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
이 요청에 사용할 작업의 버전을 지정합니다. |
profile
|
query | True |
string[] |
쉼표로 구분된 프로필 ID입니다. 지원되는 최대 수는 50개의 ID입니다. |
ignore
|
query |
boolean |
true이면 식별에 필요한 최소 음성 양을 건너뜁습니다. 기본값은 false입니다. |
요청 헤더
Media Types: "audio/wav; codecs=audio/pcm"
Name | 필수 | 형식 | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
요청 본문
Media Types: "audio/wav; codecs=audio/pcm"
Name | 형식 | Description |
---|---|---|
audioData |
object |
이진 오디오 파일. 지원되는 형식은 오디오/웨이브입니다. codecs=audio/pcm. 최대 5MB의 오디오를 지원합니다. |
응답
Name | 형식 | Description |
---|---|---|
200 OK |
정상 |
|
Other Status Codes |
실패 Headers x-ms-error-code: string |
보안
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
예제
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Sample Response
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
정의
Name | Description |
---|---|
Error | |
Identified |
|
Identify |
식별된 화자 정보 |
Speaker |
화자 오류 메시지 |
Error
Name | 형식 | Description |
---|---|---|
code |
string |
|
message |
string |
IdentifiedSingleSpeakerInfo
Name | 형식 | Description |
---|---|---|
identifiedProfile |
식별된 프로필의 데이터를 포함하는 개체입니다. |
|
profilesRanking |
점수별로 내림차순으로 정렬된 상위 5개 프로필(식별된 프로필 포함)의 데이터를 포함하는 개체입니다. |
IdentifyInfo
식별된 화자 정보
Name | 형식 | Description |
---|---|---|
profileId |
string |
프로필의 식별 ID입니다. 적합한 화자로 식별된 후보가 없으면 값이 빈 GUID로 설정됩니다. |
score |
number |
입력 오디오와 대상 음성 인쇄 간의 유사성을 나타내는 float 숫자입니다. 이 숫자는 0에서 1 사이여야 합니다. 숫자가 높을수록 유사성이 높아질 수 있습니다. |
SpeakerErrorInfo
화자 오류 메시지
Name | 형식 | Description |
---|---|---|
error |