Text Independent - Identify Single Speaker

참조

Service:: Speaker Recognition

API Version:: 2021-09-05

단일 스피커 프로필 식별
후보 프로필 목록 중에서 입력 오디오로 말하는 사용자를 식별합니다.

제한 사항:

최소 오디오 입력 길이는 1초입니다.
최대 오디오 입력 길이는 120초입니다.
최소 후보 화자 수는 1입니다.
최대 후보 화자 수는 50개입니다.
최소 유효 음성 길이(무음 및 기타 비 음성 프레임 제외)는 4초 입니다. "ignoreMinLength"를 true로 설정하여 이 제한을 사용하지 않도록 설정할 수 있습니다.
최소 오디오 SNR(신호 대 노이즈 비율)은 2dB입니다.

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}

With optional parameters:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

URI 매개 변수

Name	In(다음 안에)	필수	형식	Description
endpoint	path	True	string	지원되는 Cognitive Services 엔드포인트(프로토콜 및 호스트 이름( 예: https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	이 요청에 사용할 작업의 버전을 지정합니다.
profileIds	query	True	string[]	쉼표로 구분된 프로필 ID입니다. 지원되는 최대 수는 50개의 ID입니다.
ignoreMinLength	query		boolean	true이면 식별에 필요한 최소 음성 양을 건너뜁습니다. 기본값은 false입니다.

요청 헤더

Media Types: "audio/wav; codecs=audio/pcm"

Name	필수	형식	Description
Ocp-Apim-Subscription-Key	True	string

요청 본문

Media Types: "audio/wav; codecs=audio/pcm"

Name	형식	Description
audioData	object	이진 오디오 파일. 지원되는 형식은 오디오/웨이브입니다. codecs=audio/pcm. 최대 5MB의 오디오를 지원합니다.

응답

Name	형식	Description
200 OK	IdentifiedSingleSpeakerInfo	정상
Other Status Codes	SpeakerErrorInfo	실패 Headers x-ms-error-code: string

Name

형식

Description

200 OK

IdentifiedSingleSpeakerInfo

정상

Other Status Codes

SpeakerErrorInfo

실패

Headers

x-ms-error-code: string

보안

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

예제

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Status code:: 200

Content-Type: application/json

Response Body

{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

정의

Name	Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo	식별된 화자 정보
SpeakerErrorInfo	화자 오류 메시지

Error

Name	형식	Description
code	string
message	string

IdentifiedSingleSpeakerInfo

Name	형식	Description
identifiedProfile	IdentifyInfo	식별된 프로필의 데이터를 포함하는 개체입니다.
profilesRanking	IdentifyInfo[]	점수별로 내림차순으로 정렬된 상위 5개 프로필(식별된 프로필 포함)의 데이터를 포함하는 개체입니다.

IdentifyInfo

식별된 화자 정보

Name	형식	Description
profileId	string	프로필의 식별 ID입니다. 적합한 화자로 식별된 후보가 없으면 값이 빈 GUID로 설정됩니다.
score	number	입력 오디오와 대상 음성 인쇄 간의 유사성을 나타내는 float 숫자입니다. 이 숫자는 0에서 1 사이여야 합니다. 숫자가 높을수록 유사성이 높아질 수 있습니다.

SpeakerErrorInfo

화자 오류 메시지

Name	형식	Description
error	Error

Text Independent - Identify Single Speaker

URI 매개 변수

요청 헤더

요청 본문

응답

보안

Ocp-Apim-Subscription-Key

예제

Successful Query

Sample Request

Sample Response

정의

Error

IdentifiedSingleSpeakerInfo

IdentifyInfo

SpeakerErrorInfo

추가 리소스