Text Independent - Identify Single Speaker

단일 스피커 프로필 식별
후보 프로필 목록 중에서 입력 오디오로 말하는 사용자를 식별합니다.

제한 사항:

  • 최소 오디오 입력 길이는 1초입니다.

  • 최대 오디오 입력 길이는 120초입니다.

  • 최소 후보 화자 수는 1입니다.

  • 최대 후보 화자 수는 50개입니다.

  • 최소 유효 음성 길이(무음 및 기타 비 음성 프레임 제외)는 4초 입니다. "ignoreMinLength"를 true로 설정하여 이 제한을 사용하지 않도록 설정할 수 있습니다.

  • 최소 오디오 SNR(신호 대 노이즈 비율)은 2dB입니다.

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
endpoint
path True

string

지원되는 Cognitive Services 엔드포인트(프로토콜 및 호스트 이름( 예: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

이 요청에 사용할 작업의 버전을 지정합니다.

profileIds
query True

string[]

쉼표로 구분된 프로필 ID입니다. 지원되는 최대 수는 50개의 ID입니다.

ignoreMinLength
query

boolean

true이면 식별에 필요한 최소 음성 양을 건너뜁습니다. 기본값은 false입니다.

요청 헤더

Media Types: "audio/wav; codecs=audio/pcm"

Name 필수 형식 Description
Ocp-Apim-Subscription-Key True

string

요청 본문

Media Types: "audio/wav; codecs=audio/pcm"

Name 형식 Description
audioData

object

이진 오디오 파일. 지원되는 형식은 오디오/웨이브입니다. codecs=audio/pcm. 최대 5MB의 오디오를 지원합니다.

응답

Name 형식 Description
200 OK

IdentifiedSingleSpeakerInfo

정상

Other Status Codes

SpeakerErrorInfo

실패

Headers

x-ms-error-code: string

보안

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

예제

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

정의

Name Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

식별된 화자 정보

SpeakerErrorInfo

화자 오류 메시지

Error

Name 형식 Description
code

string

message

string

IdentifiedSingleSpeakerInfo

Name 형식 Description
identifiedProfile

IdentifyInfo

식별된 프로필의 데이터를 포함하는 개체입니다.

profilesRanking

IdentifyInfo[]

점수별로 내림차순으로 정렬된 상위 5개 프로필(식별된 프로필 포함)의 데이터를 포함하는 개체입니다.

IdentifyInfo

식별된 화자 정보

Name 형식 Description
profileId

string

프로필의 식별 ID입니다. 적합한 화자로 식별된 후보가 없으면 값이 빈 GUID로 설정됩니다.

score

number

입력 오디오와 대상 음성 인쇄 간의 유사성을 나타내는 float 숫자입니다. 이 숫자는 0에서 1 사이여야 합니다. 숫자가 높을수록 유사성이 높아질 수 있습니다.

SpeakerErrorInfo

화자 오류 메시지

Name 형식 Description
error

Error