Text Independent - Identify Single Speaker

Ссылка

Service:: Speaker Recognition

API Version:: 2021-09-05

Определение профиля одного докладчика
Определяет говорящего во входном аудиофайле из списка профилей кандидатов

Ограничения

Минимальная длина входных аудиоданных составляет 1 секунда
Максимальная длина входных аудиоданных составляет 120 секунд.
Минимальное число кандидатов ораторов — 1
Максимальное число кандидатов ораторов — 50
Минимальная эффективная длина речи (за исключением тишины и других кадров, не являющихся речевыми) составляет 4 секунды . Это ограничение можно отключить, задав для параметра ignoreMinLength значение true.
Минимальное соотношение сигналов и шума звука (SNR) составляет 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}

With optional parameters:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Параметры URI

Имя	В	Обязательно	Тип	Описание
endpoint	path	True	string	Поддерживаемые конечные точки Cognitive Services (протокол и имя узла, например : https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	Задает версию операции, используемой для этого запроса.
profileIds	query	True	string[]	Идентификаторы профилей с разделителями-запятыми. Максимальное поддерживаеме число — 50 идентификаторов.
ignoreMinLength	query		boolean	Если значение равно true, минимальный объем речи, необходимый для идентификации, пропускается. Значение по умолчанию — false.

Заголовок запроса

Media Types: "audio/wav; codecs=audio/pcm"

Имя	Обязательно	Тип	Описание
Ocp-Apim-Subscription-Key	True	string

Текст запроса

Media Types: "audio/wav; codecs=audio/pcm"

Имя	Тип	Описание
audioData	object	Двоичный звуковой файл. Поддерживаемые форматы: аудио/wav; codecs=audio/pcm. Поддерживает звук до 5 МБ.

Ответы

Имя	Тип	Описание
200 OK	IdentifiedSingleSpeakerInfo	ОК
Other Status Codes	SpeakerErrorInfo	Failure Headers x-ms-error-code: string

Имя

Тип

Описание

200 OK

IdentifiedSingleSpeakerInfo

ОК

Other Status Codes

SpeakerErrorInfo

Failure

Headers

x-ms-error-code: string

Безопасность

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Примеры

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Status code:: 200

Content-Type: application/json

Response Body

{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Определения

Имя	Описание
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo	Идентифицированные сведения о говорящем
SpeakerErrorInfo	Сообщение об ошибке говорящего

Error

Имя	Тип	Описание
code	string
message	string

IdentifiedSingleSpeakerInfo

Имя	Тип	Описание
identifiedProfile	IdentifyInfo	Объект , содержащий данные идентифицированного профиля.
profilesRanking	IdentifyInfo[]	Объект, содержащий данные пяти основных профилей (включая идентифицированный профиль), отсортированные по убыванию по оценке.

IdentifyInfo

Идентифицированные сведения о говорящем

Имя	Тип	Описание
profileId	string	Идентификатор идентифицируемых профилей. Если ни один из кандидатов не идентифицируется в качестве правильного говорящего, устанавливается значение пустого GUID.
score	number	Число с плавающей точкой, указывающее на сходство между входным звуком и целевой голосовой печатью. Это число должно находиться в диапазоне от 0 до 1. Большее число означает большее сходство.

SpeakerErrorInfo

Сообщение об ошибке говорящего

Имя	Тип	Описание
error	Error

Text Independent - Identify Single Speaker

Параметры URI

Заголовок запроса

Текст запроса

Ответы

Безопасность

Ocp-Apim-Subscription-Key

Примеры

Successful Query

Sample Request

Sample Response

Определения

Error

IdentifiedSingleSpeakerInfo

IdentifyInfo

SpeakerErrorInfo

Дополнительные ресурсы