Text Independent - Identify Single Speaker
Определение профиля одного докладчика
Определяет говорящего во входном аудиофайле из списка профилей кандидатов
Ограничения
Минимальная длина входных аудиоданных составляет 1 секунда
Максимальная длина входных аудиоданных составляет 120 секунд.
Минимальное число кандидатов ораторов — 1
Максимальное число кандидатов ораторов — 50
Минимальная эффективная длина речи (за исключением тишины и других кадров, не являющихся речевыми) составляет 4 секунды . Это ограничение можно отключить, задав для параметра ignoreMinLength значение true.
Минимальное соотношение сигналов и шума звука (SNR) составляет 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
Параметры URI
Имя | В | Обязательно | Тип | Описание |
---|---|---|---|---|
endpoint
|
path | True |
string |
Поддерживаемые конечные точки Cognitive Services (протокол и имя узла, например : https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
Задает версию операции, используемой для этого запроса. |
profile
|
query | True |
string[] |
Идентификаторы профилей с разделителями-запятыми. Максимальное поддерживаеме число — 50 идентификаторов. |
ignore
|
query |
boolean |
Если значение равно true, минимальный объем речи, необходимый для идентификации, пропускается. Значение по умолчанию — false. |
Заголовок запроса
Media Types: "audio/wav; codecs=audio/pcm"
Имя | Обязательно | Тип | Описание |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Текст запроса
Media Types: "audio/wav; codecs=audio/pcm"
Имя | Тип | Описание |
---|---|---|
audioData |
object |
Двоичный звуковой файл. Поддерживаемые форматы: аудио/wav; codecs=audio/pcm. Поддерживает звук до 5 МБ. |
Ответы
Имя | Тип | Описание |
---|---|---|
200 OK |
ОК |
|
Other Status Codes |
Failure Headers x-ms-error-code: string |
Безопасность
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Примеры
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Sample Response
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Определения
Имя | Описание |
---|---|
Error | |
Identified |
|
Identify |
Идентифицированные сведения о говорящем |
Speaker |
Сообщение об ошибке говорящего |
Error
Имя | Тип | Описание |
---|---|---|
code |
string |
|
message |
string |
IdentifiedSingleSpeakerInfo
Имя | Тип | Описание |
---|---|---|
identifiedProfile |
Объект , содержащий данные идентифицированного профиля. |
|
profilesRanking |
Объект, содержащий данные пяти основных профилей (включая идентифицированный профиль), отсортированные по убыванию по оценке. |
IdentifyInfo
Идентифицированные сведения о говорящем
Имя | Тип | Описание |
---|---|---|
profileId |
string |
Идентификатор идентифицируемых профилей. Если ни один из кандидатов не идентифицируется в качестве правильного говорящего, устанавливается значение пустого GUID. |
score |
number |
Число с плавающей точкой, указывающее на сходство между входным звуком и целевой голосовой печатью. Это число должно находиться в диапазоне от 0 до 1. Большее число означает большее сходство. |
SpeakerErrorInfo
Сообщение об ошибке говорящего
Имя | Тип | Описание |
---|---|---|
error |