Text Independent - Identify Single Speaker
Identifikace profilu jednoho mluvčího
Identifikuje, kdo mluví ve vstupním zvuku mezi seznamem kandidátských profilů.
Omezení:
Minimální délka zvukového vstupu je 1 sekunda
Maximální délka zvukového vstupu je 120 sekund
Minimální počet kandidátských mluvčích je 1
Maximální počet kandidátských mluvčích je 50
Minimální efektivní délka řeči (s výjimkou ticha a jiných neslovných snímků) je 4 sekundy Toto omezení může být zakázáno nastavením ignorovatMinLength na true.
Minimální poměr zvuku signálu k šumu (SNR) je 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
Parametry identifikátoru URI
| Name | V | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com). |
|
api-version
|
query | True |
string |
Určuje verzi operace, která se má pro tento požadavek použít. |
|
profile
|
query | True |
string[] |
ID profilů oddělených čárkami. Maximální podporované číslo je 50 ID. |
|
ignore
|
query |
boolean |
Pokud je pravda, minimální množství řeči potřebné k identifikaci se přeskočí. Výchozí hodnota je false. |
Hlavička požadavku
Media Types: "audio/wav; codecs=audio/pcm"
| Name | Vyžadováno | Typ | Description |
|---|---|---|---|
| Ocp-Apim-Subscription-Key | True |
string |
Text požadavku
Media Types: "audio/wav; codecs=audio/pcm"
| Name | Typ | Description |
|---|---|---|
| audioData |
object (file) |
Binární zvukový soubor. Podporované formáty jsou audio/wav; kodeky=audio/pcm. Podporuje zvuk až 5 MB. |
Odpovědi
| Name | Typ | Description |
|---|---|---|
| 200 OK |
OK |
|
| Other Status Codes |
Selhání Hlavičky x-ms-error-code: string |
Zabezpečení
Ocp-Apim-Subscription-Key
Typ:
apiKey
V:
header
Příklady
Successful Query
Ukázkový požadavek
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Ukázková odpověď
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definice
| Name | Description |
|---|---|
| Error | |
|
Identified |
|
|
Identify |
Informace o identifikovaném mluvčím |
|
Speaker |
Chybová zpráva mluvčího |
Error
| Name | Typ | Description |
|---|---|---|
| code |
string |
|
| message |
string |
IdentifiedSingleSpeakerInfo
| Name | Typ | Description |
|---|---|---|
| identifiedProfile |
Objekt obsahující data identifikovaného profilu |
|
| profilesRanking |
Objekt obsahující data prvních 5 profilů (včetně identifikovaných profilů) seřazených sestupně podle skóre |
IdentifyInfo
Informace o identifikovaném mluvčím
| Name | Typ | Description |
|---|---|---|
| profileId |
string (uuid) |
ID identifikovaného profilu. Pokud není žádný kandidát identifikován jako správný mluvčí, hodnota je nastavena na prázdný identifikátor GUID. |
| score |
number |
Číslo float označující podobnost mezi vstupním zvukem a cílovým hlasovým tiskem. Toto číslo musí být v rozmezí od 0 do 1. Vyšší číslo znamená vyšší podobnost. |
SpeakerErrorInfo
Chybová zpráva mluvčího
| Name | Typ | Description |
|---|---|---|
| error |