Bagikan melalui


Text Independent - Identify Single Speaker

Identifikasi Profil Pembicara Tunggal
Mengidentifikasi siapa yang berbicara dalam audio input di antara daftar profil kandidat.

Keterbatasan:

  • Panjang input audio minimum 1 detik

  • Panjang input audio maksimum 120 detik

  • Jumlah pembicara kandidat minimum 1

  • Jumlah pembicara kandidat maksimum 50

  • Panjang ucapan efektif minimum (tidak termasuk keheningan dan bingkai non-ucapan lainnya) 4 detik Batasan ini dapat dinonaktifkan dengan mengatur "ignoreMinLength" ke true.

  • Rasio Sinyal ke kebisingan (SNR) audio minimum 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parameter URI

Nama Dalam Diperlukan Jenis Deskripsi
endpoint
path True

string

Titik akhir Cognitive Services yang didukung (protokol dan nama host, misalnya: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Menentukan versi operasi yang akan digunakan untuk permintaan ini.

profileIds
query True

string[]

ID profil yang dibatasi koma. Jumlah maksimum yang didukung adalah 50 ID.

ignoreMinLength
query

boolean

Jika true, jumlah minimum ucapan yang diperlukan untuk identifikasi dilewati. Defaultnya adalah false.

Header Permintaan

Media Types: "audio/wav; codecs=audio/pcm"

Nama Diperlukan Jenis Deskripsi
Ocp-Apim-Subscription-Key True

string

Isi Permintaan

Media Types: "audio/wav; codecs=audio/pcm"

Nama Jenis Deskripsi
audioData

object (file)

File audio biner. Format yang didukung adalah audio/wav; codecs=audio/pcm. Mendukung audio hingga 5MB.

Respons

Nama Jenis Deskripsi
200 OK

IdentifiedSingleSpeakerInfo

OKE

Other Status Codes

SpeakerErrorInfo

Kegagalan

Header

x-ms-error-code: string

Keamanan

Ocp-Apim-Subscription-Key

Jenis: apiKey
Dalam: header

Contoh

Successful Query

Permintaan sampel

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Respon sampel

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definisi

Nama Deskripsi
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Info pembicara yang diidentifikasi

SpeakerErrorInfo

Pesan kesalahan pembicara

Error

Nama Jenis Deskripsi
code

string

message

string

IdentifiedSingleSpeakerInfo

Nama Jenis Deskripsi
identifiedProfile

IdentifyInfo

Objek yang berisi data profil yang diidentifikasi.

profilesRanking

IdentifyInfo[]

Objek yang berisi data dari 5 profil teratas (termasuk profil yang diidentifikasi) diurutkan dalam urutan menurun menurut skor.

IdentifyInfo

Info pembicara yang diidentifikasi

Nama Jenis Deskripsi
profileId

string (uuid)

ID profil yang diidentifikasi. Jika tidak ada kandidat yang diidentifikasi sebagai pembicara yang tepat, nilai diatur ke GUID kosong.

score

number

Angka float yang menunjukkan kesamaan antara audio input dan cetak suara yang ditargetkan. Angka ini harus antara 0 dan 1. Angka yang lebih tinggi berarti kesamaan yang lebih tinggi.

SpeakerErrorInfo

Pesan kesalahan pembicara

Nama Jenis Deskripsi
error

Error