Text Independent - Create Enrollment

Profili Kaydet
Var olan profile kayıt ekler. İlk kayıt, /phrases/{locale} api'sini kullanarak listelenebilen önceden tanımlanmış bir etkinleştirme tümceciği olmalıdır. İstenen kayıt seslerinin en az sayısına ulaşılırsa, bir ses izi oluşturulur. Daha fazla kayıt, ses baskısını geliştirmek için kullanılır.

Sınırlamalar:

  • İstek başına en düşük ses girişi uzunluğu 1 saniyedir

  • İstek başına maksimum ses girişi uzunluğu 120 saniyedir

  • Ses izi oluşturmak için en düşük toplam etkili konuşma uzunluğu (sessizlik ve diğer konuşma olmayan çerçeveler hariç) 20 saniyedir Bu sınırlama ignoreMinLength değeri true olarak ayarlanarak devre dışı bırakılabilir.

  • Ses izi oluşturmak için izin verilen maksimum ses girişi uzunluğu 300 saniyedir

  • Minimum ses Sinyal-gürültü oranı (SNR) 2dB'dir

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI Parametreleri

Name İçinde Gerekli Tür Description
endpoint
path True

string

Desteklenen Bilişsel Hizmetler uç noktaları (protokol ve ana bilgisayar adı, örneğin: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Profil kimliği (GUID) için benzersiz tanımlayıcı.

api-version
query True

string

Bu istek için kullanılacak işlemin sürümünü belirtir.

ignoreMinLength
query

boolean

Doğruysa, ne kadar konuşma sağlandığından veya depolandığından bağımsız olarak bu profil için hemen bir ses baskısı oluşturulur. Varsayılan değer false’tur.

İstek Başlığı

Media Types: "audio/wav; codecs=audio/pcm"

Name Gerekli Tür Description
Ocp-Apim-Subscription-Key True

string

İstek Gövdesi

Media Types: "audio/wav; codecs=audio/pcm"

Name Tür Description
audioData

object

İkili ses dosyası. Desteklenen biçimler ses/wav; codecs=audio/pcm. 5 MB'a kadar sesi destekler.

Yanıtlar

Name Tür Description
201 Created

TiEnrollmentInfo

Oluşturulan

Other Status Codes

SpeakerErrorInfo

Hata

Headers

x-ms-error-code: string

Güvenlik

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Örnekler

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Tanımlar

Name Description
Error
SpeakerErrorInfo

Konuşmacı hata iletisi

TiEnrollmentInfo

Konuşmacı profili kayıt bilgileri

TrainingStatusType

Profil kaydının geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:

  • Kaydediliyor: Profilde ses izi yok ve tanıma istekleri için hazır değil.
  • Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
  • Kayıtlı: Profilin ses baskısı var ve tanıma istekleri için hazır.

Error

Name Tür Description
code

string

message

string

SpeakerErrorInfo

Konuşmacı hata iletisi

Name Tür Description
error

Error

TiEnrollmentInfo

Konuşmacı profili kayıt bilgileri

Name Tür Description
audioLengthInSec

number

Bu kayıt ses uzunluğu (saniye cinsinden).

audioSpeechLengthInSec

number

Bu kayıt sesi saf konuşma (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır) saniye cinsinden uzunluk.

enrollmentStatus

TrainingStatusType

Profil kaydının geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:

  • Kaydediliyor: Profilde ses izi yok ve tanıma istekleri için hazır değil.
  • Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
  • Kayıtlı: Profilin ses baskısı var ve tanıma istekleri için hazır.
enrollmentsCount

integer

Bu profil için kabul edilen kayıt seslerinin sayısı.

enrollmentsLengthInSec

number

Bu profil için kabul edilen kayıt seslerinin toplam uzunluğu (saniye cinsinden).

enrollmentsSpeechLengthInSec

number

Saniyeler içinde tüm profil kayıtlarında saf konuşmanın (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır) toplamı.

profileId

string

Profil kimliği (GUID) için benzersiz tanımlayıcı.

remainingEnrollmentsSpeechLengthInSec

number

Profil kaydını saniyeler içinde tamamlamak için gereken saf konuşma miktarı (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır).

TrainingStatusType

Profil kaydının geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:

  • Kaydediliyor: Profilde ses izi yok ve tanıma istekleri için hazır değil.
  • Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
  • Kayıtlı: Profilin ses baskısı var ve tanıma istekleri için hazır.
Name Tür Description
Enrolled

string

Enrolling

string

Training

string