Aracılığıyla paylaş


Text Independent - Create Enrollment

Profili Kaydet
Mevcut profile kayıt ekler. İlk kayıt, /phrases/{locale} api'sini kullanarak listelenebilen önceden tanımlanmış bir etkinleştirme tümceciği olmalıdır. İstenen kayıt seslerinin en az sayısına ulaşılırsa, bir ses izi oluşturulur. Daha fazla kayıt, ses baskısını geliştirmek için kullanılır.

Sınırlamalar:

  • İstek başına en düşük ses girişi uzunluğu 1 saniyedir

  • İstek başına maksimum ses girişi uzunluğu 120 saniyedir

  • Ses izi oluşturmak için en az etkili konuşma uzunluğu (sessizlik ve diğer konuşma dışı kareler hariç) 20 saniyedir Bu sınırlama, "ignoreMinLength" değeri true olarak ayarlanarak devre dışı bırakılabilir.

  • Ses izi oluşturmak için izin verilen maksimum ses girişi uzunluğu 300 saniyedir

  • Minimum ses Sinyal-gürültü oranı (SNR) 2dB'dir

POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI Parametreleri

Name İçinde Gerekli Tür Description
endpoint
path True

string

Desteklenen Bilişsel Hizmetler uç noktaları (protokol ve konak adı, örneğin: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Profil kimliği (guid) için benzersiz tanımlayıcı.

api-version
query True

string

Bu istek için kullanılacak işlemin sürümünü belirtir.

ignoreMinLength
query

boolean

Doğruysa, ne kadar konuşma sağlandığından veya depolandığından bağımsız olarak bu profil için hemen bir ses izi oluşturulur. Varsayılan değer false’tur.

İstek Başlığı

Media Types: "audio/wav; codecs=audio/pcm"

Name Gerekli Tür Description
Ocp-Apim-Subscription-Key True

string

İstek Gövdesi

Media Types: "audio/wav; codecs=audio/pcm"

Name Tür Description
audioData

object

İkili ses dosyası. Desteklenen biçimler ses/wav; codecs=audio/pcm. 5 MB'a kadar sesi destekler.

Yanıtlar

Name Tür Description
201 Created

TiEnrollmentInfo

Oluşturulan

Other Status Codes

SpeakerErrorInfo

Hata

Üst Bilgiler

x-ms-error-code: string

Güvenlik

Ocp-Apim-Subscription-Key

Tür: apiKey
İçinde: header

Örnekler

Successful Query

Örnek isteği

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Örnek yanıt

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Tanımlar

Name Description
Error
SpeakerErrorInfo

Konuşmacı hata iletisi

TiEnrollmentInfo

konuşmacı profili kayıt bilgilerini Text-Independent

TrainingStatusType

Profilin geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:

  • Kaydediliyor: profilde ses izi yok ve tanıma istekleri için hazır değil.
  • Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
  • Kayıtlı: profilin ses baskısı vardır ve tanıma istekleri için hazırdır.

Error

Name Tür Description
code

string

message

string

SpeakerErrorInfo

Konuşmacı hata iletisi

Name Tür Description
error

Error

TiEnrollmentInfo

konuşmacı profili kayıt bilgilerini Text-Independent

Name Tür Description
audioLengthInSec

number

Bu kayıt sesinin saniye cinsinden uzunluğu.

audioSpeechLengthInSec

number

Bu kayıt sesi saf konuşma (sessizlik ve konuşma dışı kesimler kaldırıldıktan sonra ses miktarıdır) saniye cinsinden uzunluk.

enrollmentStatus

TrainingStatusType

Profilin geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:

  • Kaydediliyor: profilde ses izi yok ve tanıma istekleri için hazır değil.
  • Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
  • Kayıtlı: profilin ses baskısı vardır ve tanıma istekleri için hazırdır.
enrollmentsCount

integer

Bu profil için kabul edilen kayıt seslerinin sayısı.

enrollmentsLengthInSec

number

Bu profil için kabul edilen kayıt seslerinin saniye cinsinden toplam uzunluğu.

enrollmentsSpeechLengthInSec

number

Saniyeler içinde tüm profil kayıtlarında saf konuşmanın (sessizliği ve konuşma dışı kesimleri kaldırdıktan sonraki ses miktarıdır) toplamı.

profileId

string

Profil kimliği (guid) için benzersiz tanımlayıcı.

remainingEnrollmentsSpeechLengthInSec

number

Profil kaydını saniyeler içinde tamamlamak için gereken saf konuşma miktarı (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır).

TrainingStatusType

Profilin geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:

  • Kaydediliyor: profilde ses izi yok ve tanıma istekleri için hazır değil.
  • Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
  • Kayıtlı: profilin ses baskısı vardır ve tanıma istekleri için hazırdır.
Name Tür Description
Enrolled

string

Enrolling

string

Training

string