Text Independent - Create Enrollment
Profili Kaydet
Mevcut profile kayıt ekler.
İlk kayıt, /phrases/{locale} api'sini kullanarak listelenebilen önceden tanımlanmış bir etkinleştirme tümceciği olmalıdır.
İstenen kayıt seslerinin en az sayısına ulaşılırsa, bir ses izi oluşturulur.
Daha fazla kayıt, ses baskısını geliştirmek için kullanılır.
Sınırlamalar:
İstek başına en düşük ses girişi uzunluğu 1 saniyedir
İstek başına maksimum ses girişi uzunluğu 120 saniyedir
Ses izi oluşturmak için en az etkili konuşma uzunluğu (sessizlik ve diğer konuşma dışı kareler hariç) 20 saniyedir Bu sınırlama, "ignoreMinLength" değeri true olarak ayarlanarak devre dışı bırakılabilir.
Ses izi oluşturmak için izin verilen maksimum ses girişi uzunluğu 300 saniyedir
Minimum ses Sinyal-gürültü oranı (SNR) 2dB'dir
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI Parametreleri
Name | İçinde | Gerekli | Tür | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Desteklenen Bilişsel Hizmetler uç noktaları (protokol ve konak adı, örneğin: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Profil kimliği (guid) için benzersiz tanımlayıcı. |
api-version
|
query | True |
string |
Bu istek için kullanılacak işlemin sürümünü belirtir. |
ignore
|
query |
boolean |
Doğruysa, ne kadar konuşma sağlandığından veya depolandığından bağımsız olarak bu profil için hemen bir ses izi oluşturulur. Varsayılan değer false’tur. |
İstek Başlığı
Media Types: "audio/wav; codecs=audio/pcm"
Name | Gerekli | Tür | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
İstek Gövdesi
Media Types: "audio/wav; codecs=audio/pcm"
Name | Tür | Description |
---|---|---|
audioData |
object |
İkili ses dosyası. Desteklenen biçimler ses/wav; codecs=audio/pcm. 5 MB'a kadar sesi destekler. |
Yanıtlar
Name | Tür | Description |
---|---|---|
201 Created |
Oluşturulan |
|
Other Status Codes |
Hata Üst Bilgiler x-ms-error-code: string |
Güvenlik
Ocp-Apim-Subscription-Key
Tür:
apiKey
İçinde:
header
Örnekler
Successful Query
Örnek isteği
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Örnek yanıt
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Tanımlar
Name | Description |
---|---|
Error | |
Speaker |
Konuşmacı hata iletisi |
Ti |
konuşmacı profili kayıt bilgilerini Text-Independent |
Training |
Profilin geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:
|
Error
Name | Tür | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Konuşmacı hata iletisi
Name | Tür | Description |
---|---|---|
error |
TiEnrollmentInfo
konuşmacı profili kayıt bilgilerini Text-Independent
Name | Tür | Description |
---|---|---|
audioLengthInSec |
number |
Bu kayıt sesinin saniye cinsinden uzunluğu. |
audioSpeechLengthInSec |
number |
Bu kayıt sesi saf konuşma (sessizlik ve konuşma dışı kesimler kaldırıldıktan sonra ses miktarıdır) saniye cinsinden uzunluk. |
enrollmentStatus |
Profilin geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:
|
|
enrollmentsCount |
integer |
Bu profil için kabul edilen kayıt seslerinin sayısı. |
enrollmentsLengthInSec |
number |
Bu profil için kabul edilen kayıt seslerinin saniye cinsinden toplam uzunluğu. |
enrollmentsSpeechLengthInSec |
number |
Saniyeler içinde tüm profil kayıtlarında saf konuşmanın (sessizliği ve konuşma dışı kesimleri kaldırdıktan sonraki ses miktarıdır) toplamı. |
profileId |
string |
Profil kimliği (guid) için benzersiz tanımlayıcı. |
remainingEnrollmentsSpeechLengthInSec |
number |
Profil kaydını saniyeler içinde tamamlamak için gereken saf konuşma miktarı (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır). |
TrainingStatusType
Profilin geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:
- Kaydediliyor: profilde ses izi yok ve tanıma istekleri için hazır değil.
- Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
- Kayıtlı: profilin ses baskısı vardır ve tanıma istekleri için hazırdır.
Name | Tür | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |