Text Independent - Create Enrollment
Profili Kaydet
Var olan profile kayıt ekler.
İlk kayıt, /phrases/{locale} api'sini kullanarak listelenebilen önceden tanımlanmış bir etkinleştirme tümceciği olmalıdır.
İstenen kayıt seslerinin en az sayısına ulaşılırsa, bir ses izi oluşturulur.
Daha fazla kayıt, ses baskısını geliştirmek için kullanılır.
Sınırlamalar:
İstek başına en düşük ses girişi uzunluğu 1 saniyedir
İstek başına maksimum ses girişi uzunluğu 120 saniyedir
Ses izi oluşturmak için en düşük toplam etkili konuşma uzunluğu (sessizlik ve diğer konuşma olmayan çerçeveler hariç) 20 saniyedir Bu sınırlama ignoreMinLength değeri true olarak ayarlanarak devre dışı bırakılabilir.
Ses izi oluşturmak için izin verilen maksimum ses girişi uzunluğu 300 saniyedir
Minimum ses Sinyal-gürültü oranı (SNR) 2dB'dir
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI Parametreleri
Name | İçinde | Gerekli | Tür | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Desteklenen Bilişsel Hizmetler uç noktaları (protokol ve ana bilgisayar adı, örneğin: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Profil kimliği (GUID) için benzersiz tanımlayıcı. |
api-version
|
query | True |
string |
Bu istek için kullanılacak işlemin sürümünü belirtir. |
ignore
|
query |
boolean |
Doğruysa, ne kadar konuşma sağlandığından veya depolandığından bağımsız olarak bu profil için hemen bir ses baskısı oluşturulur. Varsayılan değer false’tur. |
İstek Başlığı
Media Types: "audio/wav; codecs=audio/pcm"
Name | Gerekli | Tür | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
İstek Gövdesi
Media Types: "audio/wav; codecs=audio/pcm"
Name | Tür | Description |
---|---|---|
audioData |
object |
İkili ses dosyası. Desteklenen biçimler ses/wav; codecs=audio/pcm. 5 MB'a kadar sesi destekler. |
Yanıtlar
Name | Tür | Description |
---|---|---|
201 Created |
Oluşturulan |
|
Other Status Codes |
Hata Üst Bilgiler x-ms-error-code: string |
Güvenlik
Ocp-Apim-Subscription-Key
Tür:
apiKey
İçinde:
header
Örnekler
Successful Query
Örnek isteği
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Örnek yanıt
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Tanımlar
Name | Description |
---|---|
Error | |
Speaker |
Konuşmacı hata iletisi |
Ti |
Konuşmacı profili kayıt bilgileri |
Training |
Profil kaydının geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:
|
Error
Name | Tür | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Konuşmacı hata iletisi
Name | Tür | Description |
---|---|---|
error |
TiEnrollmentInfo
Konuşmacı profili kayıt bilgileri
Name | Tür | Description |
---|---|---|
audioLengthInSec |
number |
Bu kayıt ses uzunluğu (saniye cinsinden). |
audioSpeechLengthInSec |
number |
Bu kayıt sesi saf konuşma (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır) saniye cinsinden uzunluk. |
enrollmentStatus |
Profil kaydının geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:
|
|
enrollmentsCount |
integer |
Bu profil için kabul edilen kayıt seslerinin sayısı. |
enrollmentsLengthInSec |
number |
Bu profil için kabul edilen kayıt seslerinin toplam uzunluğu (saniye cinsinden). |
enrollmentsSpeechLengthInSec |
number |
Saniyeler içinde tüm profil kayıtlarında saf konuşmanın (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır) toplamı. |
profileId |
string |
Profil kimliği (GUID) için benzersiz tanımlayıcı. |
remainingEnrollmentsSpeechLengthInSec |
number |
Profil kaydını saniyeler içinde tamamlamak için gereken saf konuşma miktarı (sessizliği ve konuşma dışı segmentleri kaldırdıktan sonra ses miktarıdır). |
TrainingStatusType
Profil kaydının geçerli durumunu temsil eden durum. Kullanılabilir değerler şunlardır:
- Kaydediliyor: Profilde ses izi yok ve tanıma istekleri için hazır değil.
- Eğitim: Profilin sesli baskısı oluşturuluyor ve şu anda tanıma için kullanılamıyor.
- Kayıtlı: Profilin ses baskısı var ve tanıma istekleri için hazır.
Name | Tür | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |