Kodu v3.0'dan REST API'nin v3.1'ine geçirme
Konuşmayı metne dönüştürme REST API'si Batch transkripsiyonu ve özel konuşma için kullanılır. Sürüm 3.0'dan 3.1'e yapılan değişiklikler aşağıdaki bölümlerde açıklanmıştır.
Önemli
Konuşmayı metne dönüştürme REST API v3.2 önizleme sürümünde kullanılabilir. Konuşmayı metne dönüştürme REST API v3.1 genel olarak kullanılabilir. Konuşmayı metne dönüştürme REST API v3.0, 1 Nisan 2026'da kullanımdan kaldırılacaktır. Daha fazla bilgi için bkz. Konuşmayı metne dönüştürme REST API v3.0 -v3.1 ve v3.1 to v3.2 geçiş kılavuzları.
Temel yol
Kodunuzdaki temel yolu olarak /speechtotext/v3.0
/speechtotext/v3.1
güncelleştirmeniz gerekir. Örneğin, bölgedeki temel modelleri eastus
almak için yerine https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base
kullanınhttps://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
.
Diğer değişikliklere dikkat edin:
/models/{id}/copyto
Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile/models/{id}:copyto
değiştirilir./webhooks/{id}/ping
Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile/webhooks/{id}:ping
değiştirilir./webhooks/{id}/test
Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile/webhooks/{id}:test
değiştirilir.
Daha fazla bilgi için bu kılavuzun devamında yer alan İşlem Kimlikleri bölümüne bakın.
Toplu transkripsiyon
Not
Konuşmayı metne dönüştürme REST API v3.1 aracılığıyla oluşturulan transkripsiyonu almak için REST API v3.0 metni için Konuşma kullanmayın. Aşağıdaki gibi bir hata iletisi görürsünüz: "API sürümü bu döküme erişmek için kullanılamaz. Lütfen API sürümü v3.1 veya üzerini kullanın."
Transcriptions_Create işlemine aşağıdaki üç özellik eklenir:
- özelliği,
displayFormWordLevelTimestampsEnabled
transkripsiyon sonuçlarının görüntü biçiminde sözcük düzeyi zaman damgalarının bildirilmesini etkinleştirmek için kullanılabilir. Sonuçlar transkripsiyon dosyasının özelliğinde döndürülürdisplayWords
. - özelliği,
diarization
isteğe bağlı diarizasyon (konuşmacı ayrımı) gerçekleştirirken oluşturulacak en düşük ve en fazla konuşmacı etiketi sayısı için ipuçları belirtmek için kullanılabilir. Bu özellik sayesinde hizmet artık ikiden fazla hoparlör için konuşmacı etiketleri oluşturabilir. Bu özelliği kullanmak için özelliğinitrue
olarak da ayarlamanızdiarizationEnabled
gerekir. v3.1 API'siyle, v3.0 API'sinin desteklediği iki hoparlörden dilarizasyon yoluyla tanımlanabilen hoparlör sayısını artırdık. Daha iyi performans için hoparlör sayısını 30'un altında tutmanız önerilir. languageIdentification
özelliği, transkripsiyondan önce girişte dil belirleme ayarlarını belirtmek için kullanılabilir. Dil belirleme için en fazla 10 aday yerel ayar desteklenir. Döndürülen transkripsiyon, tanınan dil veya sağladığınız yerel ayar için yenilocale
bir özellik içerir.
filter
özelliği Transcriptions_List, Transcriptions_ListFiles ve Projects_ListTranscriptions işlemlerine eklenir. İfade filter
, kullanılabilir kaynakların bir alt kümesini seçmek için kullanılabilir. , , , createdDateTime
description
, lastActionDateTime
, status
ve locale
öğesine göre displayName
filtreleyebilirsiniz. Örneğin: filter=createdDateTime gt 2022-02-01T11:00:00Z
Transkripsiyon durumu hakkında bildirim almak için web kancası kullanıyorsanız, V3.0 API aracılığıyla oluşturulan web kancalarının V3.1 transkripsiyon istekleri için bildirim alamayacağına dikkat edin. V3.1 transkripsiyon isteklerine yönelik bildirimler almak için V3.1 API aracılığıyla yeni bir web kancası uç noktası oluşturmanız gerekir.
Özel konuşma
Veri Kümeleri
Bir veri kümesi için birden çok veri bloğunun karşıya yüklenmesi ve yönetilmesi için aşağıdaki işlemler eklenir:
- Datasets_UploadBlock - Veri kümesi için bir veri bloğu yükleyin. Bloğun en büyük boyutu 8MiB'dir.
- Datasets_GetBlocks - Bu veri kümesi için karşıya yüklenen blokların listesini alın.
- Datasets_CommitBlocks - Veri kümesinin karşıya yüklenmesini tamamlamak için blok listesini işleyin.
Markdown verilerinde yapılandırılmış metinle model uyarlamasını desteklemek için, Datasets_Create işlemi artık LanguageMarkdown veri türünü destekliyor. Daha fazla bilgi için bkz . Veri kümelerini karşıya yükleme.
Modeller
Models_ListBaseModels ve Models_GetBaseModel işlemleri, her bir temel model tarafından desteklenen uyarlama türü hakkında bilgi döndürür.
"features": {
"supportsAdaptationsWith": [
"Acoustic",
"Language",
"LanguageMarkdown",
"Pronunciation"
]
}
Models_Create işlemi, Özel Dil Modeli (düz veya yapılandırılmış metin verilerinden eğitilir) Temel Dil Modeli ile birleştirildiğinde kullanılan ağırlığı belirtebileceğiniz yeni customModelWeightPercent
bir özelliğe sahiptir. Geçerli değerler 1 ile 100 arasındaki tamsayılardır. Varsayılan değer şu anda 30'dur.
filter
özelliği aşağıdaki işlemlere eklenir:
- Datasets_List
- Datasets_ListFiles
- Endpoints_List
- Evaluations_List
- Evaluations_ListFiles
- Models_ListBaseModels
- Models_ListCustomModels
- Projects_List
- Projects_ListDatasets
- Projects_ListEndpoints
- Projects_ListEvaluations
- Projects_ListModels
İfade filter
, kullanılabilir kaynakların bir alt kümesini seçmek için kullanılabilir. , , description
, , createdDateTime
, lastActionDateTime
, locale
status
ve kind
ile displayName
filtreleyebilirsiniz. Örneğin: filter=locale eq 'en-US'
Verilen kimlik tarafından tanımlanan modelin dosyalarını almak için Models_ListFiles işlemi eklendi.
Modelden (kimlikle tanımlanır) belirli bir dosya (fileId ile tanımlanır) almak için Models_GetFile işlemi eklendi. Bu, eğitim sırasında işlenen veriler hakkında bilgi sağlayan bir ModelReport dosyası almanıza olanak tanır.
İşlem Kimlikleri
Kodunuzdaki temel yolu olarak /speechtotext/v3.0
/speechtotext/v3.1
güncelleştirmeniz gerekir. Örneğin, bölgedeki temel modelleri eastus
almak için yerine https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base
kullanınhttps://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
.
Sürüm 3.1'deki her operationId
birinin adı nesne adıyla ön eklenmiştir. Örneğin, operationId
"Model Oluştur" ifadesi sürüm 3.0'daki CreateModel'den sürüm 3.1'de Models_Create olarak değiştirildi.
/models/{id}/copyto
Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /models/{id}:copyto
değiştirilir.
/webhooks/{id}/ping
Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /webhooks/{id}:ping
değiştirilir.
/webhooks/{id}/test
Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /webhooks/{id}:test
değiştirilir.