Kodu v3.0'dan REST API'nin v3.1'ine geçirme

Konuşmayı metne dönüştürme REST API'si Batch transkripsiyonu ve özel konuşma için kullanılır. Sürüm 3.0'dan 3.1'e yapılan değişiklikler aşağıdaki bölümlerde açıklanmıştır.

Önemli

Konuşmayı metne dönüştürme REST API v3.2 önizleme sürümünde kullanılabilir. Konuşmayı metne dönüştürme REST API v3.1 genel olarak kullanılabilir. Konuşmayı metne dönüştürme REST API v3.0, 1 Nisan 2026'da kullanımdan kaldırılacaktır. Daha fazla bilgi için bkz. Konuşmayı metne dönüştürme REST API v3.0 -v3.1 ve v3.1 to v3.2 geçiş kılavuzları.

Temel yol

Kodunuzdaki temel yolu olarak /speechtotext/v3.0/speechtotext/v3.1güncelleştirmeniz gerekir. Örneğin, bölgedeki temel modelleri eastus almak için yerine https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/basekullanınhttps://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base.

Diğer değişikliklere dikkat edin:

  • /models/{id}/copyto Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /models/{id}:copyto değiştirilir.
  • /webhooks/{id}/ping Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /webhooks/{id}:ping değiştirilir.
  • /webhooks/{id}/test Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /webhooks/{id}:test değiştirilir.

Daha fazla bilgi için bu kılavuzun devamında yer alan İşlem Kimlikleri bölümüne bakın.

Toplu transkripsiyon

Not

Konuşmayı metne dönüştürme REST API v3.1 aracılığıyla oluşturulan transkripsiyonu almak için REST API v3.0 metni için Konuşma kullanmayın. Aşağıdaki gibi bir hata iletisi görürsünüz: "API sürümü bu döküme erişmek için kullanılamaz. Lütfen API sürümü v3.1 veya üzerini kullanın."

Transcriptions_Create işlemine aşağıdaki üç özellik eklenir:

  • özelliği, displayFormWordLevelTimestampsEnabled transkripsiyon sonuçlarının görüntü biçiminde sözcük düzeyi zaman damgalarının bildirilmesini etkinleştirmek için kullanılabilir. Sonuçlar transkripsiyon dosyasının özelliğinde döndürülür displayWords .
  • özelliği, diarization isteğe bağlı diarizasyon (konuşmacı ayrımı) gerçekleştirirken oluşturulacak en düşük ve en fazla konuşmacı etiketi sayısı için ipuçları belirtmek için kullanılabilir. Bu özellik sayesinde hizmet artık ikiden fazla hoparlör için konuşmacı etiketleri oluşturabilir. Bu özelliği kullanmak için özelliğini trueolarak da ayarlamanız diarizationEnabled gerekir. v3.1 API'siyle, v3.0 API'sinin desteklediği iki hoparlörden dilarizasyon yoluyla tanımlanabilen hoparlör sayısını artırdık. Daha iyi performans için hoparlör sayısını 30'un altında tutmanız önerilir.
  • languageIdentification özelliği, transkripsiyondan önce girişte dil belirleme ayarlarını belirtmek için kullanılabilir. Dil belirleme için en fazla 10 aday yerel ayar desteklenir. Döndürülen transkripsiyon, tanınan dil veya sağladığınız yerel ayar için yeni locale bir özellik içerir.

filter özelliği Transcriptions_List, Transcriptions_ListFiles ve Projects_ListTranscriptions işlemlerine eklenir. İfade filter , kullanılabilir kaynakların bir alt kümesini seçmek için kullanılabilir. , , , createdDateTimedescription, lastActionDateTime, statusve localeöğesine göre displayNamefiltreleyebilirsiniz. Örneğin: filter=createdDateTime gt 2022-02-01T11:00:00Z

Transkripsiyon durumu hakkında bildirim almak için web kancası kullanıyorsanız, V3.0 API aracılığıyla oluşturulan web kancalarının V3.1 transkripsiyon istekleri için bildirim alamayacağına dikkat edin. V3.1 transkripsiyon isteklerine yönelik bildirimler almak için V3.1 API aracılığıyla yeni bir web kancası uç noktası oluşturmanız gerekir.

Özel konuşma

Veri Kümeleri

Bir veri kümesi için birden çok veri bloğunun karşıya yüklenmesi ve yönetilmesi için aşağıdaki işlemler eklenir:

  • Datasets_UploadBlock - Veri kümesi için bir veri bloğu yükleyin. Bloğun en büyük boyutu 8MiB'dir.
  • Datasets_GetBlocks - Bu veri kümesi için karşıya yüklenen blokların listesini alın.
  • Datasets_CommitBlocks - Veri kümesinin karşıya yüklenmesini tamamlamak için blok listesini işleyin.

Markdown verilerinde yapılandırılmış metinle model uyarlamasını desteklemek için, Datasets_Create işlemi artık LanguageMarkdown veri türünü destekliyor. Daha fazla bilgi için bkz . Veri kümelerini karşıya yükleme.

Modeller

Models_ListBaseModels ve Models_GetBaseModel işlemleri, her bir temel model tarafından desteklenen uyarlama türü hakkında bilgi döndürür.

"features": {
    "supportsAdaptationsWith": [
        "Acoustic",
        "Language",
        "LanguageMarkdown",
        "Pronunciation"
    ]
}

Models_Create işlemi, Özel Dil Modeli (düz veya yapılandırılmış metin verilerinden eğitilir) Temel Dil Modeli ile birleştirildiğinde kullanılan ağırlığı belirtebileceğiniz yeni customModelWeightPercent bir özelliğe sahiptir. Geçerli değerler 1 ile 100 arasındaki tamsayılardır. Varsayılan değer şu anda 30'dur.

filter özelliği aşağıdaki işlemlere eklenir:

İfade filter , kullanılabilir kaynakların bir alt kümesini seçmek için kullanılabilir. , , description, , createdDateTime, lastActionDateTime, localestatusve kindile displayNamefiltreleyebilirsiniz. Örneğin: filter=locale eq 'en-US'

Verilen kimlik tarafından tanımlanan modelin dosyalarını almak için Models_ListFiles işlemi eklendi.

Modelden (kimlikle tanımlanır) belirli bir dosya (fileId ile tanımlanır) almak için Models_GetFile işlemi eklendi. Bu, eğitim sırasında işlenen veriler hakkında bilgi sağlayan bir ModelReport dosyası almanıza olanak tanır.

İşlem Kimlikleri

Kodunuzdaki temel yolu olarak /speechtotext/v3.0/speechtotext/v3.1güncelleştirmeniz gerekir. Örneğin, bölgedeki temel modelleri eastus almak için yerine https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/basekullanınhttps://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base.

Sürüm 3.1'deki her operationId birinin adı nesne adıyla ön eklenmiştir. Örneğin, operationId "Model Oluştur" ifadesi sürüm 3.0'daki CreateModel'den sürüm 3.1'de Models_Create olarak değiştirildi.

/models/{id}/copyto Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /models/{id}:copyto değiştirilir.

/webhooks/{id}/ping Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /webhooks/{id}:ping değiştirilir.

/webhooks/{id}/test Sürüm 3.0'daki işlem ('/' içerir) 3.1 sürümündeki işlem (':' içerir) ile /webhooks/{id}:test değiştirilir.

Sonraki adımlar