Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Hızlı transkripsiyon, toplu transkripsiyon ve özel konuşma için konuşmayı metne dönüştürme REST API'sini kullanın. Bu makalede, 2024-11-15 sürümünden 2025-10-15 sürümüne yapılan değişiklikler açıklanmaktadır.
Önemli
Konuşmayı metne dönüştürme REST API sürümü 2025-10-15 , genel kullanıma sunulan en son sürümdür.
-
Konuşmayı metne dönüştürme REST API sürümü
2024-05-15-preview, duyurulacak bir tarihte kullanımdan kaldırılacaktır. - Konuşmadan metne çeviren REST API
v3.0,v3.1,v3.2,3.2-preview.1ve3.2-preview.231 Mart 2026'da kullanımdan kaldırıldı.
Yükseltme hakkında daha fazla bilgi için bkz. Konuşmayı metne dönüştürme REST API v3.0'ı v3.1'e, v3.1'den v3.2'ye ve v3.2'den 2024-11-15'e geçiş kılavuzlarını inceleyin.
Bu sürümdeki değişiklikleri özetlemek için:
- Transcribe API'sinde gelişmiş mod ve tümcecik listesi gibi yeni özellikler bulunur.
- Projeler API'si, sürüm 2024-11-15'te mevcut değil ve bazı değişiklikler içeriyor.
Transkripsiyon API'sinde yapılan değişiklikler
İstek yapısı
-
Yeni uç nokta:
POST <your_endpoint>/speechtotext/transcriptions:transcribe?api-version=2025-10-15 -
Üst bilgiler ve form verileri:
Content-Type: multipart/form-dataOcp-Apim-Subscription-Key: $KEY- Form alanları:
definition,audio
Example:
curl --request POST \
--url '<your_endpoint>/speechtotext/transcriptions:transcribe?api-version=2025-10-15' \
--header 'Content-Type: multipart/form-data' \
--header 'Ocp-Apim-Subscription-Key: $KEY' \
--form 'definition=$DEFINITION' \
--form 'audio=@C:\workspace\audios\test.wav'
Tanım nesnesi güncelleştirmeleri
-
Kaldırıldı:
-
"models"sözlük (artık istek tanımında değil)
-
-
Eklendi:
-
"phraseList": Artık tanıma yanlılığını ayarlamayı destekliyorbiasingWeight -
"enhancedMode"nesnesi şunları içerir:-
enabled(boolean) -
task(örneğin"translate") -
targetLanguage(örneğin"ko") -
prompt(yönergeler dizisi veya sözlüksel artırımlar)
-
-
Example:
{
"locales": ["en-US"],
"profanityFilterMode": "Masked",
"diarization": {
"enabled": true,
"maxSpeakers": 6
},
"channels": [0],
"enhancedMode": {
"enabled": true,
"task": "translate",
"targetLanguage": "ko",
"prompt": [
"Provide lexical output",
"Boost the terms: CONTOSO, AAZZ; Replace ‘50cents’ to ’50-Cents’"
]
},
"phraseList": {
"phrases": ["Kenichi Kumatani", "John McDonough", "Bhiksha Raj"],
"biasingWeight": 1.6
}
}
Sonuç yapısı
-
Kanal tabanlı çıkış:
- Sonuçlar kanal başına düzenlenir
-
Cümlecik bölümlenmesi:
- Her tümcecik kanal, başlangıç ve bitiş saati, konuşmacı, metin ve sözcük düzeyinde güven içerir
Projeler API'sinde yapılan değişiklikler
Yeni özellikler
-
Foundry proje adı:
- Yeni özellik:
foundryProjectNameCreate, Get, Update, List API'lerinde
- Yeni özellik:
-
Proje oluşturma:
- Projeler Azure Resource Manager (ARM) kurallarıyla oluşturulur
-
localeartık özel konuşma projeleri için gerekli
Example:
POST {endpoint}/speechtotext/projects?api-version=2025-10-15
Headers:
Ocp-Apim-Subscription-Key: <YOUR_SUBSCRIPTION_KEY>
Content-Type: application/json
Body:
{
"locale": "en-US",
"displayName": "My speech project",
"foundryProjectName": "MyFoundrySpeechProject"
}
Proje listeleme ve filtreleme
-
Foundry proje adına göre filtrele:
GET {endpoint}/speechtotext/projects?filter=foundryProjectName eq 'MyFoundrySpeechProject'&api-version=2025-10-15