Aracılığıyla paylaş


Kodu sürüm 2024-11-15'ten sürüm 2025-10-15'e geçirme

Hızlı transkripsiyon, toplu transkripsiyon ve özel konuşma için konuşmayı metne dönüştürme REST API'sini kullanın. Bu makalede, 2024-11-15 sürümünden 2025-10-15 sürümüne yapılan değişiklikler açıklanmaktadır.

Önemli

Konuşmayı metne dönüştürme REST API sürümü 2025-10-15 , genel kullanıma sunulan en son sürümdür.

  • Konuşmayı metne dönüştürme REST API sürümü 2024-05-15-preview , duyurulacak bir tarihte kullanımdan kaldırılacaktır.
  • Konuşmadan metne çeviren REST API v3.0, v3.1, v3.2, 3.2-preview.1 ve 3.2-preview.2 31 Mart 2026'da kullanımdan kaldırıldı.

Yükseltme hakkında daha fazla bilgi için bkz. Konuşmayı metne dönüştürme REST API v3.0'ı v3.1'e, v3.1'den v3.2'ye ve v3.2'den 2024-11-15'e geçiş kılavuzlarını inceleyin.

Bu sürümdeki değişiklikleri özetlemek için:

  • Transcribe API'sinde gelişmiş mod ve tümcecik listesi gibi yeni özellikler bulunur.
  • Projeler API'si, sürüm 2024-11-15'te mevcut değil ve bazı değişiklikler içeriyor.

Transkripsiyon API'sinde yapılan değişiklikler

İstek yapısı

  • Yeni uç nokta:
    POST <your_endpoint>/speechtotext/transcriptions:transcribe?api-version=2025-10-15
    
  • Üst bilgiler ve form verileri:
    • Content-Type: multipart/form-data
    • Ocp-Apim-Subscription-Key: $KEY
    • Form alanları: definition, audio

Example:

curl --request POST \
  --url '<your_endpoint>/speechtotext/transcriptions:transcribe?api-version=2025-10-15' \
  --header 'Content-Type: multipart/form-data' \
  --header 'Ocp-Apim-Subscription-Key: $KEY' \
  --form 'definition=$DEFINITION' \
  --form 'audio=@C:\workspace\audios\test.wav'

Tanım nesnesi güncelleştirmeleri

  • Kaldırıldı:
    • "models" sözlük (artık istek tanımında değil)
  • Eklendi:
    • "phraseList": Artık tanıma yanlılığını ayarlamayı destekliyor biasingWeight
    • "enhancedMode" nesnesi şunları içerir:
      • enabled (boolean)
      • task (örneğin "translate")
      • targetLanguage (örneğin "ko")
      • prompt (yönergeler dizisi veya sözlüksel artırımlar)

Example:

{
  "locales": ["en-US"],
  "profanityFilterMode": "Masked",
  "diarization": {
    "enabled": true,
    "maxSpeakers": 6
  },
  "channels": [0],
  "enhancedMode": {
    "enabled": true,
    "task": "translate",
    "targetLanguage": "ko",
    "prompt": [
      "Provide lexical output",
      "Boost the terms: CONTOSO, AAZZ; Replace ‘50cents’ to ’50-Cents’"
    ]
  },
  "phraseList": {
    "phrases": ["Kenichi Kumatani", "John McDonough", "Bhiksha Raj"],
    "biasingWeight": 1.6
  }
}

Sonuç yapısı

  • Kanal tabanlı çıkış:
    • Sonuçlar kanal başına düzenlenir
  • Cümlecik bölümlenmesi:
    • Her tümcecik kanal, başlangıç ve bitiş saati, konuşmacı, metin ve sözcük düzeyinde güven içerir

Projeler API'sinde yapılan değişiklikler

Yeni özellikler

  • Foundry proje adı:
    • Yeni özellik: foundryProjectName Create, Get, Update, List API'lerinde
  • Proje oluşturma:
    • Projeler Azure Resource Manager (ARM) kurallarıyla oluşturulur
    • locale artık özel konuşma projeleri için gerekli

Example:

POST {endpoint}/speechtotext/projects?api-version=2025-10-15
Headers:
  Ocp-Apim-Subscription-Key: <YOUR_SUBSCRIPTION_KEY>
  Content-Type: application/json
Body:
{
  "locale": "en-US",
  "displayName": "My speech project",
  "foundryProjectName": "MyFoundrySpeechProject"
}

Proje listeleme ve filtreleme

  • Foundry proje adına göre filtrele:
    GET {endpoint}/speechtotext/projects?filter=foundryProjectName eq 'MyFoundrySpeechProject'&api-version=2025-10-15
    

Sonraki Adımlar