Azure Yapay Zeka Konuşma'daki yenilikler

Makale
04/22/2024

Azure AI Konuşma sürekli olarak güncelleştirilir. Son gelişmelerden haberdar olmak için bu makalede yeni sürümler ve özellikler hakkında bilgi verilmektedir.

En son öne çıkanlar

Azure AI Konuşma Tanıma hizmeti OpenAI metinden konuşmaya seslerini destekler. Daha fazla bilgi için bkz . OpenAI metni konuşma seslerine nelerdir?.
Özel ses API'si, profesyonel ve kişisel özel sinir sesi modelleri oluşturmak ve yönetmek için kullanılabilir.
Azure AI Konuşma artık toplu transkripsiyon API'sini kullanarak OpenAI'nin Fısıltı modelini destekliyor. Daha fazla bilgi edinmek için Toplu transkripsiyon oluşturma kılavuzuna göz atın.

Sürüm notları

Hizmet veya kaynak seçin

Linux ve Android kullanıcıları için yaklaşan planlar:

Dikkat

Bu makalede, Kullanım Süresi Sonu (EOL) durumuna yakın bir Linux dağıtımı olan CentOS'a başvuruda bulunur. Lütfen kullanımınızı ve buna uygun planlamayı göz önünde bulundurun. Daha fazla bilgi için bkz . CentOS Kullanım Süresi Sonu kılavuzu.

Ubuntu 18.04 ayrıca Nisan 2023'te kullanım ömrünün sonuna geldi, bu nedenle kullanıcılarımız en düşük sürümümüzü Ubuntu 20.04'e taşımaya hazırlanmalı.

Konuşma SDK'sı 1.37.0: 2024-Nisan sürümü

Yeni özellikler

Konuşma sentezinde giriş metin akışı için destek ekleyin.
Varsayılan konuşma sentezi sesini en-US-AvaMultilingualNeural olarak değiştirin.
Android derlemelerini OpenSSL 3.x kullanacak şekilde güncelleştirin.

Hata düzeltmeleri

MAS kullanırken SpeechRecognizer atma sırasında oluşan JVM kilitlenmelerini düzeltin. (https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2125)
Linux'ta varsayılan ses cihazlarını algılamayı geliştirin. (https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2292)

Örnekler

Yeni özellikler için güncelleştirildi.

Konuşma SDK'sı 1.36.0: 2024-Mart sürümü

Yeni özellikler

AutoDetectSourceLanguageConfig::FromOpenRange() kullanarak v2 uç noktalarındaki çok dilli çeviride dil tanımlama desteği ekleyin.

Hata düzeltmeleri

SynthesisStarted olayı sırasında durdurma çağrılırsa SynthesisCanceled olayının tetiklenmemesi düzeltildi.
Tümleşik konuşma sentezindeki bir gürültü sorununu düzeltin.
Birden çok tanıyıcıyı paralel olarak çalıştırırken katıştırılmış konuşma tanımadaki kilitlenmeyi düzeltin.
v1/v2 uç noktalarındaki tümcecik algılama modu ayarını düzeltin.
Microsoft Ses Yığını ile ilgili çeşitli sorunlara yönelik düzeltmeler.

Örnekler

Yeni özellikler için Güncelleştirmeler.

Konuşma SDK'sı 1.35.0: Şubat 2024 sürümü

Yeni özellikler

Varsayılan metni en-US-JennyMultilingualNeural olan konuşma sesi olarak en-US-AvaNeural olarak değiştirin.
Ayrıntılı çıkış biçimini kullanarak ekli konuşma çevirisi sonuçlarında sözcük düzeyi ayrıntısını destekleyin.

Hata düzeltmeleri

Python'da AudioDataStream konum alıcı API'sini düzeltin.
Dil algılama olmadan v2 uç noktalarını kullanarak konuşma çevirisini düzeltin.
Eklenmiş metinden konuşmaya rastgele kilitlenme ve yinelenen sözcük sınırı olaylarını düzeltin.
WebSocket bağlantılarında iç sunucu hatası için doğru bir iptal hata kodu döndür.
MAS C# ile kullanıldığında FPIEProcessor.dll kitaplığını yükleme hatasını düzeltin.

Örnekler

Katıştırılmış tanıma örnekleri için küçük biçimlendirme güncelleştirmeleri.

Konuşma SDK'sı 1.34.1: Ocak 2024 sürümü

Hataya neden olan değişiklikler

Yalnızca hata düzeltmeleri

Yeni özellikler

Yalnızca hata düzeltmeleri

Hata düzeltmeleri

1.34.0'da sunulan ve çeşitli Çin bölgelerindeki kullanıcılar için hizmet uç noktası URL'si hatalı yerel ayar bilgileriyle oluşturulduğu regresyon düzeltildi.

Konuşma SDK'sı 1.34.0: Kasım 2023 sürümü

Hataya neden olan değişiklikler

SpeechRecognizer, özelliklerin çoğu için sorgu dizesi parametrelerini artık desteklemeyen yeni bir uç noktayı varsayılan olarak kullanacak şekilde güncelleştirildi (örneğin, açıkça bir URL belirtilmediğinde). Sorgu dizesi parametrelerini doğrudan ServicePropertyChannel.UriQueryParameter ile ayarlamak yerine lütfen ilgili API işlevlerini kullanın.

Yeni özellikler

.NET 8 ile uyumluluk (Centos7-x64 ile ilgili uyarı dışında düzeltme https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2170 )
Bir cihazın katıştırılmış konuşma çalıştırma özelliğini değerlendirmek için kullanılabilecek tümleşik konuşma performansı ölçümleri desteği.
Katıştırılmış çok dilli çeviride kaynak dil belirleme desteği.
iOS ve Swift/Objective-C için ekli konuşmayı metne dönüştürme, metin okuma ve çeviri desteği önizlemede yayınlandı.
MicrosoftCognitiveServicesSpeechEmbedded-iOS Cocoapod'da tümleşik destek sağlanır.

Hata düzeltmeleri

iOS SDK x2 kat ikili boyut büyümesi için düzeltme · Sorun #2113 · Azure-Samples/cognitive-services-speech-sdk (github.com)
Azure konuşmadan metin api'sine sözcük düzeyi zaman damgaları alınamıyor için düzeltme · Sorun #2156 · Azure-Samples/cognitive-services-speech-sdk (github.com)
DialogService Bağlan veya yok etme aşamasındaki olayların bağlantısını doğru kesmek için düzeltildi. Bu, zaman zaman kilitlenmelere neden oldu.
MAS kullanıldığında bir tanıyıcı oluşturma sırasında özel durum için düzeltme.
Windows UWP x64 ve ARM64 için Microsoft.CognitiveServices.Speech.Extension.MAS NuGet paketinden FPIEProcessor.dll yerel C++ için VC çalışma zamanı kitaplıklarına bağımlılığı vardı. VC çalışma zamanı kitaplıklarını (UWP için) düzeltmek için bağımlılık güncelleştirilerek sorun düzeltildi.
[MAS] recognizeOnceAsync için yinelenen çağrılar, MAS kullanırken SPXERR_ALREADY_INITIALIZED yol açıyor · Sorun #2124 · Azure-Samples/cognitive-services-speech-sdk (github.com)
Tümcecik listeleri kullanıldığında eklenmiş konuşma tanıma kilitlenmesi için düzeltme.

Örnekler

Konuşmayı metne dönüştürme, metin okuma ve çeviri için ekli iOS örnekleri.

Konuşma CLI 1.34.0: Kasım 2023 sürümü

Yeni özellikler

Konuşmayı sentezlerken sözcük sınırı olaylarının çıkışını destekleyin.

Hata düzeltmeleri

JMESPath bağımlılığı en son sürüme güncelleştirildi, dize değerlendirmelerini iyileştirir

Konuşma SDK'sı 1.33.0: Ekim 2023 sürümü

Hataya neden olan değişiklik bildirimi

Microsoft Ses Yığını (MAS) için eklenen yeni NuGet paketinin artık paket yapılandırma dosyalarına MAS kullanan uygulamalar tarafından eklenmesi gerekiyor.

Yeni özellikler

Microsoft Audio Stack kullanırken geliştirilmiş yankı iptal performansı sağlayan yeni NuGet paketi Microsoft.CognitiveServices.Speech.Extension.MAS.nupkg eklendi
Söyleniş Değerlendirmesi: Konuşulan konuşmayı prosody, kelime bilgisi, dil bilgisi ve konu açısından değerlendirebilen prosody ve içerik değerlendirmesi desteği eklendi.

Hata düzeltmeleri

Anahtar sözcük tanıma sonucunun başlangıçtan bu yana giriş ses akışıyla doğru eşleşmesi için uzaklıkları düzeltildi. Düzeltme hem tek başına anahtar sözcük tanıma hem de anahtar sözcükle tetiklenen konuşma tanıma için geçerlidir.
Synthesizer stopSpeaking hemen döndürmüyor SPXSpeechSynthesizer stopSpeaking() yöntemi iOS 17'de hemen döndürülemiyor - Sorun #2081
Swift modülünde Mac katalizör içeri aktarma sorunu düzeltildi Apple silicon ile mac katalizör desteği. Sorun #1948
JS: AudioWorkletNode modülü yüklemeleri artık güvenilir bir URL kullanıyor ve CDN tarayıcısı için geri dönüş dahil.
JS: Paketlenmiş lib dosyaları artık ES6 JS'yi hedeflemektedir ve ES5 JS desteği kaldırılmıştır.
JS: v2 uç noktasını hedefleyen çeviri senaryosu için ara olaylar doğru şekilde işleniyor
JS: TranslationRecognitionEventArgs için language özelliği artık translation.hypothesis olayları için ayarlanmıştır.
Konuşma Sentezi: SynthesisCompleted olayının tüm meta veri olaylarından sonra yayılacağı garanti edilir, bu nedenle olayların sonunu göstermek için kullanılabilir. Visemelerin ne zaman tamamen alındığını nasıl algılayabilirsiniz? Sorun #2093 Azure-Samples/cognitive-services-speech-sdk

Örnekler

Python kullanarak MULAW akışını göstermek için örnek eklendi)
Konuşmayı metne dönüştürme NAudio örneği için düzeltme

Konuşma CLI 1.33.0: Ekim 2023 sürümü

Yeni özellikler

Konuşmayı sentezlerken sözcük sınırı olaylarının çıkışını destekleyin.

Hata düzeltmeleri

Konuşma SDK'sı 1.32.1: Eylül 2023 sürümü

Hata düzeltmeleri

Android, OpenSSL1.1.1v'den en son güvenlik düzeltmeleriyle güncelleştirmeleri paketler
JS – Zaman aşımı çalışanı için veri URL'si yükünün atlanmasına izin vermek için WebWorkerLoadType özelliği eklendi
JS – 10 dakika sonra Konuşma Çevirisi bağlantısının kesilmesini düzeltme
JS – Konuşmadan Konuşma Çevirisi kimlik doğrulama belirteci artık Çeviri hizmeti bağlantısına yayıyor

Örnekler

Swift API'leriyle konuşma transkripsiyonu

Konuşma SDK'sı 1.31.0: Ağustos 2023 sürümü

Yeni Özellikler

Gerçek zamanlı dillere ayırma desteği, Konuşma SDK'sı 1.31.0 ile genel önizlemede kullanılabilir. Bu özellik şu SDK'larda kullanılabilir: C#, C++, Java, JavaScript, Python ve Objective-C/Swift.
Ses kayıttan yürütme ile eşitlenmiş konuşma sentezi sözcük sınırı ve viseme olayları

Hataya neden olan değişiklikler

Eski "konuşma transkripsiyonu" senaryosu "toplantı transkripsiyonu" olarak yeniden adlandırıldı. Örneğin, yerine ConversationTranscriberkullanın MeetingTranscriber ve yerine CreateConversationAsynckullanınCreateMeetingAsync. SDK nesnelerinin ve yöntemlerinin adları değişmiş olsa da, yeniden adlandırma özelliğin kendisini değiştirmez. Kullanıcı profilleri ve ses imzalarıyla toplantıların transkripsiyonu için toplantı transkripsiyonu nesnelerini kullanın. Daha fazla bilgi için bkz . Toplantı transkripsiyonu . "Konuşma çevirisi" nesneleri ve yöntemleri bu değişikliklerden etkilenmez. Çeviri senaryolarını ConversationTranslator toplantı için nesnesini ve yöntemlerini kullanmaya devam edebilirsiniz.

Gerçek zamanlı silahsızlaştırma için yeni ConversationTranscriber bir nesne tanıtılır. Yeni "konuşma transkripsiyonu" nesne modeli ve çağrı desenleri, nesneyle sürekli tanımaya SpeechRecognizer benzer. Önemli bir fark, nesnenin birden çok konuşmacıyı ConversationTranscriber ayırt etmek istediğiniz bir konuşma senaryosunda kullanılacak şekilde tasarlanmasıdır (dikerleştirme). Kullanıcı profilleri ve ses imzaları geçerli değildir. Daha fazla bilgi için gerçek zamanlı başkalaştırma hızlı başlangıcına bakın.

Bu tabloda, gerçek zamanlı sözlük ve toplantı transkripsiyonu için önceki ve yeni nesne adları gösterilir. Senaryo adı ilk sütunda, önceki nesne adları ikinci sütunda ve yeni nesne adları üçüncü sütunda yer alır.

Senaryo adı	Önceki nesne adları	Yeni nesne adları
Gerçek zamanlı silahsızlaştırma	Yok	`ConversationTranscriber`
Toplantı transkripsiyonu	`ConversationTranscriber` `ConversationTranscriptionEventArgs` `ConversationTranscriptionCanceledEventArgs` `ConversationTranscriptionResult` `RemoteConversationTranscriptionResult` `RemoteConversationTranscriptionClient` `RemoteConversationTranscriptionResult` `Participant`¹ `ParticipantChangedReason`¹ `User`¹	`MeetingTranscriber` `MeetingTranscriptionEventArgs` `MeetingTranscriptionCanceledEventArgs` `MeetingTranscriptionResult` `RemoteMeetingTranscriptionResult` `RemoteMeetingTranscriptionClient` `RemoteMeetingTranscriptionResult` `Participant` `ParticipantChangedReason` `User` `Meeting`²

¹ , ParticipantParticipantChangedReasonve User nesneleri hem toplantı transkripsiyonu hem de toplantı çevirisi senaryoları için geçerlidir.

²Meeting Nesne yenidir ve nesnesiyle birlikte MeetingTranscriber kullanılır.

Hata düzeltmeleri

macOS desteklenen en düşük sürüm düzeltildi https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/2017
Söyleniş Değerlendirmesi hatası düzeltildi:
- Fonem doğruluğu puanlama sorunu giderildi ve artık yalnızca yanlış telaffuz edilen foneme'yi doğru yansıtıyor. https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/1917
- Söyleniş Değerlendirmesi özelliğinin, özellikle sözcüklerin birden çok geçerli söylenişi olabileceği durumlarda tamamen doğru söylenişleri hatalı olarak tanımlaması sorunu çözüldü. https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/1530

Örnekler

Konuşma SDK'sı 1.30.0: Temmuz 2023 sürümü

Yeni Özellikler

C++, C#, Java - Embedded Konuşma Tanıma'nın ayrıntılı sonucu için DisplayWords destek eklendi.
Objective-C/Swift - Objective-C/Swift'te etkinlik desteği ConnectionMessageReceived eklendi.
Objective-C/Swift - iOS için geliştirilmiş anahtar sözcük belirleme modelleri. Bu değişiklik, iOS ikili dosyalarını (NuGet, XCFramework gibi) içeren belirli paketlerin boyutunu artırmıştır. Gelecek sürümler için boyutu küçültmeye çalışıyoruz.

Hata düzeltmeleri

Bir müşteri tarafından bildirilen phraseListGrammar ile konuşma tanıma kullanılırken bellek sızıntısı düzeltildi (GitHub sorunu).
Metinde konuşma açma bağlantı API'sine kilitlenme düzeltildi.

Ek notlar

Java - Bazı dahili olarak kullanılan public Java API yöntemleri, protected veya privatepaket internalolarak değiştirildi. Uygulamaların bunları kullanmasını beklemediğimiz için bu değişikliğin geliştiriciler üzerinde bir etkisi olmamalıdır. Saydamlık için burada not edildi.

Örnekler

Kendi uygulamanızda öğrenme dili belirtmeye yönelik yeni Söyleniş Değerlendirmesi örnekleri
- C#: Bkz . örnek kod.
- C++: Örnek koda bakın.
- JavaScript: Örnek koda bakın.
- Objective-C: Örnek koda bakın.
- Python: Bkz . örnek kod.
- Swift: Örnek koda bakın.

Konuşma SDK'sı 1.29.0: Haziran 2023 sürümü

Yeni Özellikler

C++, C#, Java - Katıştırılmış Konuşma Çevirisi API'lerinin Önizlemesi. Artık bulut bağlantısı olmadan konuşma çevirisi yapabilirsiniz!
JavaScript - Sürekli Dil Belirleme (LID) artık konuşma çevirisi için etkinleştirildi.
JavaScript - Sınıfa özellik eklemeye LocaleName yönelik VoiceInfo topluluk katkısı. Çekme isteği için GitHub kullanıcısı shivsarthak'a teşekkür ederiz.
C++, C#, Java - 16 kHz'den 48 kHz'e kadar örnek hızına kadar katıştırılmış metinden konuşma çıkışına yeniden örnekleme desteği eklendi.
Basit Desen Eşleştirme ile Intent Recognizer'da yerel ayar desteği hi-IN eklendi.

Hata düzeltmeleri

Bazı Android testlerimizde görüldüğü gibi nesne yok etme sırasında Konuşma Tanıma'daki bir yarış durumunun neden olduğu kilitlenme düzeltildi
Basit Desen Eşleştirici ile Amaç Tanıyıcı'da olası kilitlenmeler düzeltildi

Örnekler

Yeni Katıştırılmış Konuşma Çevirisi örnekleri

Konuşma SDK'sı 1.28.0: Mayıs 2023 sürümü

Hataya neden olan değişiklik

JavaScript SDK'sı: Çevrimiçi Sertifika Durum Protokolü (OCSP) kaldırıldı. Bu, istemcilerin sertifika işleme için tarayıcı ve Node standartlarına daha iyi uymasını sağlar. Sürüm 1.28 ve sonraki sürümler artık özel OCSP modülümüzü içermez.

Yeni Özellikler

Katıştırılmış Konuşma Tanıma artık konuşmanın sonunda bir sessizlik zaman aşımı oluştuğunda döndürülüyor NoMatchReason::EndSilenceTimeout . Bu, gerçek zamanlı konuşma hizmetini kullanarak tanıma yaparken davranışla eşleşir.
JavaScript SDK'sı: Numaralandırma değerlerini kullanarak PropertyId özelliklerini SpeechTranslationConfig ayarlayın.

Hata düzeltmeleri

Windows'da C# - Windows ses uzantısında olası yarış durumunu/kilitlenmeyi düzeltin. Hem ses işleyiciyi hızlı bir şekilde atıp hem de konuşmayı durdurmak için Synthesizer yöntemini kullanan senaryolarda, temel olay durdurma ile sıfırlanmamıştır ve oluşturucu nesnesinin hiçbir zaman atılmamasına neden olabilirken, tüm bunlar atma için genel bir kilit tutarak dotnet GC iş parçacığını dondurabilir.

Örnekler

MAUI için eklenmiş bir konuşma örneği eklendi.
Android Java için eklenmiş konuşma örneği metin okuma içerecek şekilde güncelleştirildi.

Konuşma SDK'sı 1.27.0: Nisan 2023 sürümü

Yaklaşan değişiklikler hakkında bildirim

Bir sonraki JavaScript SDK sürümünde Çevrimiçi Sertifika Durum Protokolü'nü (OCSP) kaldırmayı planlıyoruz. Bu, istemcilerin sertifika işleme için tarayıcı ve Node standartlarına daha iyi uymasını sağlar. Sürüm 1.27, özel OCSP modülümüzü içeren son sürümdür.

Yeni Özellikler

JavaScript – Konuşmacı Belirleme ve Doğrulama ile tarayıcıdan mikrofon girişi desteği eklendi.
Katıştırılmış Konuşma Tanıma - Ayar desteğini PropertyId::Speech_SegmentationSilenceTimeoutMs güncelleştirin.

Hata düzeltmeleri

Genel - Hizmet yeniden bağlantı mantığındaki güvenilirlik güncelleştirmeleri (JavaScript dışındaki tüm programlama dilleri).
Genel - Windows'ta bellek sızıntısına neden olan dize dönüştürmelerini düzeltin (JavaScript dışındaki tüm ilgili programlama dilleri).
Katıştırılmış Konuşma Tanıma - Belirli dil bilgisi listesi girdilerini kullanırken Fransızca Konuşma Tanıma'daki kilitlenmeyi düzeltin.
Kaynak kodu belgeleri - Hizmette ses günlüğüyle ilgili SDK başvuru belgeleri açıklamalarında yapılan düzeltmeler.
Amaç tanıma - Liste varlıklarıyla ilgili Desen Eşleştirici önceliklerini düzeltin.

Örnekler

C# Konuşma Transkripsiyonu (CTS) örneğinde kimlik doğrulama hatasını düzgün bir şekilde işleyebilir.
Python, JavaScript, Objective-C ve Swift için söyleniş akışı değerlendirmesi örneği eklendi.

Konuşma SDK'sı 1.26.0: Mart 2023 sürümü

Hataya neden olan değişiklikler

Bitcode şu paketlerde tüm iOS hedeflerinde devre dışı bırakıldı: xcframework ile Cocoapod, NuGet (Xamarin ve MAUI için) ve Unity. Bu değişiklik, Apple'ın Xcode 14 ve sonraki sürümlerden bitcode desteğini kullanımdan kaldırmasından kaynaklanır. Bu değişiklik ayrıca Xcode 13 sürümünü kullanıyorsanız veya Konuşma SDK'sını kullanarak uygulamanızda bit kodunu açıkça etkinleştirdiyseniz "çerçeve bit kodu içermiyor ve yeniden oluşturmanız gerekiyor" hatasıyla karşılaşabileceğiniz anlamına gelir. Bu sorunu çözmek için hedeflerinizin bit kodu devre dışı olduğundan emin olun.
En düşük iOS dağıtım hedefi bu sürümde 11.0'a yükseltildi, yani armv7 HW artık desteklenmiyor.

Yeni özellikler

Katıştırılmış (cihaz içi) Konuşma Tanıma artık hem 8 hem de 16 kHz örnekleme hızı giriş sesini (örnek başına 16 bit, mono PCM) destekliyor.
Konuşma Sentezi artık bağlantı, ağ ve hizmet gecikme sürelerini raporlayarak uçtan uca gecikme süresini iyileştirmeye yardımcı olur.
Basit desen eşleştirme ile Amaç Tanıma için yeni bağlama hataya neden olan kurallar. Eşleşen karakter bayt sayısı ne kadar fazla olursa, desen eşleşmelerini daha düşük karakter bayt sayısıyla kazanır. Örnek: "Sağ üstteki {something} öğesini seçin" deseni "{bir şey seçin}" seçeneğinin üzerine gelir

Hata düzeltmeleri

Konuşma Sentezi: Sözcük sınırı olaylarında emojinin doğru olmadığı bir hatayı düzeltin.
Konuşma Dili Anlama (CLU) ile Amaç Tanıma:
- CLU Orchestrator İş Akışındaki amaçlar artık doğru görünüyor.
- JSON sonucu artık özellik kimliği LanguageUnderstandingServiceResponse_JsonResultaracılığıyla kullanılabilir.
Anahtar sözcük etkinleştirme ile konuşma tanıma: Anahtar sözcük tanımadan sonra yaklaşık 150 ms ses eksik için düzeltme.
Müşteri tarafından bildirilen Konuşma SDK'sı NuGet iOS MAUI Sürümü derlemesi için düzeltme (GitHub sorunu)

Örnekler

Müşteri tarafından bildirilen Swift iOS örneği için düzeltme (GitHub sorunu)

Konuşma SDK'sı 1.25.0: Ocak 2023 sürümü

Hataya neden olan değişiklikler

Dil Belirleme (önizleme) API'leri basitleştirildi. Konuşma SDK'sı 1.25'e güncelleştirir ve bir derleme sonu görürseniz, yeni özelliği SpeechServiceConnection_LanguageIdModehakkında bilgi edinmek için Lütfen Dil Belirleme sayfasını ziyaret edin. Bu tek özellik, önceki iki özelliğin ve SpeechServiceConnection_ContinuousLanguageIdPriorityöğesinin SpeechServiceConnection_SingleLanguageIdPriority yerini alır. Son model geliştirmelerinin ardından düşük gecikme süresi ile yüksek doğruluk arasında öncelik belirleme artık gerekli değildir. Şimdi, yalnızca sürekli konuşma tanıma veya çeviri yaparken başlangıçta mı yoksa sürekli Dil Belirleme'yi mi çalıştırabileceğinizi seçmeniz gerekir.

Yeni özellikler

C#/C++/Java: Embedded Speech SDK artık geçitli genel önizleme altında yayınlanıyor. Ekli Konuşma (önizleme) belgelerine bakın. Artık bulut bağlantısı aralıklı olduğunda veya kullanılamadığında cihazdan metne konuşma ve metin okuma yapabilirsiniz. Android, Linux, macOS ve Windows platformlarında desteklenir
C# MAUI: Konuşma SDK'sı NuGet'te iOS ve Mac Catalyst hedefleri desteği eklendi (Müşteri sorunu)
Unity: Unity paketine Android x86_64 mimarisi eklendi (Müşteri sorunu)
Git:
- Konuşma tanıma için ALAW/MULAW doğrudan akış desteği eklendi (Müşteri sorunu)
- PhraseListGrammar desteği eklendi. Topluluk katkınız için GitHub kullanıcısı czkoko'ya teşekkür ederiz!
C#/C++: Intent Recognizer artık Microsoft hizmetinde düzenleme ile C++ ve C# dilinde Konuşma Dili Anlama modellerini destekliyor

Hata düzeltmeleri

KeywordRecognizer'ı durdurmaya çalışırken ara sıra askıda kalma sorununu düzeltme
Python:
- Ayarlandığında Söyleniş Değerlendirmesi sonuçlarını PronunciationAssessmentGranularity.FullText alma düzeltmesi (Müşteri sorunu)
- Konuşma sentezi sesleri alınırken Erkek sesleri alınmıyor cinsiyet özelliği için düzeltme
JavaScript
- iOS cihazlarına kaydedilmiş bazı WAV dosyalarını ayrıştırma düzeltmesi (Müşteri sorunu)
- JS SDK artık npm-force-resolutions kullanmadan derleniyor (Müşteri sorunu)
- Konuşma Çeviri artık SpeechConfig.fromEndpoint() kullanılarak oluşturulan speechConfig örneği kullanılırken hizmet uç noktasını doğru şekilde ayarlar

Örnekler

Katıştırılmış Konuşma'nın nasıl kullanılacağını gösteren örnekler eklendi
MAUI için metin örneğine Konuşma eklendi

Bkz . Konuşma SDK'sı örnekleri deposu.

Konuşma SDK'sı 1.24.2: Kasım 2022 sürümü

Yeni özellikler

Yeni özellik yok, yalnızca yeni model dosyalarını desteklemek için eklenen bir altyapı düzeltmesi.

Hata düzeltmeleri

Tüm programlama dilleri
- Ekli konuşma tanıma modellerinin şifrelenmesinin sorunu düzeltildi.

Konuşma SDK'sı 1.24.1: Kasım 2022 sürümü

Yeni özellikler

Embedded Speech önizlemesi için yayımlanan paketler. Daha fazla bilgi edinmek için bkz. https://aka.ms/embedded-speech.

Hata düzeltmeleri

Tüm programlama dilleri
- Ses yazı tipi desteklenmediğinde katıştırılmış TTS kilitlenmesi düzeltilir
- Linux'ta stopSpeaking() kayıttan yürütmeyi durduramıyor (#1686) düzeltmesi
JavaScript SDK'sı
- Konuşma transkriptörlerinin sesi kapılama şeklindeki regresyon düzeltildi.
Java
- Docs işlem hattının çevrimiçi başvuru belgelerini güncelleştirmesini sağlamak için Maven Central'da güncelleştirilmiş POM ve Javadocs dosyaları geçici olarak yayımlandı.
Python
- Python speak_text(ssml) işlevinin void döndürdüğü regresyonu düzeltin.

Konuşma SDK'sı 1.24.0: Ekim 2022 sürümü

Yeni özellikler

Tüm programlama dilleri: AMR-WB (16khz) desteklenen Metin okuma ses çıkış biçimleri listesine eklendi
Python: Desteklenen Linux dağıtımları için Linux ARM64 paketi eklendi.
C#/C++/Java/Python: kullanılarak AudioStreamWaveFormatkonuşma hizmetine ALAW ve MULAW doğrudan akışı (mevcut PCM akışına ek olarak) desteği eklendi.
C# MAUI: .NET MAUI geliştiricileri için Android hedeflerini destekleyecek şekilde güncelleştirilen NuGet paketi (Müşteri sorunu)
Mac: Mac için iOS ikili dosyaları içermeyen ayrı XCframework eklendi. Bu, daha küçük bir XCframework paketi kullanan yalnızca Mac ikili dosyalarına ihtiyaç duyan geliştiriciler için bir seçenek sunar.
Microsoft Ses Yığını (MAS):
- Kiriş oluşturma açıları belirtildiğinde, belirtilen aralığın dışından gelen ses daha iyi gizlenecektir.
- Linux ARM32 ve Linux ARM64'ün libMicrosoft.CognitiveServices.Speech.extension.mas.so boyutunda yaklaşık %70 azalma.
Desen eşleştirme kullanarak Amaç Tanıma:
- , deesdilleri friçin ortografi desteği eklemejp
- dil esiçin önceden oluşturulmuş tamsayı desteği eklendi.

Hata düzeltmeleri

iOS: Sıkıştırılmış ses kod çözme hatasının neden olduğu iOS 16'da konuşma sentezi hatasını düzeltin (Müşteri Sorunu).
JavaScript:
- Konuşma sentezi ses listesi alınırken kimlik doğrulama belirtecinin çalışmaması düzeltildi (Müşteri sorunu).
- Çalışan yüklemesi için veri URL'sini kullanma (Müşteri sorunu).
- Yalnızca AudioWorklet tarayıcıda desteklendiğinde ses işlemcisi işleyicisi oluşturun (Müşteri sorunu). Bu William Wong'un topluluk katkılarıydı. Teşekkürler William!
- LUIS yanıtı connectionMessage boş olduğunda tanınan geri çağırma düzeltildi (Müşteri sorunu).
- Konuşma segmentasyonu zaman aşımını düzgün şekilde ayarlayın.
Desen eşleştirme kullanarak Amaç Tanıma:
- Modellerin içindeki json olmayan karakterler artık düzgün yüklenecek.
- Sürekli tanıma sırasında çağrıldığında recognizeOnceAsync(text) asılı bırakma sorunu düzeltildi.

Konuşma SDK'sı 1.23.0: Temmuz 2022 sürümü

Yeni özellikler

C#, C++, Java: Diller zh-cn için ve zh-hk Desen Eşleştirme ile Amaç Tanıma desteği eklendi.
C#: .NET Framework derlemeleri için AnyCPU destek eklendi

Hata düzeltmeleri

Android: OpenSSL'yi 1.1.1q'a güncelleştirerek OpenSSL CVE-2022-2068 güvenlik açığı düzeltildi
Python: PushAudioInputStream kullanırken kilitlenmeyi düzeltme
iOS: iOS'ta bildirilen "EXC_BAD_ACCESS: Null işaretçisi başvurusunu kaldırma girişimi" düzeltildi (GitHub sorunu)

Konuşma SDK'sı 1.22.0: Haziran 2022 sürümü

Yeni özellikler

Java: GetEntities(), applyLanguageModels() ve recognizeOnceAsync(text) için IntentRecognitionResult API'sini kullanarak "basit desen eşleştirme" altyapısını destekleyin.
Unity: Unity paketi için Mac M1 (Apple Silicon) desteği eklendi (GitHub sorunu)
C#: Xamarin Android için x86_64 desteği eklendi (GitHub sorunu)
C#: .NET framework en düşük sürümü v4.6.1 kullanımdan kaldırıldı olarak SDK C# paketi için v4.6.2 sürümüne güncelleştirildi (bkz . Microsoft .NET Framework Bileşen Yaşam Döngüsü İlkesi)
Linux: Debian 11 ve Ubuntu 22.04 LTS desteği eklendi. Ubuntu 22.04 LTS, libssl1.1'in buradan ikili paket olarak (örneğin, x64 için libssl1.1_1.1.1l-1ubuntu1.3_amd64.deb veya daha yeni) veya kaynaklardan derlenerek el ile yüklenmesini gerektirir.

Hata düzeltmeleri

UWP: OpenSSL bağımlılığı UWP kitaplıklarından kaldırıldı ve güvenlik uyumluluğunu ve daha küçük ikili ayak izini karşılamak için WinRT websocket ve HTTP API'leriyle değiştirildi.
Mac: MacOS platformlarını hedefleyen Swift projeleri kullanılırken "MicrosoftCognitiveServicesSpeech Modülü Bulunamadı" sorunu düzeltildi
Windows, Mac: Özellikler aracılığıyla gerçek zamanlı akış hızıyla akış yapmak üzere yapılandırılan ses kaynaklarının bazen kapasitenin gerisinde ve sonunda kapasiteyi aşmasına neden olan platforma özgü bir sorun düzeltildi

Örnekler (GitHub)

C#: .NET framework örnekleri v4.6.2 kullanacak şekilde güncelleştirildi
Unity: Android ve UWP için düzeltilen sanal yardımcı örneği
Unity: Unity 2020 LTS sürümü için güncelleştirilmiş Unity örnekleri

Konuşma SDK'sı 1.21.0: Nisan 2022 sürümü

Yeni özellikler

Java & JavaScript: SpeechRecognizer nesnesi kullanılırken Sürekli Dil Belirleme desteği eklendi
JavaScript: Microsoft'un müşteri tarafından bildirilen sorunları gidermesine yardımcı olmak için konsol günlüğü düzeyini ve (Yalnızca düğüm) dosya günlüğünü etkinleştirmek için Tanılama API'leri eklendi
Python: Konuşma Transkripsiyonu desteği eklendi
Git: Konuşmacı Tanıma desteği eklendi
C++ & C#: Amaç Tanıma'da gerekli bir sözcük grubu için destek eklendi (basit desen eşleştirme). Örneğin: "(set|start|begin) zamanlayıcı" burada amacın tanınması için "set", "start" veya "begin" bulunmalıdır.
Tüm programlama dilleri, Konuşma Sentezi: Sözcük sınırı olaylarına duration özelliği eklendi. Noktalama sınırı ve cümle sınırı desteği eklendi
Objective-C/Swift/Java: Söyleniş Değerlendirmesi sonuç nesnesine sözcük düzeyi sonuçlar eklendi (C#'ye benzer). Uygulamanın artık sözcük düzeyinde bilgi almak için JSON sonuç dizesini ayrıştırması gerekmez (GitHub sorunu)
iOS platformu: ARMv7 mimarisi için deneysel destek eklendi

Hata düzeltmeleri

iOS platformu: CocoaPod kullanırken hedef "Herhangi bir iOS Cihazı" için derlemeye izin vermek için düzeltme (GitHub sorunu)
Android platformu: OpenSSL sürümü CVE-2022-0778 güvenlik açığını düzeltmek için 1.1.1n sürümüne güncelleştirildi
JavaScript: Wav üst bilgisinin dosya boyutuyla güncelleştirilmeme sorunu düzeltildi (GitHub sorunu)
JavaScript: çeviri senaryolarında hataya neden olan istek kimliği eşitleme sorununu düzeltme (GitHub sorunu)
JavaScript: Akış olmadan SpeakerAudioDestination örneği oluşturulurken sorun düzeltildi (GitHub sorunu]
C++: C++17 veya daha yeni bir sürüm için derleme yaparken uyarıyı kaldırmak için C++ üst bilgilerini düzeltme

Örnekler GitHub

Dil Belirleme ile Konuşma Tanıma için yeni Java örnekleri
Konuşma Transkripsiyonu için yeni Python ve Java örnekleri
Konuşmacı Tanıma için Yeni Go örneği
Cihaz Kimliğini bulmak için tüm ses yakalama ve işleme cihazlarını numaralandıran yeni Windows C++ ve C# aracı. Bu kimlik, varsayılan olmayan bir cihazdan ses yakalamayı veya bu cihaza ses oluşturmayı planlıyorsanız Konuşma SDK'sı tarafından gereklidir.

Konuşma SDK'sı 1.20.0: Ocak 2022 sürümü

Yeni özellikler

Objective-C, Swift ve Python: Voice-Assistant senaryoları için kullanılan DialogService Bağlan or desteği eklendi.
Python: Python 3.10 desteği eklendi. Python'ın 3.6 için kullanım ömrü sonuna göre Python 3.6 desteği kaldırıldı.
Unity: Konuşma SDK'sı artık Linux'ta Unity uygulamaları için destekleniyor.
C++, C#: Desen eşleştirme kullanan IntentRecognizer artık C# dilinde destekleniyor. Buna ek olarak, özel varlıklar, isteğe bağlı gruplar ve varlık rolleri içeren senaryolar artık C++ ve C# dilinde desteklenmektedir.
C++, C#: FileLogger, MemoryLogger ve EventLogger sınıflarını kullanarak tanılama izleme günlüğü geliştirildi. SDK günlükleri, Microsoft'un müşteri tarafından bildirilen sorunları tanılaması için önemli bir araçtır. Bu yeni sınıflar, müşterilerin Konuşma SDK'sı günlüklerini kendi günlük sistemleriyle tümleştirmesini kolaylaştırır.
Tüm programlama dilleri: PronunciationAssessmentConfig artık istenen fone alfabesini (IPA veya SAPI) ve N-Best Telefon me Sayısını ayarlayan özelliklere sahiptir (GitHub sorunu 1284'e göre bir yapılandırma JSON yazma gereğini ortadan kaldırarak). Ayrıca hece düzeyi çıkışı artık desteklenmektedir.
Android, iOS ve macOS (tüm programlama dilleri): Sınırlı bant genişliğine sahiptir ağları desteklemek için GStreamer artık gerekli değildir. SpeechSynthesizer artık metinden konuşma hizmetine akışı yapılan sıkıştırılmış sesin kodunu çözmek için işletim sisteminin ses kod çözme özelliklerini kullanıyor.
Tüm programlama dilleri: SpeechSynthesizer artık canlı akış senaryolarında yaygın olarak kullanılan üç yeni ham çıkış Opus formatını (kapsayıcı olmadan) destekliyor.
JavaScript: Desteklenen sentez seslerinin listesini almak için SpeechSynthesizer'a getVoicesAsync() API eklendi (GitHub sorunu 1350)
JavaScript: PCM olmayan dalga biçimlerini desteklemek için AudioStreamFormat'a getWaveFormat() API'sini eklendi (GitHub sorunu 452)
JavaScript: SpeakerAudioDestination'a birim getter/setter ve mute()/unmute() API'leri eklendi (GitHub sorunu 463)

Hata düzeltmeleri

C++, C#, Java, JavaScript, Objective-C ve Swift: PushAudioInputStream kullanan bir konuşma tanıyıcıyı durdururken 10 saniyelik gecikmeyi kaldırma düzeltmesi. Bu, StopContinuousRecognition çağrıldıktan sonra yeni ses gönderilmediği durum içindir (GitHub sorunları 1318, 331)
Android ve UWP'de Unity: Unity meta dosyaları UWP, Android ARM64 ve Android için Windows Alt Sistemi (WSA) ARM64 için düzeltildi (GitHub sorunu 1360)
iOS: CocoaPods kullanırken Konuşma SDK'sı uygulamanızı herhangi bir iOS Cihazına derleme işlemi düzeltildi (GitHub sorunu 1320)
iOS: SpeechSynthesizer doğrudan hoparlöre ses çıkışı yapmak üzere yapılandırıldığında, nadir durumlarda kayıttan yürütme başlangıçta durdurulur. Bu düzeltildi.
JavaScript: Ses çalışma öğesi bulunamazsa mikrofon girişi için betik işlemci geri dönüşünü kullanın (GitHub sorunu 455)
JavaScript: Sentry tümleştirmesi ile bulunan hatayı azaltmak için aracıya protokol ekleme (GitHub sorunu 465)

Örnekler GitHub

Ayrıntılı tanıma sonuçlarını almayı gösteren C++, C#, Python ve Java örnekleri. Ayrıntılar arasında alternatif tanıma sonuçları, güvenilirlik puanı, Sözcük biçimi, Normalleştirilmiş form, Maskelenmiş Normalleştirilmiş form ve her birinin sözcük düzeyinde zamanlaması bulunur.
Dış ses kaynağı olarak AVFoundation kullanılarak iOS örneği eklendi.
WordBoundary olayını kullanarak SRT (SubRip Text) biçiminin nasıl alıneceğini göstermek için Java örneği eklendi.
Söyleniş Değerlendirmesi için Android örnekleri .
Yeni Tanılama Günlüğü sınıflarının kullanımını gösteren C++, C# .

Konuşma SDK'sı 1.19.0: 2021-Nov sürümü

Önemli Noktalar

Konuşmacı Tanıma hizmeti genel kullanıma sunuldu (GA). Konuşma SDK'sı API'leri C++, C#, Java ve JavaScript'te kullanılabilir. Konuşmacı Tanıma ile konuşmacıları benzersiz ses özelliklerine göre doğru bir şekilde doğrulayabilir ve tanımlayabilirsiniz. Bu konu hakkında daha fazla bilgi için belgelere bakın.
Azure DevOps ve GitHub ile birlikte Ubuntu 16.04 desteğini bıraktık. Ubuntu 16.04, Nisan 2021'de kullanım ömrüne geri döndü. Ubuntu 16.04 iş akışlarınızı Ubuntu 18.04 veya daha yeni bir sürüme geçirin.
Linux ikili dosyalarında OpenSSL bağlantısı dinamik olarak değiştirildi. Linux ikili boyutu yaklaşık %50 azaltıldı.
Mac M1 ARM tabanlı silikon desteği eklendi.

Yeni özellikler

C++/C#/Java: Microsoft Audio Stack ile konuşma girişi için ses işleme desteğini etkinleştirmek üzere yeni API'ler eklendi. Belgeler burada.
C++: Daha gelişmiş desen eşleştirmeyi kolaylaştırmak için amaç tanımaya yönelik yeni API'ler. Buna Liste ve Önceden Oluşturulmuş Tamsayı varlıklarının yanı sıra amaçları ve varlıkları model olarak gruplandırma desteği de dahildir (Belgeler, güncelleştirmeler ve örnekler geliştirme aşamasındadır ve yakın gelecekte yayımlanacaktır).
Mac: GitHub sorunu 1244 ile ilgili CocoaPod, Python, Java ve NuGet paketleri için ARM64 (M1) tabanlı silikon desteği.
iOS/Mac: iOS ve macOS ikili dosyaları artık GitHub sorunu 919 ile ilgili xcframework olarak paketleniyor.
iOS/Mac: GitHub sorunu 1171 ile ilgili Mac katalizör desteği.
Linux: Konuşma SDK'sı Hakkında CentOS7 için yeni tar paketi eklendi. Linux .tar paketi artık içinde lib/centos7-x64RHEL/CentOS 7 için belirli kitaplıklar içeriyor. lib/x64'teki Konuşma SDK'sı kitaplıkları, desteklenen diğer tüm Linux x64 dağıtımları (RHEL/CentOS 8 dahil) için hala geçerlidir ve RHEL/CentOS 7 üzerinde çalışmaz.
JavaScript: VoiceProfile & SpeakerRecognizer API'leri zaman uyumsuz/beklenebilir hale geldi.
JavaScript: ABD kamu Azure bölgeleri için destek eklendi.
Windows: Evrensel Windows Platformu (UWP) üzerinde kayıttan yürütme desteği eklendi.

Hata düzeltmeleri

Android: Android paketleri için OpenSSL güvenlik güncelleştirmesi (sürüm 1.1.1l'e güncelleştirildi).
Python: Python'da konuşmacı cihazı seçmenin başarısız olduğu hata çözüldü.
Çekirdek: Bağlantı girişimi başarısız olduğunda otomatik olarak yeniden bağlan.
iOS: GStreamer kullanırken kararlılık ve bit kodu derleme sorunları nedeniyle iOS paketlerinde ses sıkıştırma devre dışı bırakıldı. Ayrıntılara GitHub sorunu 1209 aracılığıyla ulaşabilirsiniz.

Örnekler GitHub

Mac/iOS: Xcframework paketini kullanmak için örnekler ve hızlı başlangıçlar güncelleştirildi.
.NET: Örnekler .NET core 3.1 sürümünü kullanacak şekilde güncelleştirildi.
JavaScript: Ses Yardımcıları için örnek eklendi.

Konuşma SDK'sı 1.18.0: 2021-Temmuz sürümü

Not: Konuşma SDK'sını buradan kullanmaya başlayın.

Vurgular özeti

Ubuntu 16.04, Nisan 2021'de kullanım ömrüne ulaştı. Azure DevOps ve GitHub ile Eylül 2021'de 16.04 desteğini bırakacağız. Daha önce ubuntu-16.04 iş akışlarını ubuntu-18.04 veya daha yeni bir sürüme geçirin.

Yeni özellikler

C++: Amaç Tanıma ile Basit Dil Deseni eşleştirmesi artık basit amaç tanıma senaryolarının uygulanmasını kolaylaştırıyor.
C++/C#/Java: Bağımsız tanıma senaryoları için Konuşmacı Tanıma kayıt aşamasında geçerli etkinleştirme tümceciklerinin listesini almak için sınıfına yeni bir API GetActivationPhrasesAsync()VoiceProfileClient ekledik.
- Önemli: Konuşmacı Tanıma özelliği Önizleme aşamasındadır. Önizleme'de oluşturulan tüm ses profilleri, Konuşmacı Tanıma özelliği Önizlemeden Genel Kullanılabilirlik'e taşındıktan 90 gün sonra sonlandırılır. Bu noktada Önizleme ses profilleri çalışmayı durdurur.
Python: Mevcut SpeechRecognizer ve TranslationRecognizer nesnelere sürekli Dil Belirleme (LID) desteği eklendi.
Python: Tek seferlik veya sürekli LID (tanıma veya çeviri olmadan) yapmak için adlı SourceLanguageRecognizer yeni bir Python nesnesi eklendi.
JavaScript: getActivationPhrasesAsync Bağımsız tanıma senaryoları için Konuşmacı Tanıma kayıt aşamasında geçerli etkinleştirme tümceciklerinin listesini almak için sınıfına api eklendi VoiceProfileClient .
JavaScript'inVoiceProfileClient API'si enrollProfileAsync artık zaman uyumsuz olarak beklenebilir. Bu bağımsız tanımlama koduna (örneğin, kullanım) bakın.

İyileştirmeler

Java: Birçok Java nesnesine Otomatik Kapatılabilir desteği eklendi. Artık kaynakları serbest bırakmak için kaynaklarla deneme modeli desteklenmektedir. Try-with-resources kullanan bu örneğe bakın. Bu desen hakkında bilgi edinmek için Kaynaklarla deneme Deyimi için Oracle Java belgeleri öğreticisine de bakın.
Birçok platform ve mimari için disk ayak izi önemli ölçüde azaltılmıştır. İkili dosya Microsoft.CognitiveServices.Speech.core örnekleri: x64 Linux 475 KB daha küçüktür (%8,0 azalma); ARM64 Windows UWP 464 KB daha küçüktür (%11,5 azalma); x86 Windows 343 KB daha küçüktür (%17,5 azalma); ve x64 Windows 451 KB daha küçüktür (%19,4 azaltma).

Hata düzeltmeleri

Java: Sentez metni vekil karakterler içerdiğinde sentez hatası düzeltildi. Ayrıntılar burada.
JavaScript: Tarayıcı mikrofonu ses işleme artık kullanım ScriptProcessorNodedışı yerine kullanıyorAudioWorkletNode. Ayrıntılar burada.
JavaScript: Uzun süre çalışan konuşma çevirisi senaryolarında konuşmaları doğru bir şekilde canlı tutun. Ayrıntılar burada.
JavaScript: Sürekli tanımada bir medya akışına yeniden bağlanan tanıyıcı ile ilgili sorun düzeltildi. Ayrıntılar burada.
JavaScript: Sürekli tanımada bir pushStream'e yeniden bağlanan tanıyıcı ile ilgili sorun düzeltildi. Ayrıntılar burada.
JavaScript: Ayrıntılı tanıma sonuçlarında sözcük düzeyi uzaklık hesaplaması düzeltildi. Ayrıntılar burada.

Örnekler

Java hızlı başlangıç örnekleri burada güncelleştirildi.
JavaScript Konuşmacı Tanıma örnekleri yeni kullanımını enrollProfileAsync()gösterecek şekilde güncelleştirildi. Buradaki örneklere bakın.

Konuşma SDK'sı 1.17.0: 2021-Mayıs sürümü

Not

Burada Konuşma SDK'sını kullanmaya başlayın.

Vurgular özeti

Daha küçük ayak izi - Konuşma SDK'sının ve bileşenlerinin belleğini ve disk ayak izini azaltmaya devam ediyoruz.
Yeni bir tek başına Dil Belirleme API'si, hangi dilin konuşulmakta olduğunu tanımanıza olanak tanır.
macOS üzerinde Unity kullanarak konuşma özellikli karma gerçeklik ve oyun uygulamaları geliştirin.
Artık Go programlama dilinden konuşma tanımaya ek olarak Metin okuma özelliğini de kullanabilirsiniz.
Değerli müşterilerimiz olan SİSTE'nin GitHub'da bayrak eklemesine neden olan sorunları çözmek için çeşitli Hata düzeltmeleri! TEŞEKKÜR EDERİZ! Geri bildirimlerinizi almaya devam edin!

Yeni özellikler

C++/C#: API aracılığıyla SourceLanguageRecognizer yeni tek başına Başlangıç ve Sürekli Dil Algılama. Yalnızca ses içeriğinde konuşulan dilleri algılamak istiyorsanız, bunu yapmak için API'dir. C++ ve C# için ayrıntılara bakın.
C++/C#: Konuşma Tanıma ve Çeviri Tanıma artık hem başlangıç hem de sürekli Dil Belirleme desteğine sahip olduğundan, hangi dillerin yazılmadan veya çevrilmeden önce konuşulmakta olduğunu program aracılığıyla belirleyebilirsiniz. Konuşma Tanıma için buraya ve Konuşma Çevirisi için buraya bakın.
C#: macOS'a Unity desteği eklendi (x64). Bu, karma gerçeklik ve oyunlarda konuşma tanıma ve konuşma sentezi kullanım örneklerinin kilidini açar!
Git: Konuşma sentezini daha da fazla kullanım örneğinde kullanılabilir hale getirmek için Go programlama diline konuşma sentezi metni desteği ekledik. Hızlı başlangıcımıza veya başvuru belgelerimize bakın.
C++/C#/Java/Python/Objective-C/Go: Konuşma sentezleyici artık nesneyi destekliyor connection . Bu, Konuşma hizmeti bağlantısını yönetmenize ve izlemenize yardımcı olur ve özellikle gecikme süresini azaltmak için önceden bağlanmanıza yardımcı olur. Buradaki belgelere bakın.
C++/C#/Java/Python/Objective-C/Go: Konuşma sentezi gecikmesi sorunlarını izlemenize ve tanılamanıza yardımcı olmak için artık gecikme süresini ve yetersiz çalıştırma süresini SpeechSynthesisResult kullanıma sunun. C++, C#, Java, Python, Objective-C ve Go ayrıntılarına bakın.
C++/C#/Java/Python/Objective-C: Kullanılacak sesi belirtmediğinizde artık metin okuma özelliği varsayılan olarak sinir seslerini kullanıyor. Bu, varsayılan olarak daha yüksek aslına uygunluk çıkışı sağlar, ancak varsayılan fiyatı da artırır. Varsayılanı değiştirmek için 70'in üzerinde standart sesimizi veya 130'un üzerinde nöral sesimizi belirtebilirsiniz.
C++/C#/Java/Python/Objective-C/Go: Cinsiyete göre sesleri seçmeyi kolaylaştırmak için sentez ses bilgilerine bir Gender özelliği ekledik. Bu, GitHub sorunu #1055'i giderir.
C++, C#, Java, JavaScript: Artık retrieveEnrollmentResultAsyncbelirli bir hesabın tüm ses profillerinin kullanıcı yönetimini kolaylaştırmak için Konuşmacı Tanıma'da , getAuthorizationPhrasesAsyncve getAllProfilesAsync() desteklenmektedir. C++, C#, Java, JavaScript belgelerine bakın. Bu, GitHub sorunu #338'i giderir.
JavaScript: JavaScript tabanlı konuşma uygulamalarınızı daha sağlam hale getirecek bağlantı hataları için yeniden deneme ekledik.

İyileştirmeler

Linux ve Android Konuşma SDK'sı ikili dosyaları, OpenSSL'nin en son sürümünü (1.1.1k) kullanacak şekilde güncelleştirildi
Kod Boyutu geliştirmeleri:
- Language Understanding artık ayrı bir "lu" kitaplığına ayrılmıştır.
- Windows x64 çekirdek ikili boyutu %14,4 azaldı.
- Android ARM64 çekirdek ikili boyutu %13,7 azaldı.
- diğer bileşenlerin boyutu da azaldı.

Hata düzeltmeleri

Tümü: ServiceTimeout için GitHub sorunu #842 düzeltildi. Artık konuşma SDK'sını kullanarak uzun ses dosyalarının dökümünü alabilirsiniz; hizmet bağlantısı bu hatayla sonlanır. Ancak, uzun dosyalar için toplu transkripsiyon kullanmanızı öneririz.
C#: Hiçbir konuşma girişinin uygulamanızı kötü durumda bırakmadığı GitHub sorunu #947 düzeltildi.
Java: DialogService Bağlan veya ağ bağlantısı veya geçersiz abonelik anahtarı olmadan Java 1.16 için Konuşma SDK'sının kilitlenmesi sorunu #997 düzeltildi.
Konuşma tanımayı (örneğin, konsol uygulamasında CTRL+C kullanarak) aniden durdurduğu zaman meydana gelen kilitlenme düzeltildi.
Java: Java için Konuşma SDK'sı kullanılırken Windows'ta geçici dosyaları silmeye yönelik bir düzeltme eklendi.
Java: Çağrının DialogServiceConnector.stopListeningAsync hataya neden olabileceği GitHub sorunu #994 düzeltildi.
Java: Sanal yardımcı hızlı başlangıcında müşteri sorunu düzeltildi.
JavaScript: 'this.cancelSpeech bir işlev değil' hatası veren ConversationTranslator GitHub sorunu #366 düzeltildi.
JavaScript: 'Bellek içi akış sonucu alma' örneğinin yüksek sesle çalınmasıyla ilgili GitHub sorunu #298 düzeltildi.
JavaScript: Çağrının AudioConfig 'ReferenceError: MediaStream tanımlanmamış' sonucuna neden olabileceği GitHub sorunu #350 düzeltildi.
JavaScript: uzun süre çalışan oturumlar için Node.js unhandledPromiseRejection uyarısı düzeltildi.

Örnekler

Burada macOS için Unity örnekleri belgeleri güncelleştirildi.
Azure AI Konuşma tanıma hizmeti için React Native örneği artık burada kullanılabilir.

Konuşma SDK'sı 1.16.0: 2021-Mart sürümü

Not

Windows'da Konuşma SDK'sı, paylaşılan Microsoft Visual Studio için Visual C++ Yeniden Dağıtılabilir 2015, 2017 ve 2019'a bağlıdır. Buradan indirin.

Yeni özellikler

C++/C#/Java/Python: Windows, Linux ve Android'de herhangi bir medya biçimini dönüştürme desteği eklemek için GStreamer'ın en son sürümüne (1.18.3) taşındı. Buradaki belgelere bakın.
C++/C#/Java/Objective-C/Python: SDK'ya sıkıştırılmış TTS/sentezlenmiş ses kodunu çözme desteği eklendi. Çıkış ses biçimini PCM olarak ayarlarsanız ve sisteminizde GStreamer kullanılabilir durumdaysa, SDK bant genişliğini kaydetmek ve istemcideki sesin kodunu çözmek için otomatik olarak hizmetten sıkıştırılmış ses ister. Bu özelliği devre dışı bırakmak için olarak ayarlayabilirsiniz SpeechServiceConnection_SynthEnableCompressedAudioTransmissionfalse . C++, C#, Java, Objective-C, Python için ayrıntılar.
JavaScript: Node.js kullanıcılar artık API'yi AudioConfig.fromWavFileInputkullanabilir. Bu, GitHub sorunu #252'ye gider.
C++/C#/Java/Objective-C/Python: Kullanılabilir tüm sentez seslerini döndürmek için TTS yöntemi eklendi GetVoicesAsync() . C++, C#, Java, Objective-C ve Python için ayrıntılar.
C++/C#/Java/JavaScript/Objective-C/Python: Zaman uyumlu viseme animasyonu döndürmek için TTS/konuşma sentezi için olay eklendi VisemeReceived . Buradaki belgelere bakın.
C++/C#/Java/JavaScript/Objective-C/Python: TTS için olay eklendi BookmarkReached . Giriş SSML'sinde yer işaretleri ayarlayabilir ve her yer işareti için ses uzaklıklarını alabilirsiniz. Buradaki belgelere bakın.
Java: Konuşmacı Tanıma API'leri için destek eklendi. Ayrıntılar burada.
C++/C#/Java/JavaScript/Objective-C/Python: TTS için WebM kapsayıcısıyla iki yeni çıkış ses biçimi eklendi (Webm16Khz16BitMonoOpus ve Webm24Khz16BitMonoOpus). Bunlar Opus codec bileşeniyle ses akışı için daha iyi biçimlerdir. C++, C#, Java, JavaScript , Objective-C, Python için ayrıntılar.
C++/C#/Java: Konuşmacı Tanıma senaryosu için ses profili alma desteği eklendi. C++, C# ve Java için ayrıntılar.
C++/C#/Java/Objective-C/Python: Ses mikrofonu ve hoparlör denetimi için ayrı paylaşılan kitaplık desteği eklendi. Bu, geliştiricinin gerekli ses kitaplığı bağımlılıklarına sahip olmayan ortamlarda SDK'yi kullanmasına olanak tanır.
Objective-C/Swift: Şemsiye üst bilgisine sahip modül çerçevesi desteği eklendi. Bu, geliştiricinin Konuşma SDK'sını iOS/Mac Objective-C/Swift uygulamalarında modül olarak içeri aktarmasına olanak tanır. Bu, GitHub sorunu #452'ye gider.
Python: Python 3.9 desteği eklendi ve Python'ın 3.5 için kullanım ömrü sonu başına Python 3.5 desteği bırakıldı.

Bilinen sorunlar

C++/C#/Java: DialogServiceConnector Özel Komutlar uygulamasına erişmek için a kullanamaz CustomCommandsConfig ve bunun yerine bağlantı hatasıyla karşılaşır. Bu, ile config.SetServiceProperty("X-CommandsAppId", "your-application-id", ServicePropertyChannel.UriQueryParameter)isteğe uygulama kimliğinizi el ile ekleyerek geçici bir çözüm olabilir. beklenen davranışı CustomCommandsConfig bir sonraki sürümde geri yüklenir.

İyileştirmeler

Konuşma SDK'sının bellek kullanımını ve disk ayak izini azaltmaya yönelik çoklu sürüm çalışmalarımızın bir parçası olarak Android ikili dosyaları artık %3 ile %5 arasında daha küçük.
Burada C# başvuru belgelerimizin doğruluk, okunabilirlik ve ayrıca bkz. bölümleri geliştirildi.

Hata düzeltmeleri

JavaScript: Büyük WAV dosya üst bilgileri artık doğru ayrıştırılıyor (üst bilgi dilimini 512 bayta yükseltir). Bu, GitHub sorunu #962'ye gider.
JavaScript: Mikrofon akışının tanımayı durdurmadan önce bitmesi durumunda mikrofon zamanlama sorunu düzeltildi ve Konuşma Tanıma'nın Firefox'ta çalışmaması sorunu giderildi.
JavaScript: Tarayıcı turnOn tamamlanmadan önce mikrofonu kapatmaya zorladığında başlatma sözünü doğru şekilde ele alıyoruz.
JavaScript: URL bağımlılığını url ayrıştırma ile değiştirdik. Bu, GitHub sorunu #264'e gider.
Android: True olarak ayarlandığında geri çağırmaların çalışmaması minifyEnabled düzeltildi.
C++/C#/Java/Objective-C/Python: TCP_NODELAY gecikme süresini azaltmak için TTS için temel yuva GÇ'ye doğru şekilde ayarlanır.
C++/C#/Java/Python/Objective-C/Go: Tanıma başlatıldıktan hemen sonra tanıyıcı yok edildiğinde zaman zaman karşılaşılan bir kilitlenme düzeltildi.
C++/C#/Java: Konuşmacı tanıyıcının yok edilmesinde zaman zaman oluşan bir kilitlenme düzeltildi.

Örnekler

JavaScript: Tarayıcı örnekleri artık ayrı JavaScript kitaplık dosyası indirme gerektirmez.

Konuşma SDK'sı 1.15.0: 2021-Ocak sürümü

Not

Windows'da Konuşma SDK'sı, paylaşılan Microsoft Visual Studio için Visual C++ Yeniden Dağıtılabilir 2015, 2017 ve 2019'a bağlıdır. Buradan indirin.

Vurgular özeti

Daha küçük bellek ve disk ayak izi, SDK'nın daha verimli hale getirilmesini sağlar.
Özel sinirsel ses özel önizlemesi için daha yüksek aslına uygunluk çıkış biçimleri kullanılabilir.
Amaç Tanıyıcı artık en önemli amaçtan daha fazla geri dönüş elde edebilir ve böylece müşterinizin amacı hakkında ayrı bir değerlendirme yapabilirsiniz.
Sesli yardımcıları ve botları ayarlamak artık daha kolaydır ve dinlemeyi hemen durdurmasını sağlayabilir ve hatalara nasıl yanıt verdiği üzerinde daha fazla denetim gerçekleştirebilirsiniz.
Sıkıştırmayı isteğe bağlı hale getirerek cihaz performansı geliştirildi.
Windows ARM/ARM64'te Konuşma SDK'sını kullanın.
Düşük düzey hata ayıklama iyileştirildi.
Söyleniş Değerlendirmesi özelliği artık daha yaygın olarak kullanılabilir.
Değerli müşterilerimiz olan SİSTE'nin GitHub'da bayrak eklemesine neden olan sorunları çözmek için çeşitli Hata düzeltmeleri! TEŞEKKÜR EDERİZ! Geri bildirimlerinizi almaya devam edin!

İyileştirmeler

Konuşma SDK'sı artık daha verimli ve hafiftir. Konuşma SDK'sının bellek kullanımını ve disk ayak izini azaltmak için çok sürümlü bir çalışma başlattık. İlk adım olarak çoğu platformdaki paylaşılan kitaplıklarda önemli dosya boyutu azaltmaları yaptık. 1.14 sürümüyle karşılaştırıldığında:
- 64 bit UWP uyumlu Windows kitaplıkları yaklaşık %30 daha küçüktür.
- 32 bit Windows kitaplıkları henüz boyut geliştirmesi görmüyor.
- Linux kitaplıkları %20-25 daha küçüktür.
- Android kitaplıkları %3-5 daha küçüktür.

Yeni özellikler

Tümü: TTS konuşma sentezi API'si aracılığıyla özel sinir sesinin özel önizlemesi için kullanılabilecek yeni 48 KHz çıkış biçimleri: Audio48Khz192KBitRateMonoMp3, audio-48khz-192kbitrate-mono-mp3, Audio48Khz96KBitRateMonoMp3, audio-48khz-96kbitrate-mono-mp3, Raw48Khz16BitMonoPcm, raw-48khz-16bit-mono-pcm, Riff48Khz16BitMonoPcm, riff-48khz-16bit-mono-pcm.
Tümü: Özel sesi kullanmak da daha kolaydır. (C++, C#, Java, JavaScript, Objective-C, Python) aracılığıyla EndpointId özel ses ayarlama desteği eklendi. Bu değişiklik öncesinde özel ses kullanıcılarının yöntemi aracılığıyla uç nokta URL'sini ayarlaması FromEndpoint gerekiyordu. Müşteriler artık yöntemini önceden oluşturulmuş sesler gibi kullanabilir FromSubscription ve ardından ayarını EndpointIdyaparak dağıtım kimliğini sağlayabilir. Bu, özel sesleri ayarlamayı kolaylaştırır.
C++/C#/Java/Objective-C/Python: En önemli amaçtanIntentRecognizer fazlasını alın. Artık uri parametresini kullanarak verbose=true yöntem aracılığıyla LanguageUnderstandingModel FromEndpoint yalnızca en iyi puanlama amacını değil, tüm amaçları içeren JSON sonucunu yapılandırmayı destekliyor. Bu, GitHub sorunu #880'i giderir. Burada güncelleştirilmiş belgelere bakın.
C++/C#/Java: Sesli yardımcınızın veya botunuzun dinlemeyi hemen durdurmasını sağlayın. DialogServiceConnector(C++, C#, Java) artık ile birlikte ListenOnceAsync()bir yöntemi vardırStopListeningAsync(). Bu, ses yakalamayı hemen durdurur ve bir sonucu düzgün bir şekilde bekler ve "şimdi durdur" düğmesine basma senaryolarında kullanmak için mükemmel hale getirir.
C++/C#/Java/JavaScript: Ses yardımcınızın veya botunuzun temel sistem hatalarına daha iyi tepki göstermesini sağlayın. DialogServiceConnector (C++, C#, Java, JavaScript) artık yeni TurnStatusReceived bir olay işleyicisi var. Bu isteğe bağlı olaylar Bot'ta her ITurnContext çözünürlüğe karşılık gelir ve bunlar gerçekleştiğinde, örneğin Direct Line Speech ile bot arasında işlenmeyen bir özel durum, zaman aşımı veya ağ bırakması nedeniyle dönüş yürütme hatalarını bildirir. TurnStatusReceived hata koşullarına yanıt vermeyi kolaylaştırır. Örneğin, bir bot arka uç veritabanı sorgusunda (örneğin, bir ürün ararken) TurnStatusReceived çok uzun sürüyorsa, istemcinin "ne yazık ki tam olarak bunu alamadım, lütfen yeniden deneyebilir misiniz" veya benzer bir şeyle yeniden üretmesini sağlar.
C++/C#: Konuşma SDK'sını daha fazla platformda kullanın. Konuşma SDK'sı NuGet paketi artık Konuşma SDK'sını daha fazla makine türünde daha kullanışlı hale getirmek için Windows ARM/ARM64 masaüstü yerel ikili dosyalarını (UWP zaten destekleniyordu) destekliyor.
Java: DialogServiceConnector Artık daha önce kasıtsız olarak dilden dışlanan bir setSpeechActivityTemplate() yönteme sahip. Bu, özelliğin ayarlanmasına Conversation_Speech_Activity_Template eşdeğerdir ve Direct Line Speech hizmetinden kaynaklanan gelecekteki tüm Bot Framework etkinliklerinin sağlanan içeriği JSON yükleriyle birleştirmesini istemektedir.
Java: Geliştirilmiş düşük düzeyli hata ayıklama. Sınıfın Connection artık diğer programlama dillerine (C++, C#) benzer bir MessageReceived olayı vardır. Bu olay hizmetten gelen verilere düşük düzeyde erişim sağlar ve tanılama ve hata ayıklama için yararlı olabilir.
JavaScript: Artık özel hizmet konumlarının kullanımını basitleştiren ve özellikleri el ile ayarlamaya kıyasla fabrika yöntemlerine sahip fromHost() olan Ve aracılığıyla BotFrameworkConfigSes Yardımcıları ve fromEndpoint() botlar için daha kolay kurulum. Ayrıca isteğe bağlı belirtimini botId yapılandırma fabrikaları genelinde varsayılan olmayan bir bot kullanmak için standartlaştırdık.
JavaScript: Websocket sıkıştırması için eklenen dize denetimi özelliğiyle cihaz performansı geliştirildi. Performans nedeniyle websocket sıkıştırmasını varsayılan olarak devre dışı bırakılmıştır. Bu, düşük bant genişliği senaryoları için yeniden kullanılabilir. Diğer ayrıntıları burada bulabilirsiniz. Bu, GitHub sorunu #242'ye gider.
JavaScript: Konuşma söylenişinin değerlendirilmesi için lPronunciation Assessment desteği eklendi. Buradaki hızlı başlangıç bölümüne bakın.

Hata düzeltmeleri

Tümü (JavaScript hariç): Tanıyıcı tarafından çok fazla bellek ayrıldığı sürüm 1.14'teki bir regresyon düzeltildi.
C++: GitHub sorunu #794 ile ilgili bir çöp toplama sorunu DialogServiceConnectordüzeltildi.
C#: Nesnelerin atıldığında yaklaşık bir saniye boyunca engellenmesine neden olan iş parçacığı kapatma sorunu düzeltildi.
C++/C#/Java: Bir uygulamanın üzerinde konuşma yetkilendirme belirtecini veya etkinlik şablonunu birden çok kez ayarlamasını engelleyen özel DialogServiceConnectordurum düzeltildi.
C++/C#/Java: Yırtılma durumundaki bir yarış durumu nedeniyle bir tanıyıcı kilitlenmesi düzeltildi.
JavaScript: DialogServiceConnector Daha önce 'nin fabrikalarında BotFrameworkConfigbelirtilen isteğe bağlı botId parametreye saygı göstermiyor. Bu, sorgu dizesi parametresinin botId varsayılan olmayan bir bot kullanacak şekilde el ile ayarlanmasını gerekli hale getirdi. Hata düzeltildi ve botId fabrikalara BotFrameworkConfigsağlanan değerler, yeni fromHost() ve eklemeler de dahil olmak üzere kabul edilecek ve fromEndpoint() kullanılacaktır. Bu, parametresi için applicationIdCustomCommandsConfigde geçerlidir.
JavaScript: Tanıyıcı nesnesinin yeniden kullanımına izin veren GitHub sorunu #881 düzeltildi.
JavaScript: SKD'nin bir TTS oturumunda birden çok kez göndererek bant genişliğini boşa harcaması speech.config sorunu düzeltildi.
JavaScript: Kullanıcı tarayıcılarında mikrofon girişine izin vermediğinde daha açıklayıcı bir iletinin kabarmasına olanak tanıyarak mikrofon yetkilendirmesinde basitleştirilmiş hata işleme.
JavaScript: Tür hatalarının ConversationTranslator type in ve neden olduğu Ve ConversationTranscriber TypeScript kullanıcıları için derleme hatasına neden olan GitHub sorunu #249 düzeltildi.
Objective-C: Xcode 11.4 üzerinde IOS için GStreamer derlemesi başarısız olduğunda GitHub sorunu #911'i gideren bir sorun düzeltildi.
Python: "DeprecationWarning: imp modülü importlib yerine kullanım dışı bırakıldı" kaldırılarak GitHub sorunu #870 düzeltildi.

Örnekler

JavaScript tarayıcısı için dosyadan örneği artık konuşma tanıma için dosyaları kullanıyor. Bu, GitHub sorunu #884'e gider.

Konuşma SDK'sı 1.14.0: 2020-Ekim sürümü

Not

Windows'da Konuşma SDK'sı, paylaşılan Microsoft Visual Studio için Visual C++ Yeniden Dağıtılabilir 2015, 2017 ve 2019'a bağlıdır. Buradan indirin.

Yeni özellikler

Linux: Debian 10 ve Ubuntu 20.04 LTS desteği eklendi.
Python/Objective-C: API için KeywordRecognizer destek eklendi. Belgeler burada olacaktır.
C++/Java/C#: aracılığıyla ServicePropertyChannel::HttpHeaderherhangi bir HttpHeader anahtar/değer ayarlamak için destek eklendi.
JavaScript: API için ConversationTranscriber destek eklendi. Buradaki belgeleri okuyun.
C++/C#: Yeni AudioDataStream FromWavFileInput yöntem eklendi (okumak için). WAV dosyaları) buraya (C++) ve buraya (C#).
C++/C#/Java/Python/Objective-C/Swift: Konuşma sentezine metinleri durdurmak için bir stopSpeakingAsync() yöntem eklendi. Başvuru belgelerini buradan (C++), buradan (C#), buradan (Java), buradan (Python)ve buradan (Objective-C/Swift) okuyun.
C#, C++, Java: sınıfına Connection için bağlantı ve bağlantı kesme olaylarını izlemek için DialogServiceConnectorkullanılabilecek bir FromDialogServiceConnector() işlev eklendi. Başvuru belgelerini buradan (C#), buradan (C++) ve buradan (Java) okuyun.
C++/C#/Java/Python/Objective-C/Swift: Konuşma söylenişini değerlendiren ve konuşmacılara konuşulan sesin doğruluğu ve akıcılığı hakkında geri bildirim sağlayan Söyleniş Değerlendirmesi desteği eklendi. Belgeleri buradan okuyun.

Hataya neden olan değişiklik

JavaScript: PullAudioOutputStream.read() iç Promise yerine Yerel JavaScript Promise dönüş türü değişikliğine sahiptir.

Hata düzeltmeleri

Tümü: Belirli özel karakterlere sahip değerlerin yoksayıldığı 1,13 regresyonu SetServiceProperty düzeltildi.
C#: Visual Studio 2019'daki Windows konsol örneklerinin yerel DLL'leri bulamaması düzeltildi.
C#: Akış giriş olarak KeywordRecognizer kullanılıyorsa bellek yönetimiyle ilgili kilitlenme düzeltildi.
ObjectiveC/Swift: Akış, tanıyıcı girişi olarak kullanılıyorsa bellek yönetimiyle ilgili kilitlenme düzeltildi.
Windows: UWP üzerinde BT HFP/A2DP ile birlikte bulunma sorunu düzeltildi.
JavaScript: Günlüğe kaydetmeyi geliştirmek ve iç hata ayıklama/hizmet bağıntılarına yardımcı olmak için oturum kimliklerinin eşlemesi düzeltildi.
JavaScript: İlk çağrı yapıldıktan sonra çağrıları ListenOnce devre dışı bırakmak için DialogServiceConnector düzeltme eklendi.
JavaScript: Sonuç çıkışının yalnızca "basit" olması sorunu düzeltildi.
JavaScript: macOS üzerinde Safari'de sürekli tanıma sorunu düzeltildi.
JavaScript: Yüksek istek aktarım hızı senaryosu için CPU yükü azaltma.
JavaScript: Ses Profili Kaydı sonucunun ayrıntılarına erişime izin verin.
JavaScript: içinde IntentRecognizersürekli tanıma için düzeltme eklendi.
C++/C#/Java/Python/Swift/ObjectiveC: içindeki IntentRecognizeraustraliaeast ve brazilsouth için yanlış URL düzeltildi.
C++/C#: Nesne oluşturulurken VoiceProfile bağımsız değişken olarak eklenirVoiceProfileType.
C++/C#/Java/Python/Swift/ObjectiveC: Belirli bir konumdan okumaya AudioDataStream çalışırken olası bir durum SPX_INVALID_ARG düzeltildi.
IOS: Unity'de konuşma tanıma ile kilitlenme düzeltildi

Örnekler

ObjectiveC: Anahtar sözcük tanıma için buraya örnek eklendi.
C#/JavaScript: Konuşma transkripsiyonu için buraya (C#) ve buraya (JavaScript) hızlı başlangıç eklendi.
C++/C#/Java/Python/Swift/ObjectiveC: Söyleniş Değerlendirmesi için buraya örnek eklendi
Xamarin: Hızlı başlangıç buradan en son Visual Studio şablonuna güncelleştirildi.

Bilinen Sorun

HoloLens 2 ve Android 4.4'te (KitKat) DigiCert Genel Kök G2 sertifikası varsayılan olarak desteklenmez ve Konuşma SDK'sını işlevsel hale getirmek için sisteme eklenmesi gerekir. Sertifika yakın gelecekte HoloLens 2 işletim sistemi görüntülerine eklenecektir. Android 4.4 müşterilerinin güncelleştirilmiş sertifikayı sisteme eklemesi gerekir.

COVID-19 kısaltılmış test

Son birkaç hafta içinde uzaktan çalışma nedeniyle normalde yaptığımız kadar el ile doğrulama testi yapamadık. Herhangi bir şeyi bozabileceğini düşündüğümüz hiçbir değişiklik yapmadık ve otomatikleştirilmiş testlerimizin hepsi geçti. Bir şeyi kaçırma ihtimalimiz düşükse lütfen GitHub'dan bize bildirin.
Sağlıklı kalın!

Konuşma SDK'sı 1.13.0: 2020-Temmuz sürümü

Not

Windows'da Konuşma SDK'sı, paylaşılan Microsoft Visual Studio için Visual C++ Yeniden Dağıtılabilir 2015, 2017 ve 2019'a bağlıdır. Buradan indirip yükleyin.

Yeni özellikler

C#: Zaman uyumsuz konuşma transkripsiyonu desteği eklendi. Buradaki belgelere bakın.
JavaScript: Hem tarayıcı hem de Node.js için Konuşmacı Tanıma desteği eklendi.
JavaScript: Dil Belirleme/dil kimliği desteği eklendi. Buradaki belgelere bakın.
Objective-C: Çok cihazlı konuşma ve konuşma transkripsiyonu desteği eklendi.
Python: Windows ve Linux üzerinde Python için sıkıştırılmış ses desteği eklendi. Buradaki belgelere bakın.

Hata düzeltmeleri

Tümü: KeywordRecognizer'ın bir tanımadan sonra akışları ileri taşımamasına neden olan bir sorun düzeltildi.
Tümü: KeywordRecognitionResult'tan alınan akışın anahtar sözcüğü içermesine neden olan bir sorun düzeltildi.
Tümü: Kullanıcılar beklemeyi bitirdikten sonra SendMessageAsync'in iletiyi kablo üzerinden göndermemesi sorunu düzeltildi.
Tümü: Kullanıcılar VoiceProfileClient::SpeakerRecEnrollProfileAsync yöntemini birden çok kez çağırdığında ve çağrıların bitmesini beklemediğinde Konuşmacı Tanıma API'lerindeki kilitlenme düzeltildi.
Tümü: VoiceProfileClient ve SpeakerRecognizer sınıflarında dosya günlüğünü etkinleştirme düzeltildi.
JavaScript: Tarayıcı simge durumuna küçültüldüğünde azaltmayla ilgili bir sorun düzeltildi.
JavaScript: Akışlarda bellek sızıntısıyla ilgili bir sorun düzeltildi.
JavaScript: NodeJS'den OCSP yanıtları için önbelleğe alma eklendi.
Java: BigInteger alanlarının her zaman 0 döndürmesine neden olan bir sorun düzeltildi.
iOS: iOS App Store'da Konuşma SDK'sı tabanlı uygulamalar yayımlamayla ilgili bir sorun düzeltildi.

Örnekler

C++: Konuşmacı Tanıma için buraya örnek kod eklendi.

COVID-19 kısaltılmış test

Konuşma SDK'sı 1.12.1: 2020-Haziran sürümü

Yeni özellikler

C#, C++: Konuşmacı Tanıma Önizlemesi: Bu özellik konuşmacı belirleme (kim konuşuyor?) ve konuşmacı doğrulaması (iddia ettikleri konuşmacı mı?) sağlar. Genel bir bakışla başlayın, Konuşmacı Tanıma temel bilgileri makalesini veya API başvuru belgelerini okuyun.

Hata düzeltmeleri

C#, C++: Hoparlör Tanıma'da mikrofon kaydı 1.12'de çalışmıyordu.
JavaScript: Firefox'ta Metin okuma ve macOS ve iOS'ta Safari için düzeltmeler.
Sekiz kanallı akış kullanılırken konuşma transkripsiyonunda Windows uygulama doğrulayıcı erişim ihlali kilitlenmesi için düzeltme.
Çok cihazlı konuşma çevirisinde Windows uygulama doğrulayıcı erişim ihlali kilitlenmesi için düzeltme.

Örnekler

C#: Konuşmacı Tanıma için kod örneği .
C++: Konuşmacı Tanıma için kod örneği .
Java: Android'de amaç tanıma için kod örneği .

COVID-19 kısaltılmış test

Konuşma SDK'sı 1.12.0: 2020-Mayıs sürümü

Yeni özellikler

Git: Konuşma Tanıma ve özel ses yardımcısı için Yeni Go dil desteği. Geliştirme ortamınızı burada ayarlayın. Örnek kod için aşağıdaki Örnekler bölümüne bakın.
JavaScript: Metin okuma için Tarayıcı desteği eklendi. Buradaki belgelere bakın.
C++, C#, Java: Windows, Android, Linux ve iOS platformlarında desteklenen yeni KeywordRecognizer nesne ve API'ler. Belgeleri buradan okuyun. Örnek kod için aşağıdaki Örnekler bölümüne bakın.
Java: Çeviri desteğine sahip çok cihazlı konuşma eklendi. Başvuru belgesine buradan bakın.

İyileştirmeler ve İyileştirmeler

JavaScript: Konuşma tanıma doğruluğunu geliştiren iyileştirilmiş tarayıcı mikrofonu uygulaması.
Java: SWIG olmadan doğrudan JNI uygulaması kullanılarak yeniden düzenlenmiş bağlamalar. Bu değişiklik, Windows, Android, Linux ve Mac için kullanılan tüm Java paketleri için bağlama boyutunu 10 kat azaltır ve Konuşma SDK'sı Java uygulamasının daha fazla geliştirilmesini kolaylaştırır.
Linux: En son RHEL 7'ye özgü notlarla güncelleştirilmiş destek belgeleri .
Hizmet ve ağ hataları oluştuğunda birden çok kez bağlanmayı deneyecek şekilde geliştirilmiş bağlantı mantığı.
Geliştiricilerin Azure AI Konuşma yolculuğunda bir sonraki adıma geçmelerine yardımcı olmak için portal.azure.com Konuşma Hızlı Başlangıç sayfası güncelleştirildi.

Hata düzeltmeleri

C#, Java: Linux ARM'de (hem 32 bit hem de 64 bit) SDK kitaplıklarını yüklemeyle ilgili bir sorun düzeltildi.
C#: TranslationRecognizer, IntentRecognizer ve Bağlan ion nesneleri için yerel tanıtıcıların açıkça atılması düzeltildi.
C#: ConversationTranscriber nesnesi için ses girişi yaşam süresi yönetimi düzeltildi.
Basit ifadelerdeki amaçlar tanınırken sonuç nedeninin düzgün ayarlanmaması sorunu IntentRecognizer düzeltildi.
Sonuç uzaklığının SpeechRecognitionEventArgs doğru ayarlanmaması sorunu düzeltildi.
SDK'nın websocket bağlantısını açmadan önce ağ iletisi göndermeye çalıştığı yarış durumu düzeltildi. Katılımcı eklerken için TranslationRecognizer yeniden üretilebilirdi.
Anahtar sözcük tanıma altyapısındaki bellek sızıntıları düzeltildi.

Örnekler

Git: Konuşma tanıma ve özel ses yardımcısı için hızlı başlangıçlar eklendi. Örnek kodu burada bulabilirsiniz.
JavaScript: Metne konuşma, Çeviri ve Amaç Tanıma için hızlı başlangıçlar eklendi.
C# ve Java (Android) için anahtar sözcük tanıma örnekleri.

COVID-19 kısaltılmış test

Son birkaç hafta içinde uzaktan çalışma nedeniyle normalde yaptığımız kadar el ile doğrulama testi yapamadık. Herhangi bir şeyi bozabileceğini düşündüğümüz hiçbir değişiklik yapmadık ve otomatikleştirilmiş testlerimizin hepsi geçti. Bir şeyi kaçırdıysak lütfen GitHub'dan bize bildirin.
Sağlıklı kalın!

Konuşma SDK'sı 1.11.0: 2020-Mart sürümü

Yeni özellikler

Linux: Red Hat Enterprise Linux (RHEL)/CentOS 7 x64 desteği eklendi ve sistemin Konuşma SDK'sı için nasıl yapılandırılma yönergeleri eklendi.
Linux: Linux ARM32 ve ARM64 üzerinde .NET Core C# desteği eklendi. Daha fazla bilgi için buraya bakabilirsiniz.
C#, C++: tüm ara bileşenlerde tutarlı bir kimlik ve son konuşma tanıma sonucuna eklendi UtteranceIdConversationTranscriptionResult. C#, C++ için ayrıntılar.
Python: için Language IDdestek eklendi. Bkz. GitHub deposundaki speech_sample.py.
Windows: Tüm win32 konsol uygulamaları için Windows platformunda sıkıştırılmış ses giriş biçimi desteği eklendi. Ayrıntılar burada.
JavaScript: NodeJS'de konuşma sentezi (metin okuma) desteği. Buradan daha fazla bilgi edinin.
JavaScript: Tüm gönderilen ve alınan iletilerin denetlenebilmesi için yeni API'ler ekleyin. Buradan daha fazla bilgi edinin.

Hata düzeltmeleri

C#, C++: İkili iletinin ikili tür olarak gönderebilmesine neden olan bir sorun SendMessageAsync düzeltildi. C#, C++ için ayrıntılar.
C#, C++: Nesneden önce Connection atılırsa Recognizer olayın kullanılması Connection MessageReceived kilitlenmeye neden olabilen bir sorun düzeltildi. C#, C++ için ayrıntılar.
Android: Gecikme süresini artırmak için mikrofondan ses arabelleği boyutu 800 ms'den 100 ms'ye düştü.
Android: Android Studio'da x86 Android öykünücüsü ile ilgili bir sorun düzeltildi.
JavaScript: API ile fromSubscription Çin'deki Bölgeler için destek eklendi. Ayrıntılar burada.
JavaScript: NodeJS'den bağlantı hataları için daha fazla hata bilgisi ekleyin.

Örnekler

Unity: Luis json içeri aktarmanın başarısız olduğu amaç tanıma genel örneği düzeltildi. Ayrıntılar burada.
Python: için Language IDörnek eklendi. Ayrıntılar burada.

Covid19 kısaltılmış test: Son birkaç hafta içinde uzaktan çalışma nedeniyle normalde yaptığımız kadar el ile cihaz doğrulama testi yapamadık. Örneğin Linux, iOS ve macOS'ta mikrofon girişini ve hoparlör çıkışını test edemedik. Bu platformlarda herhangi bir şeyi bozabileceğini düşündüğümüz hiçbir değişiklik yapmadık ve otomatikleştirilmiş testlerimizin hepsi geçti. Bir şeyi kaçırma ihtimalimiz düşükse GitHub'da bize bildirin.
Devam eden desteğiniz için teşekkür ederiz. Her zaman olduğu gibi lütfen GitHub veya Stack Overflow ile ilgili sorular veya geri bildirim gönderin.
Sağlıklı kalın!

Konuşma SDK'sı 1.10.0: 2020-Şubat sürümü

Yeni özellikler

Python'ın yeni 3.8 sürümünü desteklemek için Python paketleri eklendi.
Red Hat Enterprise Linux (RHEL)/CentOS 8 x64 desteği (C++, C#, Java, Python).

Not

Müşterilerin OpenSSL'yi bu yönergelere göre yapılandırmaları gerekir.
Debian ve Ubuntu için Linux ARM32 desteği.
DialogService Bağlan or artık BotFrameworkConfig üzerinde isteğe bağlı bir "bot kimliği" parametresini destekliyor. Bu parametre, tek bir Konuşma kaynağıyla birden çok Direct Line Speech botunun kullanılmasına olanak tanır. Parametresi belirtilmediğinde, varsayılan bot (Direct Line Speech kanalı yapılandırma sayfası tarafından belirlendiği gibi) kullanılır.
DialogService Bağlan veya artık bir SpeechActivityTemplate özelliğine sahip. Bu JSON dizesinin içeriği Direct Line Speech tarafından, konuşma tanıma gibi olaylara yanıt olarak otomatik olarak oluşturulan etkinlikler de dahil olmak üzere bir Direct Line Speech bot'a ulaşan tüm etkinliklerde desteklenen çok çeşitli alanları önceden doldurmak için kullanılır.
TTS artık kimlik doğrulaması için abonelik anahtarını kullanarak bir sentezleyici oluşturduktan sonra ilk sentezleme sonucunun ilk bayt gecikme süresini azaltıyor.
19 yerel ayar için %18,6 ortalama sözcük hata oranı azaltması için konuşma tanıma modelleri güncelleştirildi (es-ES, es-MX, fr-CA, fr-FR, it-IT, ja-JP, ko-KR, pt-BR, zh-CN, zh-HK, nb-NO, fi-FL, ru-RU, pl-PL, ca-ES, zh-TW, th-TH, pt-PT, tr-TR). Yeni modeller Dikte, Çağrı Merkezi Transkripsiyonu ve Video Dizin Oluşturma senaryoları dahil olmak üzere birden çok etki alanı genelinde önemli geliştirmeler sunar.

Hata düzeltmeleri

Konuşma Transcriber'ın JAVA API'lerinde düzgün bekleyememe hatası düzeltildi
Xamarin GitHub sorunu için Android x86 öykünücüsü düzeltmesi
Eksik ekleme (Get|Set)Property methods to AudioConfig
Bağlantı başarısız olduğunda audioDataStream'in durdurulamamasına neden olan TTS hatasını düzeltme
Bölge olmadan uç nokta kullanmak konuşma çeviricisinde USP hatalarına neden olabilir
Evrensel Windows Uygulamalarında kimlik oluşturma artık uygun şekilde benzersiz bir GUID algoritması kullanıyor; daha önce ve istemeden, genellikle büyük etkileşim kümeleri üzerinde çakışmalar üreten saplanmış bir uygulama olarak varsayılan olarak kullanılırdı.

Örnekler

Unity mikrofonu ve anında iletme modu akışı ile Konuşma SDK'sını kullanmak için Unity örneği

Diğer değişiklikler

Linux için güncelleştirilen OpenSSL yapılandırma belgeleri

Konuşma SDK'sı 1.9.0: 2020-Ocak sürümü

Yeni özellikler

Çok cihazlı konuşma: Birden çok cihazı aynı konuşmaya veya metin tabanlı konuşmaya bağlayın ve isteğe bağlı olarak bunlar arasında gönderilen iletileri çevirin. Bu makalede daha fazla bilgi edinin.
Android .aar paketi için anahtar sözcük tanıma desteği eklendi ve x86 ve x64 tatları için destek eklendi.
Objective-C: SendMessage ve SetMessageProperty nesnesine Connection eklenen yöntemler. Buradaki belgelere bakın.
TTS C++ api'si artık birleştirme metin girişi olarak destekleyerek std::wstring bir wstring'i SDK'ya geçirmeden önce dizeye dönüştürme gereksinimini ortadan kaldırıyor. Ayrıntılar için buraya bakın.
C#: Dil kimliği ve kaynak dil yapılandırması artık kullanılabilir.
JavaScript: Konuşma hizmetinden gelen özel iletileri geri receivedServiceMessageçağırma olarak geçirmek için Connection nesnesine bir özellik eklendi.
JavaScript: Şirket içi kapsayıcılar ve bağımsız bulutlarla kullanımı kolaylaştırmak için FromHost API için desteği eklendi. Buradaki belgelere bakın.
JavaScript: Kuruluş kuruluşlarının katkılarından dolayı onur NODE_TLS_REJECT_UNAUTHORIZED duyuyoruz. Ayrıntılar için buraya bakın.

Hataya neden olan değişiklikler

OpenSSL 1.1.1b sürümüne güncelleştirildi ve Linux için Konuşma SDK'sı çekirdek kitaplığına statik olarak bağlandı. Gelen kutunuz OpenSSL sistemdeki dizine yüklenmemişse bu bir kesmeye /usr/lib/ssl neden olabilir. Sorunu geçici olarak çözmek için Konuşma SDK'sı belgeleri altındaki belgelerimize bakın.
Konuşma verileri 2 dakikadan uzun olduğunda erişime WordLevelTimingResults izin vermek için C# longWordLevelTimingResult.Offsetint için döndürülen veri türünü olarak değiştirdik.
PushAudioInputStream ve PullAudioInputStream şimdi wav üst bilgisi bilgilerini, isteğe bağlı olarak oluşturulduklarında belirtilen temelinde AudioStreamFormatKonuşma hizmetine gönderin. Müşterilerin artık desteklenen ses giriş biçimini kullanması gerekir. Diğer biçimler en iyi olmayan tanıma sonuçlarını alır veya başka sorunlara neden olabilir.

Hata düzeltmeleri

Yukarıdaki Hataya neden olan OpenSSL değişiklikler'in altındaki güncelleştirmeye bakın. Linux ve Java'da hem aralıklı kilitlenme hem de performans sorununu (yüksek yük altında çakışmayı kilitleme) düzeltildi.
Java: Yüksek eşzamanlılık senaryolarında nesne kapatmada geliştirmeler yapıldı.
NuGet paketimiz yeniden yapılandırıldı. Lib klasörlerinin Microsoft.CognitiveServices.Speech.core.dll ve Microsoft.CognitiveServices.Speech.extension.kws.dll altındaki üç kopyasını kaldırarak NuGet paketinin indirilmesi daha küçük ve hızlı hale geldik ve bazı C++ yerel uygulamalarını derlemek için gereken üst bilgileri ekledik.
Burada hızlı başlangıç örnekleri düzeltildi. Bunlar Linux, macOS, Windows'ta "mikrofon bulunamadı" özel durumu görüntülenmeden çıkıyordu.
Bu örnek gibi belirli kod yollarında uzun konuşma tanıma sonuçlarıyla SDK kilitlenmesi düzeltildi.
Bu müşteri sorununu gidermek için Azure Web App ortamında SDK dağıtım hatası düzeltildi.
Bu müşteri sorununu çözmek için çoklu <voice> etiket veya <audio> etiket kullanılırken TTS hatası düzeltildi.
SDK askıya alınmış durumdan kurtarıldığında TTS 401 hatası düzeltildi.
JavaScript: euirim'in katkıları sayesinde ses verilerinin döngüsel içeri aktarılması düzeltildi.
JavaScript: 1.7'de eklendiği gibi hizmet özelliklerini ayarlama desteği eklendi.
JavaScript: Bağlantı hatasının sürekli, başarısız websocket yeniden bağlanma girişimlerine neden olduğu bir sorun düzeltildi.

Örnekler

Buraya Android için anahtar sözcük tanıma örneği eklendi.
Buraya sunucu senaryosu için TTS örneği eklendi.
Buraya C# ve C++ için çok cihazlı konuşma hızlı başlangıçları eklendi.

Diğer değişiklikler

Android'de iyileştirilmiş SDK çekirdek kitaplığı boyutu.
1.9.0 ve üzeri sürümlerdeki SDK, Konuşma Dökümleyicisi için ses imzası sürüm alanında hem hem de intstring türlerini destekler.

Konuşma SDK'sı 1.8.0: 2019-Kasım sürümü

Yeni özellikler

Şirket içi kapsayıcılar ve bağımsız bulutlarla kullanımı kolaylaştırmak için bir FromHost() API eklendi.
Konuşma Tanıma için Kaynak Dil Belirleme eklendi (Java ve C++'da)
Konuşma Tanıma için, beklenen kaynak dilleri belirtmek için kullanılan nesne eklendi SourceLanguageConfig (Java ve C++'ta)
NuGet ve Unity paketleri aracılığıyla Windows (UWP), Android ve iOS'ta destek eklendi KeywordRecognizer
Zaman uyumsuz toplu işlerde Konuşma Transkripsiyonu yapmak için Uzak Konuşma Java API'si eklendi.

Hataya neden olan değişiklikler

Konuşma Transkriptör işlevleri ad alanı Microsoft.CognitiveServices.Speech.Transcriptionaltına taşındı.
Konuşma Transcriber yöntemlerinin bölümleri yeni Conversation sınıfa taşınır.
32 bit (ARMv7 ve x86) iOS desteği bırakıldı

Hata düzeltmeleri

Yerel KeywordRecognizer geçerli bir Konuşma tanıma hizmeti abonelik anahtarı olmadan kullanılıyorsa kilitlenme sorunu düzeltiliyor

Örnekler

için Xamarin örneği KeywordRecognizer
Unity örneği KeywordRecognizer
Otomatik Kaynak Dili Belirleme için C++ ve Java örnekleri.

Konuşma SDK'sı 1.7.0: 2019-Eylül sürümü

Yeni özellikler

Evrensel Windows Platformu (UWP), Android ve iOS'ta Xamarin için beta desteği eklendi
Unity için iOS desteği eklendi
Android, iOS ve Linux'ta ALaw, Mulaw, FLAC için giriş desteği eklendi Compressed
Connection hizmete ileti göndermek için sınıfına eklendi SendMessageAsync
İletinin Connection özelliğini ayarlamak için sınıfına eklendi SetMessageProperty
Java (JRE ve Android), Python, Swift ve Objective-C için TTS bağlamaları eklendi
TTS, macOS, iOS ve Android için kayıttan yürütme desteği ekledi.
TTS için "sözcük sınırı" bilgileri eklendi.

Hata düzeltmeleri

Android için Unity 2019'da IL2CPP derleme sorunu düzeltildi
Wav dosya girişinde hatalı biçimlendirilmiş üst bilgilerin yanlış işlenmesiyle ilgili sorun düzeltildi
UUID'lerin bazı bağlantı özelliklerinde benzersiz olmaması sorunu düzeltildi
Swift bağlamalarındaki nullability tanımlayıcıları hakkında birkaç uyarı düzeltildi (küçük kod değişiklikleri gerekebilir)
Ağ yükü altında websocket bağlantılarının düzgün bir şekilde kapatılmasına neden olan bir hata düzeltildi
Android'de bazen tarafından kullanılan yinelenen gösterim kimlikleriyle sonuçlanan bir sorun düzeltildi DialogServiceConnector
Çoklu dönüş etkileşimleri arasındaki bağlantıların kararlılığında ve hatalarla karşılaşıldığında hataların (olaylar aracılığıyla Canceled ) raporlanmasında iyileştirmeler DialogServiceConnector
DialogServiceConnector oturum başlatmaları artık etkin bir süre boyunca arama ListenOnceAsync() da dahil olmak üzere olayları düzgün bir şekilde sağlayacak StartKeywordRecognitionAsync()
Alınan etkinliklerle DialogServiceConnector ilişkili kilitlenme giderildi

Örnekler

Xamarin için Hızlı Başlangıç
Linux ARM64 bilgileriyle güncelleştirilmiş CPP Hızlı Başlangıcı
Unity hızlı başlangıcı iOS bilgileriyle güncelleştirildi

Konuşma SDK'sı 1.6.0: 2019-Haziran sürümü

Örnekler

UWP ve Unity'de Metin Okuma için hızlı başlangıç örnekleri
iOS'ta Swift için hızlı başlangıç örneği
Konuşma ve Amaç Tanıma ve Çeviri için Unity örnekleri
için güncelleştirilmiş hızlı başlangıç örnekleri DialogServiceConnector

İyileştirmeler / Değişiklikler

İletişim kutusu ad alanı:
- SpeechBotConnector, DialogServiceConnector olarak yeniden adlandırıldı
- BotConfig, DialogServiceConfig olarak yeniden adlandırıldı
- BotConfig::FromChannelSecret() yeniden eşlendi DialogServiceConfig::FromBotSecret()
- Yeniden adlandırmadan sonra tüm mevcut Direct Line Speech istemcileri desteklenmeye devam ediyor
TTS REST bağdaştırıcısını ara sunucuyu, kalıcı bağlantıyı destekleyecek şekilde güncelleştirme
Geçersiz bölge geçirildiğinde hata iletisini iyileştirme
Swift/Objective-C:
- Geliştirilmiş hata raporlama: Hataya neden olabilecek yöntemler artık iki sürümde mevcuttur: Bir nesnenin hata işleme için kullanıma sunulması NSError ve özel durum oluşturması. İlki Swift'e maruz kaldı. Bu değişiklik için mevcut Swift koduna uyarlama yapılması gerekir.
- Geliştirilmiş olay işleme

Hata düzeltmeleri

TTS için düzeltme: ses işleme tamamlanana kadar beklemeden geleceğin döndürdüğü yer SpeakTextAsync
Tam dil desteğini etkinleştirmek için C# dilinde dizeleri hazırlama düzeltmesi
Örneklerde net461 hedef çerçevesi ile çekirdek kitaplığını yüklemek için .NET Core uygulama sorunu düzeltildi
Örneklerde çıkış klasörüne yerel kitaplıkları dağıtmaya yönelik zaman zaman karşılaşılan sorunlar için düzeltme
Web yuvasının güvenilir bir şekilde kapatılması için düzeltme
Linux'ta yoğun yük altında bir bağlantı açılırken olası kilitlenme sorunu düzeltilir
macOS için çerçeve paketinde eksik meta veriler için düzeltme
Windows'ta ile pip install --user ilgili sorunlar için düzeltme

Konuşma SDK'sı 1.5.1

Bu bir hata düzeltme sürümüdür ve yalnızca yerel/yönetilen SDK'yi etkiler. SDK'nın JavaScript sürümünü etkilemez.

Hata düzeltmeleri

Konuşma Transkripsiyonu ile kullanıldığında FromSubscription'ı düzeltin.
Ses Yardımcıları için anahtar sözcük tespitindeki hatayı düzeltin.

Konuşma SDK'sı 1.5.0: 2019-Mayıs sürümü

Yeni özellikler

Anahtar sözcük tespiti (KWS) artık Windows ve Linux için kullanılabilir. KWS işlevselliği herhangi bir mikrofon türüyle çalışabilir ve resmi KWS desteği şu anda Azure Kinect DK donanımında veya Konuşma Cihazları SDK'sında bulunan mikrofon dizileriyle sınırlıdır.
tümcecik ipucu işlevselliği SDK aracılığıyla kullanılabilir. Daha fazla bilgi için buraya bakın.
Konuşma transkripsiyonu işlevselliği SDK aracılığıyla kullanılabilir.
Doğrudan Çizgi Konuşma kanalını kullanarak Sesli Yardımcılar için destek ekleyin.

Örnekler

SDK tarafından desteklenen yeni özellikler veya yeni hizmetler için örnekler eklendi.

İyileştirmeler / Değişiklikler

Hizmet davranışını veya hizmet sonuçlarını ayarlamak için çeşitli tanıyıcı özellikleri eklendi (küfürleri maskeleme ve diğerleri gibi).
Artık tanıyıcıyı oluşturmuş olsanız bile standart yapılandırma özellikleri aracılığıyla tanıyıcıyı FromEndpointyapılandırabilirsiniz.
Objective-C: OutputFormat özelliği öğesine SPXSpeechConfigurationeklendi.
SDK artık Linux dağıtımı olarak Debian 9'a destek veriyor.

Hata düzeltmeleri

Konuşmacı kaynağının metinden konuşmaya çok erken yok edildiği bir sorun düzeltildi.

Konuşma SDK'sı 1.4.2

Bu bir hata düzeltme sürümüdür ve yalnızca yerel/yönetilen SDK'yi etkiler. SDK'nın JavaScript sürümünü etkilemez.

Konuşma SDK'sı 1.4.1

Bu yalnızca JavaScript sürümüdür. Hiçbir özellik eklenmedi. Aşağıdaki düzeltmeler yapıldı:

Web paketinin https-proxy-agent yüklemesini engelleyin.

Konuşma SDK'sı 1.4.0: 2019-Nisan sürümü

Yeni özellikler

SDK artık Metin okuma hizmetini beta sürümü olarak destekliyor. C++ ve C# ile Windows ve Linux Desktop'ta desteklenir. Daha fazla bilgi için Metne konuşmaya genel bakış'a bakın.
SDK artık akış giriş dosyaları olarak MP3 ve Opus/OGG ses dosyalarını destekliyor. Bu özellik yalnızca C++ ve C# ile Linux'ta kullanılabilir ve şu anda beta sürümündedir (burada daha fazla ayrıntı bulabilirsiniz).
Java, .NET core, C++ ve Objective-C için Konuşma SDK'sı macOS desteği kazandı. macOS için Objective-C desteği şu anda beta sürümündedir.
iOS: iOS için Konuşma SDK'sı (Objective-C) artık CocoaPod olarak da yayımlanmaktadır.
JavaScript: Giriş cihazı olarak varsayılan olmayan mikrofon desteği.
JavaScript: Node.js için ara sunucu desteği.

Örnekler

Konuşma SDK'sını C++ ve macOS üzerinde Objective-C ile kullanma örnekleri eklendi.
Metin okuma hizmetinin kullanımını gösteren örnekler eklendi.

İyileştirmeler / Değişiklikler

Python: Tanıma sonuçlarının ek özellikleri artık özelliği aracılığıyla properties kullanıma sunuldu.
Ek geliştirme ve hata ayıklama desteği için SDK günlüğü ve tanılama bilgilerini bir günlük dosyasına yönlendirebilirsiniz (burada daha fazla ayrıntı bulabilirsiniz).
JavaScript: Ses işleme performansını geliştirin.

Hata düzeltmeleri

Mac/iOS: Konuşma tanıma hizmetine bağlantı kurulamadığında uzun süre beklemeye neden olan bir hata düzeltildi.
Python: Python geri çağırmalarında bağımsız değişkenler için hata işlemeyi geliştirin.
JavaScript: RequestSession'da konuşma için yanlış durum bildiriminin sona ermesi düzeltildi.

Konuşma SDK'sı 1.3.1: 2019-Şubat yenilemesi

Bu bir hata düzeltme sürümüdür ve yalnızca yerel/yönetilen SDK'yi etkiler. SDK'nın JavaScript sürümünü etkilemez.

Hata düzeltmesi

Mikrofon girişi kullanılırken bellek sızıntısı düzeltildi. Akış tabanlı veya dosya girişi etkilenmez.

Konuşma SDK'sı 1.3.0: 2019-Şubat sürümü

Yeni özellikler

Konuşma SDK'sı, giriş mikrofonunun sınıfı üzerinden seçilmesini AudioConfig destekler. Bu, ses verilerini varsayılan olmayan bir mikrofondan Konuşma hizmetine akışla aktarmanızı sağlar. Daha fazla bilgi için ses giriş cihazı seçimini açıklayan belgelere bakın. Bu özellik henüz JavaScript'ten sağlanmamıştır.
Konuşma SDK'sı artık beta sürümünde Unity'yi destekliyor. GitHub örnek deposundaki sorun bölümünden geri bildirim sağlayın. Bu sürüm, Windows x86 ve x64 (masaüstü veya Evrensel Windows Platformu uygulamaları) ve Android (ARM32/64, x86) üzerinde Unity'yi destekler. Unity hızlı başlangıcımızda daha fazla bilgi bulabilirsiniz.
Dosya Microsoft.CognitiveServices.Speech.csharp.bindings.dll (önceki sürümlerde gönderilir) artık gerekli değildir. İşlev artık çekirdek SDK ile tümleştirilmiştir.

Örnekler

Örnek depomuzda aşağıdaki yeni içerik kullanılabilir:

için AudioConfig.FromMicrophoneInputek örnekler.
Amaç tanıma ve çeviri için ek Python örnekleri.
iOS'ta nesnesini kullanmak Connection için ek örnekler.
Ses çıkışıyla çeviri için ek Java örnekleri.
Batch Transkripsiyon REST API'sinin kullanımı için yeni örnek.

İyileştirmeler / Değişiklikler

Python
- içindeki SpeechConfigparametre doğrulaması ve hata iletileri iyileştirildi.
- Nesnesi için Connection destek ekleyin.
- Windows'da 32 bit Python (x86) desteği.
- Python için Konuşma SDK'sı beta sürümünden çıktı.
Ios
- SDK artık iOS SDK sürüm 12.1'e göre oluşturulmuş.
- SDK artık iOS 9.2 ve sonraki sürümleri desteklemektedir.
- Başvuru belgelerini geliştirin ve çeşitli özellik adlarını düzeltin.
JavaScript
- Nesnesi için Connection destek ekleyin.
- Paketlenmiş JavaScript için tür tanımı dosyaları ekleme
- tümcecik ipuçları için ilk destek ve uygulama.
- Tanıma için JSON hizmetiyle özellik koleksiyonu döndürme
Windows DLL'leri artık bir sürüm kaynağı içeriyor.
Bir tanıyıcı FromEndpointoluşturursanız, parametreleri doğrudan uç nokta URL'sine ekleyebilirsiniz. Kullanarak FromEndpoint , standart yapılandırma özellikleri aracılığıyla tanıyıcıyı yapılandıramazsınız.

Hata düzeltmeleri

Boş proxy kullanıcı adı ve proxy parolası doğru işlenmedi. Bu sürümde, proxy kullanıcı adı ve proxy parolasını boş bir dizeye ayarlarsanız, ara sunucuya bağlanırken gönderilmez.
SDK tarafından oluşturulan SessionId, bazı diller /ortamlar için her zaman gerçekten rastgele değildi. Bu sorunu düzeltmek için rastgele oluşturucu başlatması eklendi.
Yetkilendirme belirtecinin işlenmesini geliştirin. Yetkilendirme belirteci kullanmak istiyorsanız, içinde belirtin SpeechConfig ve abonelik anahtarını boş bırakın. Ardından her zamanki gibi tanıyıcıyı oluşturun.
Bazı durumlarda nesne Connection doğru şekilde serbest bırakılmadı. Bu sorun düzeltilmiştir.
JavaScript örneği, Safari'de de çeviri sentezi için ses çıkışını destekleyecek şekilde düzeltildi.

Konuşma SDK'sı 1.2.1

Bu yalnızca JavaScript sürümüdür. Hiçbir özellik eklenmedi. Aşağıdaki düzeltmeler yapıldı:

Akışın sonunu speech.end'de değil turn.end'de çalıştır.
Geçerli gönderme başarısız olursa bir sonraki göndermeyi zamanlamayan ses pompasındaki hata düzeltildi.
Kimlik doğrulama belirteci ile sürekli tanımayı düzeltin.
Farklı tanıyıcı / uç noktalar için hata düzeltmesi.
Belge geliştirmeleri.

Konuşma SDK'sı 1.2.0: 2018-Aralık sürümü

Yeni özellikler

Python
- Python desteğinin Beta sürümü (3.5 ve üzeri) bu sürümde kullanılabilir. Daha fazla bilgi için buraya bakın](.. /.. /quickstart-python.md).
JavaScript
- JavaScript için Konuşma SDK'sı açık kaynaklıdır. Kaynak kodu GitHub'da kullanılabilir.
- Artık Node.js destekliyoruz, burada daha fazla bilgi bulabilirsiniz.
- Ses oturumları için uzunluk kısıtlaması kaldırıldı, yeniden bağlantı kapağın altında otomatik olarak gerçekleşir.
Connection Nesne
- öğesinden Recognizerbir Connection nesneye erişebilirsiniz. Bu nesne, hizmet bağlantısını açıkça başlatmanıza ve olaylara bağlanmak ve bağlantıyı kesmek için abone olmanıza olanak tanır. (Bu özellik henüz JavaScript ve Python'dan sağlanmamıştır.)
Ubuntu 18.04 desteği.
Android
- APK oluşturma sırasında ProGuard desteği etkinleştirildi.

İyileştirmeler

İş parçacığı, kilit, muteks sayısını azaltarak iç iş parçacığı kullanımındaki geliştirmeler.
Geliştirilmiş hata raporlama / bilgi. Bazı durumlarda hata iletileri tamamen yayılmamıştır.
JavaScript'teki geliştirme bağımlılıkları güncel modülleri kullanacak şekilde güncelleştirildi.

Hata düzeltmeleri

içindeki RecognizeAsyncbir tür uyuşmazlığı nedeniyle bellek sızıntıları düzeltildi.
Bazı durumlarda özel durumlar sızdırılıyordu.
Çeviri olayı bağımsız değişkenlerinde bellek sızıntısı düzeltildi.
Uzun süre çalışan oturumlarda yeniden bağlanmada oluşan bir kilitleme sorunu düzeltildi.
Başarısız çeviriler için nihai sonucun eksik olmasıyla sonuçlanabilir bir sorun düzeltildi.
C#: Ana iş parçacığında bir async işlem beklenmiyorsa, zaman uyumsuz görev tamamlanmadan önce tanıyıcı atılabilirdi.
Java: Java VM'sinin kilitlenmesine neden olan bir sorun düzeltildi.
Objective-C: Sabit sabit sabit listesi eşlemesi; yerine RecognizingIntentRecognizedIntent döndürüldü.
JavaScript: içinde varsayılan çıkış biçimini 'simple' olarak SpeechConfigayarlayın.
JavaScript: JavaScript ve diğer dillerdeki yapılandırma nesnesindeki özellikler arasındaki tutarsızlığı kaldırma.

Örnekler

Çeşitli örnekler (örneğin çeviri için çıkış sesleri vb.) güncelleştirildi ve düzeltildi.
Örnek depoya Node.js örnekleri eklendi.

Konuşma SDK'sı 1.1.0

Yeni özellikler

Android x86/x64 desteği.
Proxy Desteği: Nesnesinde SpeechConfig artık proxy bilgilerini (ana bilgisayar adı, bağlantı noktası, kullanıcı adı ve parola) ayarlamak için bir işlev çağırabilirsiniz. Bu özellik henüz iOS'ta kullanılamaz.
Geliştirilmiş hata kodu ve iletiler. Bir tanıma hata döndürdüyse, bu zaten (iptal edilen olayda) veya CancellationDetails (tanıma sonucunda) olarak ayarlanmıştır.ErrorReason İptal edilen olay artık ve adlı iki ek üye ErrorCodeErrorDetailsiçerir. Sunucu bildirilen hatayla birlikte ek hata bilgileri döndürdüyse, artık yeni üyelerde kullanılabilir.

İyileştirmeler

Tanıyıcı yapılandırmasına ek doğrulama eklendi ve ek hata iletisi eklendi.
Ses dosyasının ortasında uzun süreli sessizliğin işlenmesi geliştirildi.
NuGet paketi: .NET Framework projeleri için AnyCPU yapılandırmasıyla derlemeyi engeller.

Hata düzeltmeleri

Tanıyıcılarda bulunan birkaç özel durum düzeltildi. Ayrıca, özel durumlar yakalanıp olaya dönüştürülür Canceled .
Özellik yönetiminde bellek sızıntısını düzeltin.
Ses giriş dosyasının tanıyıcıyı kilitleyebildiği hata düzeltildi.
Oturum durdurma olayından sonra olayların alınabildiği bir hata düzeltildi.
Yazışmadaki bazı yarış koşulları düzeltildi.
Kilitlenmeye neden olabilecek bir iOS uyumluluk sorunu düzeltildi.
Android mikrofon desteği için kararlılık iyileştirmeleri.
JavaScript'teki bir tanıyıcının tanıma dilini yoksaydığı bir hata düzeltildi.
JavaScript'te (bazı durumlarda) ayarını EndpointId engelleyen bir hata düzeltildi.
JavaScript'te AddIntent parametresi sırası değiştirildi ve eksik AddIntent JavaScript imzası eklendi.

Örnekler

Örnek depoda çekme ve gönderme akışı kullanımı için C++ ve C# örnekleri eklendi.

Konuşma SDK'sı 1.0.1

Güvenilirlik iyileştirmeleri ve hata düzeltmeleri:

Tanıyıcıyı yok etmede yarış durumundan kaynaklanan olası önemli hata düzeltildi
Kümeyi kaldırma özellikleri oluştuğunda olası önemli hata düzeltildi.
Ek hata ve parametre denetimi eklendi.
Objective-C: NSString'de adı geçersiz kılmanın neden olduğu olası önemli hata düzeltildi.
Objective-C: API'nin görünürlüğü ayarlandı
JavaScript: Olaylar ve yükleriyle ilgili düzeltildi.
Belge geliştirmeleri.

Örnek depomuzda JavaScript için yeni bir örnek eklendi.

Azure AI Konuşma SDK'sı 1.0.0: 2018-Eylül sürümü

Yeni özellikler

iOS'ta Objective-C desteği. iOS için Objective-C hızlı başlangıcımıza göz atın.
Tarayıcıda JavaScript desteği. JavaScript hızlı başlangıcımıza göz atın.

Hataya neden olan değişiklikler

Bu sürümle birlikte, bir dizi hataya neden olan değişiklik kullanıma sunulmuştur. Ayrıntılar için bu sayfaya bakın.

Azure AI Konuşma SDK'sı 0.6.0: 2018-Ağustos sürümü

Yeni özellikler

Konuşma SDK'sı ile oluşturulan UWP uygulamaları artık Windows Uygulama Sertifikasyon Seti'ni (WACK) geçirebilir. UWP hızlı başlangıcına göz atın.
Linux üzerinde .NET Standard 2.0 desteği (Ubuntu 16.04 x64).
Deneysel: Windows (64 bit) ve Linux üzerinde Java 8'i (Ubuntu 16.04 x64) destekleyin. Java Çalışma Zamanı Ortamı hızlı başlangıcına göz atın.

İşlevsel değişiklik

Bağlantı hatalarıyla ilgili ek hata ayrıntı bilgilerini kullanıma sunma.

Hataya neden olan değişiklikler

Java'da (Android) SpeechFactory.configureNativePlatformBindingWithDefaultCertificate işlev artık bir yol parametresi gerektirmez. Artık yol desteklenen tüm platformlarda otomatik olarak algılanır.
Java ve C# içindeki özelliğin EndpointUrl get-accessor öğesi kaldırıldı.

Hata düzeltmeleri

Java'da, çeviri tanıyıcıdaki ses sentezi sonucu şimdi uygulanır.
Etkin olmayan iş parçacıklarına ve artan sayıda açık ve kullanılmayan yuvaya neden olabilecek bir hata düzeltildi.
Uzun süre çalışan bir tanımanın iletimin ortasında sonlandırıldığı bir sorun düzeltildi.
Tanıyıcı kapatma işlemindeki bir yarış durumu düzeltildi.

Azure AI Konuşma SDK'sı 0.5.0: 2018-Temmuz sürümü

Yeni özellikler

Android platform desteği (API 23: Android 6.0 Marshmallow veya üzeri). Android hızlı başlangıcına göz atın.
Windows üzerinde .NET Standard 2.0 desteği. .NET Core hızlı başlangıcına göz atın.
Deneysel: Windows'ta UWP desteği (sürüm 1709 veya üzeri).
- UWP hızlı başlangıcına göz atın.
- Konuşma SDK'sı ile oluşturulan UWP uygulamalarının henüz Windows Uygulama Sertifikasyon Seti'ni (WACK) geçirmediğini unutmayın.
Otomatik yeniden bağlantı ile uzun süre çalışan tanımayı destekler.

İşlevsel değişiklikler

StartContinuousRecognitionAsync() uzun süre çalışan tanımayı destekler.
Tanıma sonucu daha fazla alan içerir. Tanınan metnin ses başlangıcı ve süresinden (her ikisi de değer çizgileriyle) ve tanıma durumunu temsil eden ek değerlerden (örneğin InitialSilenceTimeout ve InitialBabbleTimeout) uzaktır.
Fabrika örnekleri oluşturmak için AuthorizationToken'i destekleyin.

Hataya neden olan değişiklikler

Tanıma olayları: NoMatch olay türü olayla Error birleştirildi.
C# dilinde SpeechOutputFormat, C++ ile uyumlu kalacak şekilde yeniden adlandırıldı OutputFormat .
Arabirimin bazı yöntemlerinin AudioInputStream dönüş türü biraz değişti:
- Java'da read yöntemi artık yerine intdöndürürlong.
- C# dilinde Read yöntemi artık yerine intdöndürüruint.
- C++Read'ta ve GetFormat yöntemleri artık yerine intdöndürürsize_t.
C++: Ses giriş akışlarının örnekleri artık yalnızca olarak shared_ptrgeçirilebilir.

Hata düzeltmeleri

Zaman aşımına uğradıklarında RecognizeAsync() sonuçtaki yanlış dönüş değerleri düzeltildi.
Windows'ta media foundation kitaplıklarına bağımlılık kaldırıldı. SDK artık Çekirdek Ses API'lerini kullanıyor.
Belge düzeltmesi: Desteklenen bölgeleri açıklamak için bir bölgeler sayfası eklendi.

Bilinen Sorun

Android için Konuşma SDK'sı çeviri için konuşma sentezi sonuçlarını raporlamaz. Bu sorun bir sonraki sürümde düzeltilecektir.

Azure AI Konuşma SDK'sı 0.4.0: 2018-Haziran sürümü

İşlevsel değişiklikler

AudioInputStream

Bir tanıyıcı artık ses kaynağı olarak bir akış kullanabilir. Daha fazla bilgi için ilgili nasıl yapılır kılavuzuna bakın.
Ayrıntılı çıkış biçimi

Oluşturduğunuzda SpeechRecognizer, istekte Detailed bulunabilir veya Simple çıkış biçimi oluşturabilirsiniz. , DetailedSpeechRecognitionResult güvenilirlik puanı, tanınan metin, ham sözcük biçimi, normalleştirilmiş form ve maskelenmiş küfür içeren normalleştirilmiş form içerir.

Hataya neden olan değişiklik

SpeechRecognitionResult.Text C# dilinde olarak SpeechRecognitionResult.RecognizedText değiştirildi.

Hata düzeltmeleri

Kapatma sırasında USP katmanında olası geri çağırma sorunu düzeltildi.
Bir tanıyıcı bir ses giriş dosyası kullandıysa, dosya tutamacını gerekenden uzun süre tutuyordu.
İleti pompası ile tanıyıcı arasındaki birkaç kilitlenme kaldırıldı.
Hizmetten gelen yanıt zaman aşımına uğradıysa bir NoMatch sonuç tetikler.
Windows'ta media foundation kitaplıkları gecikmeli olarak yüklenir. Bu kitaplık yalnızca mikrofon girişi için gereklidir.
Ses verilerinin karşıya yükleme hızı, orijinal ses hızının yaklaşık iki katıyla sınırlıdır.
Windows'da C# .NET derlemeleri artık güçlü olarak adlandırılmıştır.
Belge düzeltmesi: Region tanıyıcı oluşturmak için gerekli bilgilerdir.

Daha fazla örnek eklendi ve sürekli güncelleştiriliyor. En son örnek kümesi için bkz. Konuşma SDK'sı örnekleri GitHub deposu.

Azure AI Konuşma SDK'sı 0.2.12733: 2018-Mayıs sürümü

Bu sürüm, Azure AI Konuşma SDK'sının ilk genel önizleme sürümüdür.

Konuşma CLI 1.37.0: Nisan 2024 sürümü

Konuşma SDK'sı 1.37.0 kullanacak şekilde güncelleştirildi

Yeni özellikler

Hata düzeltmeleri

Konuşma CLI 1.36.0: Mart 2024 sürümü

Konuşma SDK'sı 1.36.0 kullanacak şekilde güncelleştirildi

Yeni özellikler

Hata düzeltmeleri

Konuşma CLI 1.35.0: Şubat 2024 sürümü

Konuşma SDK'sı 1.35.0 kullanacak şekilde güncelleştirildi

Yeni özellikler

Hata düzeltmeleri

JMESPath bağımlılığını en son sürüme güncelleştirme

Konuşma CLI 1.34.0: Kasım 2023 sürümü

Konuşma SDK'sı 1.34.0 kullanacak şekilde güncelleştirildi

Konuşma CLI 1.33.0: Ekim 2023 sürümü

Konuşma SDK'sı 1.34.0 kullanacak şekilde güncelleştirildi

Konuşma CLI 1.31.0: Ağustos 2023 sürümü

Konuşma SDK'sı 1.31.0 kullanacak şekilde güncelleştirildi

Konuşma CLI 1.30.0: Temmuz 2023 sürümü

Konuşma SDK'sı 1.30.0 kullanacak şekilde güncelleştirildi

Konuşma CLI'sı 1.29.0: Haziran 2023 sürümü

Konuşma SDK'sı 1.29.0 kullanacak şekilde güncelleştirildi

Konuşma CLI'sı 1.28.0: Mayıs 2023 sürümü

Konuşma SDK'sı 1.28.0 kullanacak şekilde güncelleştirildi

Konuşma CLI 1.27.0: Nisan 2023 sürümü

Güncelleştirmeler

Konuşma SDK'sı 1.27.0 kullanacak şekilde güncelleştirildi
Özel konuşma tanıma ve Toplu Konuşma Tanıma için v3.1 REST API'lerini kullanmak üzere varsayılan uç noktayı güncelleştirin.

Hata düzeltmeleri

Sorgu parametrelerinin nasıl ayrıştırıldığı/yapılandırıldığıyla ilgili düzeltmeler.

Konuşma CLI 1.26.0: Mart 2023 sürümü

Konuşma SDK'sı 1.26.0 kullanacak şekilde güncelleştirildi.

Konuşma CLI'sı 1.25.0: Ocak 2023 sürümü

Konuşma SDK'sı 1.25.0 kullanacak şekilde güncelleştirildi.

Konuşma CLI 1.24.0: Ekim 2022 sürümü

Konuşma SDK'sı 1.24.0 kullanır.

Yeni özellikler

Tüm spx olaylarında JMESPath sorgularını desteklemek için "spx denetimi" genişletildi

Hata düzeltmeleri

JMESPath sorgu değerlendirmelerine karşı sağlamlıkta çeşitli geliştirmeler
Kaynak kısıtlanmış makinelerde oluşabilecek dosya yazma işlemlerinin kesilmesine yönelik düzeltme

Konuşma CLI 1.23.0: Temmuz 2022 sürümü

Konuşma SDK'sı 1.23.0 kullanır.

Yeni özellikler

Daha iyi başlık (--output vtt ve --output srt) büyük sonuç bölme (en fazla 37 karakter, 3 satır)
Belgelenmiş spx synthesize--format seçenekler (bkz spx help synthesize format. )
Komutların/seçeneklerin spx csr çoğu belgelendi (bkz spx help csr. )
Komut eklendi spx csr model copy (bkz spx help csr model copy. )
JMES sorguları kullanılarak seçenek eklendi --check result (bkz spx help check result. )
Geçersiz komut seçenekleri belirtilirken hata iletileri geliştirildi
.NET Core 3.1'den .NET 6.0'a taşındı. Konuşma CLI'sını çalıştırmak için .NET 6.0 Çalışma Zamanı'nı (veya üzerini) yüklemeniz gerekir.

Hata düzeltmeleri

Tüm URL'ler dili kaldıracak şekilde güncelleştirildi (örneğin, "en-US")
Her durumda düzgün rapor için sürüm bilgileri düzeltildi (daha önce bazen boş gösterildi)

Konuşma CLI 1.22.0: Haziran 2022 sürümü

Konuşma SDK'sı 1.22.0 kullanır.

Yeni özellikler

Azure Web Portalı'na gitmeden konuşma kaynağı anahtarı oluşturma sırasında kullanıcılara yol gösterecek komut eklendi spx init .
Konuşma docker kapsayıcılarına artık Azure CLI eklendiğinden spx init komut kullanıma uygun şekilde çalışır.
Gecikme sürelerini hesaplarken SPX'i daha kullanışlı hale getirmek için olay çıktı seçeneği olarak zaman damgası eklendi.

Konuşma CLI 1.21.0: Nisan 2022 sürümü

Konuşma SDK'sı 1.21.0 kullanır.

Yeni özellikler

WEBVTT Resim Yazısı oluşturma
- spx translate için --output vtt desteği eklendi
- Varsayılan VTT FILENAME'i geçersiz kılmayı destekler --output vtt file FILENAME
- Standart çıkışa yazmayı destekler --output vtt file -
- Her hedef dil için tek tek VTT dosyaları oluşturulur (örneğin --target en;de;fr)
SRT Resim Yazısı oluşturma
- , spx intentve desteği spx recognizeeklendi --output srtspx translate
- Varsayılan SRT FILENAME'i geçersiz kılmayı destekler --output srt file FILENAME
- Standart çıkışa yazmayı destekler --output srt file -
- için spx translate, her hedef dil için tek tek SRT dosyaları oluşturulur (örneğin --target en;de;fr)

Hata düzeltmeleri

Biçimi düzgün kullanmak hh:mm:ss.fff için WEBVTT zaman aralığı çıkışı düzeltildi

Konuşma CLI'sı 1.20.0: Ocak 2022 sürümü

Yeni özellikler

Konuşmacı tanıma
- spx profile enroll ve spx speaker [identify/verify] şimdi mikrofon girişini destekliyor
Amaç tanıma (spx intent)
- --keyword FILE.table
- --pattern ve --patterns
- --output all/each intentid
- --output all/each entity json
- --output all/each ENTITY entity
- --once, --once+, --continuous (artık sürekli varsayılan)
- --output all/each connection EVENT
- --output all/each connection message (örneğin, text, path)
CLI konsolu çıkış beklenti denetimi/yazma:
- --expect PATTERN ve --not expect PATTERN tüm komutlarda destek
- --auto expect beklenen desenlerin yazılmasında yardımcı olmak için
SDK günlüğü çıkış beklenti denetimi/yazma
- --log expect PATTERN ve --not log expect PATTERN tüm komutlarda destek
- --log auto expect [FILTER] tüm komutlarda destek
- --log FILE ve üzerinde spx profile destek spx speaker
Ses dosyası girişi
- --format ANY tüm komutlarda destek
- --file - destek (standart girişten okuma, kanal senaryolarını etkinleştirme)
Ses dosyası çıkışı
- --audio output - Standart çıkışa yazma, kanal senaryolarını etkinleştirme
Çıkış dosyaları
- --output all/each file - Standart çıkışa yazma
- --output batch file - Standart çıkışa yazma
- --output vtt file - Standart çıkışa yazma
- --output json file -ve spx batch komutları için spx csr standart çıkışa yazma
Çıkış özellikleri
- --output […] result XXX property (PropertyId veya dize)
- --output […] connection message received XXX property (PropertyId veya dize)
- --output […] recognizer XXX property (PropertyId veya dize)
Azure Web İşi tümleştirmesi
- spx webjob şimdi alt komut deseni izler
- Web İşi yardımı, alt komut desenini yansıtacak şekilde güncelleştirildi (bkz spx help webjob. )

Hata düzeltmeleri

Hem hem de --output vtt FILE--output batch FILE aynı anda kullanıldığında hata düzeltildi
spx [...] --zip ZIPFILENAME artık tüm senaryolar için gerekli olan tüm ikili dosyaları içerir (varsa)
spx profile ve spx speaker komutları artık iptal etmeyle ilgili ayrıntılı hata bilgilerini döndürür

2021-Mayıs sürümü

Yeni özellikler

Profil, Konuşmacı Kimliği ve Konuşmacı doğrulaması desteği eklendi - Komut satırından deneyin spx profilespx speaker .
Ayrıca komut satırından İletişim kutusu desteği - Deneyin'i spx dialog ekledik.
Geliştirilmiş spx yardım. Lütfen bir GitHub sorunu açarak bunun sizin için nasıl çalıştığı hakkında bize geri bildirimde bulunabilirsiniz.
.NET aracı yüklemesinin boyutunu azalttık.

COVID-19 kısaltılmış test

Devam eden pandemi, mühendislerimizin evden çalışmasını gerektirmeye devam ederken, pandemi öncesi el ile doğrulama betikleri önemli ölçüde azaltıldı. Daha az yapılandırmaya sahip daha az cihazda test yapıyoruz ve ortama özgü hataların kayma olasılığı artırılabilir. Yine de büyük bir otomasyon kümesiyle sıkı bir şekilde doğrularız. Bir şeyi kaçırma ihtimalimiz düşükse lütfen GitHub'dan bize bildirin.
Sağlıklı kalın!

2021-Mart sürümü

Yeni özellikler

amacı tanıma için komutu eklendi spx intent , yerine spx recognize intent.
Tanıma ve amaç artık kullanarak spx recognize --wer url <URL>sözcük hata oranını hesaplamak için Azure işlevlerini kullanabilir.
Tanıma artık kullanarak spx recognize --output vtt file <FILENAME>sonuçları VTT dosyaları olarak verebilir.
Hassas anahtar bilgileri artık hata ayıklama/ayrıntılı çıktıda gizlenmektedir.
Toplu transkripsiyon oluşturma işleminde içerik alanı için URL denetimi ve hata iletisi eklendi.

COVID-19 kısaltılmış test

2021-Ocak sürümü

Yeni özellikler

Konuşma CLI'sı artık bir NuGet paketi olarak kullanılabilir ve kabuktan/komut satırından çağırabileceğiniz bir .NET genel aracı olarak .NET CLI aracılığıyla yüklenebilir.
Özel konuşma DevOps Şablonu deposu, özel konuşma iş akışları için Konuşma CLI'sini kullanacak şekilde güncelleştirildi.

COVID-19 kısaltılmış test

2020-Ekim sürümü

SPX, kod yazmadan Konuşma hizmetini kullanmak için kullanılan komut satırı arabirimidir. En son sürümü buradan indirin.

Yeni özellikler

spx csr dataset upload --kind audio|language|acoustic – yalnızca URL'lerden değil yerel verilerden veri kümeleri oluşturun.
spx csr evaluation create|status|list|update|delete – yeni modelleri temel gerçeklerle/diğer modellerle karşılaştırın.
spx * list – disk belleği olmayan deneyimi destekler (--top X --skip X gerektirmez).
spx * --http header A=B – özel üst bilgileri (özel kimlik doğrulaması için Office için eklendi) destekleyin.
spx help – geliştirilmiş metin ve metin rengi kodlanmış (mavi) arka değer işareti.

2020-Haziran sürümü

CLI içi yardım arama özellikleri eklendi:
- spx help find --text TEXT
- spx help find --topic NAME
Yeni dağıtılan v3.0 Batch ve özel konuşma API'leriyle çalışacak şekilde güncelleştirildi:
- spx help batch examples
- spx help csr examples

COVID-19 kısaltılmış test

Konuşma CLI'sı (SPX olarak da bilinir): 2020-Mayıs sürümü

SPX , komut satırından tanıma, sentez, çeviri, toplu transkripsiyon ve özel konuşma yönetimi gerçekleştirmenizi sağlayan yeni bir komut satırı aracıdır. Bunu Konuşma hizmetini test etmek veya gerçekleştirmeniz gereken Konuşma hizmeti görevlerini betik olarak kullanmak için kullanın. Aracı indirin ve buradaki belgeleri okuyun.

Nisan 2024 sürümü

Metin okuma avatarı

Artık avatarlarınız için statik bir arka plan görüntüsü ayarlayabilirsiniz. Bu özelliği kullanmak için özelliğini kullanmanız avatarConfig.backgroundImage ve istenen görüntüye işaret eden bir URL belirtmeniz yeterlidir. Detials için bkz . Arka planı düzenleme.

Mart 2024 sürümü

Önceden oluşturulmuş sinir sesi

9 çok dilli ses genel olarak tüm bölgelerde kullanılabilir: , , , , , de-DE-FlorianMultilingualNeural, de-DE-SeraphinaMultilingualNeural, , fr-FR-VivienneMultilingualNeuralfr-FR-RemyMultilingualNeuralve zh-CN-XiaoxiaoMultilingualNeural. en-US-BrianMultilingualNeuralen-US-EmmaMultilingualNeuralen-US-AndrewMultilingualNeuralen-US-AvaMultilingualNeural Daha fazla bilgi için tam dil ve ses listesine bakın.
Genel önizleme için yeni bir çok dilli ses tanıtımı: ja-JP-MasaruMultilingualNeural. Daha fazla bilgi için tam dil ve ses listesine bakın.
Ek güncelleştirmeler:
- en-US-RyanMultilingualNeural genel olarak tüm bölgelerde kullanılabilir.
- en-US-JennyMultilingualV2Neural genel olarak tüm bölgelerde kullanılabilir ve ile en-US-JennyMultilingualNeuralbirleştirilir.
- Doğu ABD, Batı Avrupa ve Güneydoğu Asya'da güncelleştirilmiş en-IN-NeerjaNeural ve hi-IN-SwaraNeural 3 yeni stille önizleme kullanılabilir.
- Orta Hindistan'da yeni kadın sesleri için önizleme kullanılabilir: en-IN-KavyaNeural, en-IN-AnanyaNeural, en-IN-AashiNeural, hi-IN-KavyaNeuralve hi-IN-AnanyaNeural.

Metin okuma avatarı

Gerçek zamanlı avatar için Azure İletişim Hizmetleri (ACS) TURN bağımlılığı kaldırıldı. Örnek kod bu değişikliği yansıtacak şekilde güncelleştirildi.
Yayımlanan metinden konuşmaya avatar fiyatlandırması. Diğer ayrıntılar için fiyatlandırma sayfasına bakın. Avatar fiyatlandırmasının yalnızca batı ABD 2, Batı Avrupa ve Güneydoğu Asya dahil olmak üzere özelliğin kullanılabildiği hizmet bölgeleri için görünür olacağını unutmayın.

Şubat 2024 sürümü

OpenAI sesleri

Azure AI Konuşma tanıma hizmeti şu bölgelerdeki OpenAI metninden konuşma seslerine desteği sağlar: Orta Kuzey ABD ve İsveç Orta. Azure AI Konuşma sesleri gibi OpenAI metni de konuşma seslerine yazılı metni doğal sesli sese dönüştürmek için yüksek kaliteli konuşma sentezi sağlar. Bu, çevreleyici ve etkileşimli kullanıcı deneyimleri için çok çeşitli olanakların kilidini açar. Daha fazla bilgi için bkz . OpenAI metni konuşma seslerine nelerdir?.

Not

OpenAI metin okuma sesleri Azure OpenAI Hizmeti'nde de kullanılabilir.
Bu güncelleştirmeyle, Azure AI Konuşma ile önceden oluşturulmuş sinir seslerinin fiyatlandırmasını ayarladık. Güncelleştirilmiş fiyatlandırmayı buradan kontrol edin.

Kişisel ses

Kişisel ses özelliği artık ve PhoenixLatestNeural modellerini destekliyorDragonLatestNeural. Bu yeni modeller, sentezlenen seslerin doğallığını artırır ve istemdeki sesin konuşma özelliklerine daha iyi benzer. Daha fazla ayrıntı için bkz. Uygulamanızda kişisel sesi tümleştirme.

Aralık 2023 sürümü

Özel ses API'si

Özel ses API'si, profesyonel ve kişisel özel sinir sesi modelleri oluşturmak ve yönetmek için kullanılabilir.

Özel sinir sesi

Yeni eğitilen ses modelleri artık model sürümünden bağımsız olarak 48 kHz örnek hızını destekliyor. Daha önce eğitilmiş ses modelleri için, örnek hızını 48 kHz'e yükseltmek için altyapı sürümünü en az 2023.11.13.0 sürümüne yükseltmek gerekir.

Önceden oluşturulmuş sinir sesi

Genel önizleme için yeni çok dilli seslere giriş:

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`de-DE`	Almanca (Almanya)	`de-DE-FlorianMultilingualNeural` (Erkek)
`de-DE`	Almanca (Almanya)	`de-DE-SeraphinaMultilingualNeural` (Kadın)
`en-US`	İngilizce (ABD)	`en-US-AvaMultilingualNeural` (Kadın)
`en-US`	İngilizce (ABD)	`en-US-EmmaMultilingualNeural` (Kadın)
`fr-FR`	Fransızca (Fransa)	`fr-FR-RemyMultilingualNeural` (Erkek)
`en-US`	İngilizce (ABD)	`en-US-BrianMultilingualNeural` (Erkek)
`en-US`	İngilizce (ABD)	`en-US-AndrewMultilingualNeural` (Erkek)
`fr-FR`	Fransızca (Fransa)	`fr-FR-VivienneMultilingualNeural` (Kadın)
`zh-CN`	Çince (Mandarin, Basitleştirilmiş)	`zh-CN-XiaoxiaoMultilingualNeural` (Kadın)
`zh-CN`	Çince (Mandarin, Basitleştirilmiş)	`zh-CN-XiaochenMultilingualNeural` (Kadın)
`zh-CN`	Çince (Mandarin, Basitleştirilmiş)	`zh-CN-YunyiMultilingualNeural` (Erkek)

Genel önizleme için çeşitli Çince diyalektleri ve aksanları destekleyen yeni zh-CN-XiaoxiaoDialectsNeural seslere giriş:

Ses adı	İkincil dil	Diyalekt/Vurgu
`zh-CN-XiaoxiaoDialectsNeural`	`zh-CN-shaanxi`	Çince (Zhongyuan Mandarin Shaanxi, Basitleştirilmiş)
	`zh-CN-sichuan`	Çince (Southwestern Mandarin, Basitleştirilmiş)
	`zh-CN-shanxi`	Çince (Shanxi Accent Mandarin, Basitleştirilmiş)
	`nan-CN`	Çince (Güney Min, Basitleştirilmiş)
	`zh-CN-anhui`	Çince (Jianghuai Mandarin Anhui, Basitleştirilmiş)
	`zh-CN-hunan`	Çince (Hunan Accent Mandarin, Basitleştirilmiş)
	`zh-CN-gansu`	Çince (Lanyin Mandarin Gansu, Basitleştirilmiş)
	`zh-CN-shandong`	Çince (Jilu Mandarin, Basitleştirilmiş)
	`zh-CN-henan`	Çince (Zhongyuan Mandarin Henan, Basitleştirilmiş)
	`zh-CN-liaoning`	Çince (Northeastern Mandarin, Basitleştirilmiş)
	`zh-TW`	Çince (Tayvan Mandarin, Geleneksel)

Kasım 2023 sürümü

Kişisel ses

Kişisel ses şu bölgelerde önizlemede kullanılabilir: Batı Avrupa, Doğu ABD ve Güney Doğu Asya. Kişisel ses (önizleme) ile sesinizin (veya uygulamanızın kullanıcılarının) yapay zeka tarafından oluşturulan çoğaltmalarını birkaç saniye içinde alabilirsiniz. Ses istemi olarak bir dakikalık konuşma örneği sağlarsınız ve ardından 100'den fazla yerel ayarda desteklenen 90'dan fazla dilde konuşma oluşturmak için bunu kullanırsınız.

Daha fazla bilgi için bkz . kişisel ses.

Metin okuma avatarı

Metin okuma avatarı şu bölgelerde önizlemede kullanılabilir: Batı ABD 2, Batı Avrupa ve Güneydoğu Asya.

Metin okuma avatarı, doğal bir sesle konuşan bir fotorealistik insanın (önceden oluşturulmuş avatar veya özel metin okuma avatarı) dijital bir videosuna dönüştürür. Metin okuma avatarı videosu zaman uyumsuz veya gerçek zamanlı olarak sentezlenebilir. Geliştiriciler API aracılığıyla metinden konuşmaya avatarla tümleştirilmiş uygulamalar oluşturabilir veya kodlama yapmadan video içeriği oluşturmak için Speech Studio'da içerik oluşturma aracı kullanabilir.

Daha fazla bilgi için bkz . metinden konuşmaya avatar, saydamlık notları ve ses ve avatar yeteneği için açıklama.

Özel sinir sesi

Diller arası ses için 24 yeni yerel ayar desteği eklendi. Daha fazla bilgi için tam dil listesine bakın.

Önceden oluşturulmuş sinir sesi

Genel önizleme için yeni seslere giriş:

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`de-DE`	Almanca (Almanya)	`SeraphinaNeural` (Kadın)
`es-ES`	İspanyolca (İspanya)	`XimenaNeural` (Kadın)
`fr-CA`	Fransızca (Kanada)	`ThierryNeural` (Erkek)
`fr-FR`	Fransızca (Fransa)	`VivienneNeural` (Kadın)
`it-IT`	İtalyanca (İtalya)	`GiuseppeNeural` (Erkek)
`ko-KR`	Korece (Kore)	`HyunsuNeural` (Erkek)
`pt-BR`	Portekizce (Brezilya)	`ThalitaNeural` (Kadın)

Düzeltilen hatalarla güncelleştirilen modeller ve kalite iyileştirmesi:

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`es-ES`	İspanyolca (İspanya)	`AlvaroNeural` (Erkek)
`en-GB`	İngilizce (İngiltere)	`RyanNeural` (Erkek)
`ko-KR`	Korece (Kore)	`InjoonNeural` (Erkek)

Daha fazla bilgi için tam dil ve ses listesine bakın.

Ekim 2023 sürümü

Özel sinir sesi

Özel nöral ses Pro ile 12 yeni yerel ayar için destek eklendi. Daha fazla bilgi için tam dil listesine bakın.

Eylül 2023 yayını

Önceden oluşturulmuş sinir sesi

Genel önizleme için yeni seslere giriş:

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`en-US`	İngilizce (ABD)	`en-US-EmmaNeural` (Kadın)
`en-US`	İngilizce (ABD)	`en-US-AndrewNeural` (Erkek)
`en-US`	İngilizce (ABD)	`en-US-BrianNeural` (Erkek)

Daha fazla bilgi için tam dil ve ses listesine bakın.

Katıştırılmış sinir sesi

Buradaki 147 yerel ayarın tümü (fa-IR, Farsça (İran) hariç) 1 seçili kadın ve/veya 1 seçili erkek sesiyle kullanıma hazır.

Ağustos 2023 sürümü

Özel sinir sesi

En son CNV Lite eğitim tarifi sürümü artık yayınlandı. Bu sürüm, dil modellerinizin kalitesiyle ilgili çeşitli geliştirmeler getirir. Speech Studio'yu deneyin.

Temmuz 2023 sürümü

Özel sinir sesi

Çok stilli ses genel olarak kullanılabilir.
Genel önizlemede çok stilli ses için iki yeni yerel ayar eklendi: ja-JP ve zh-CN. Daha fazla bilgi için tam dil ve ses listesine bakın. Farklı diller için önceden ayarlanmış stil listesine bakın.
Diller arası ses genel olarak kullanılabilir.
Diller arası ses için iki yeni yerel ayar eklendi: id-ID ve nl-NL. Daha fazla bilgi için tam dil ve ses listesine bakın.

Önceden Oluşturulmuş Nöral TTS Sesleri

Genel önizleme için yeni en-US cinsiyetsiz ses tanıtımı:

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`en-US`	İngilizce (ABD)	`en-US-BlueNeural` (Nötr)

Genel önizleme için yeni çok dilli seslere giriş:

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`en-US`	İngilizce (ABD)	`en-US-JennyMultilingualV2Neural` (Kadın)
`en-US`	İngilizce (ABD)	`en-US-RyanMultilingualNeural` (Erkek)

Çok dilli sesler en-US-JennyMultilingualV2Neural ve en-US-RyanMultilingualNeural giriş metninin dilini otomatik olarak algılama. Ancak, bu seslerin <lang> konuşma dilini ayarlamak için öğesini kullanmaya devam edebilirsiniz.

Bu yeni çok dilli sesler 41 dilde ve vurguda konuşabilirsiniz: , , , , Czech (Czechia), Danish (Denmark), , German (Austria), , English (Australia)English (United States)English (United Kingdom)English (India)German (Germany)English (Canada)English (Hong Kong SAR)English (Ireland)German (Switzerland), , , Spanish (Spain), , Spanish (Mexico), Finnish (Finland), . Norwegian Bokmål (Norway)Korean (Korea)Japanese (Japan)Italian (Italy)Dutch (Belgium)Indonesian (Indonesia)Hungarian (Hungary)Hindi (India)Dutch (Netherlands)French (France)French (Canada)Chinese (Cantonese, Traditional)Swedish (Sweden)Chinese (Mandarin, Simplified)Portuguese (Brazil)Portuguese (Portugal)Russian (Russia)Turkish (Türkiye)Chinese (Taiwanese Mandarin, Traditional)French (Switzerland)Thai (Thailand)French (Belgium)Polish (Poland)CatalanArabic (Saudi Arabia)Arabic (Egypt)

Bu çok dilli sesler kesme, vurgu, sessizlik ve alt öğeler gibi belirli SSML öğelerini tam olarak desteklemez.

Önemli

Ses en-US-JennyMultilingualV2Neural , değerlendirme amacıyla genel önizleme soley'de geçici olarak sağlanır. Gelecekte kaldırılacaktır.

İngilizce dışında bir dilde konuşmak için, geçerli ses uygulaması en-US-JennyMultilingualNeural öğesini ayarlamanızı <lang xml:lang> gerektirir. Q4 takvim yılı 2023'te sesin öğesi en-US-JennyMultilingualNeural olmadan <lang xml:lang> giriş metninin dilinde konuşacak şekilde güncelleştirileceğini tahmin ediyoruz. Bu ses ile en-US-JennyMultilingualV2Neural eşlik içinde olacak.

Aşağıdaki sesler için genel önizlemede yeni özelliklere giriş:

Sırpça (Sırbistan) sr-RS sesleri için Latince giriş eklendi: sr-latn-RS-SophieNeural ve sr-latn-RS-NicholasNeural.
Arnavut (Arnavutluk) sq-AL sesleri için İngilizce telaffuz desteği eklendi: sq-AL-AnilaNeural ve sq-AL-IlirNeural.

Mayıs 2023 sürümü

Ses İçeriği Oluşturma

Konuşma stilleri ve çok stilli özel seslerle önceden oluşturulmuş tüm sesler, stil derece ayarlamayı destekler.
Artık bir sözcüğün söylenişini, sözcüğü konuşarak ve kaydederek düzeltebilirsiniz. Fonemler kaydınızdan otomatik olarak tanınabilir. Konuşmayla tanıma özelliği artık genel önizleme aşamasındadır.

Nisan 2023 sürümü

Önceden Oluşturulmuş Nöral TTS Sesleri

Genel önizlemeden GA'ya taşınan bu seslerin aşağıdaki özellikleri:

Stil	Metin okuma sesleri
style="chat"	`en-GB-RyanNeural`, `es-MX-JorgeNeural`ve `it-IT-IsabellaNeural`
style="neşeli"	`en-GB-RyanNeural`, `en-GB-SoniaNeural`, `es-MX-JorgeNeural`, `fr-FR-DeniseNeural`, `fr-FR-HenriNeural`ve `it-IT-IsabellaNeural`
style="sad"	`en-GB-SoniaNeural`, `fr-FR-DeniseNeural` ve `fr-FR-HenriNeural`

için İngilizce söylenişi hi-INta-IN geliştirin ve te-IN sesler, genel önizleme bölgelerinde kullanıma sunuldu

Daha fazla bilgi için dil ve ses listesine bakın.

Mart 2023 sürümü

Yeni özellikler

Konuşma Sentezi Biçimlendirme Dili (SSML), cihazlardaki belirli senaryolar için sentezlenmiş konuşma çıkışının kalitesini en iyi duruma getiren ses efekti işlemci öğelerini destekleyecek şekilde güncelleştirilir. Konuşma sentezi işaretlemesi hakkında daha fazla bilgi edinin.

Özel sinir sesi

Özel sinir sesi Pro ile yerel ayar desteği nl-BE eklendi. Daha fazla bilgi için tam dil ve ses listesine bakın.

Önceden Oluşturulmuş Nöral TTS Sesleri

Aşağıdaki sesler artık genel kullanıma sunulmuştur. Daha fazla bilgi için tam dil ve ses listesine bakın.

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`en-AU`	İngilizce (Avustralya)	`en-AU-AnnetteNeural` (Kadın) `en-AU-CarlyNeural` (Kadın) `en-AU-DarrenNeural` (Erkek) `en-AU-DuncanNeural` (Erkek) `en-AU-ElsieNeural` (Kadın) `en-AU-FreyaNeural` (Kadın) `en-AU-JoanneNeural` (Kadın) `en-AU-KenNeural` (Erkek) `en-AU-KimNeural` (Kadın) `en-AU-NeilNeural` (Erkek) `en-AU-TimNeural` (Erkek) `en-AU-TinaNeural` (Kadın) `en-AU-WilliamNeural` (Erkek)
`en-GB`	İngilizce (İngiltere)	`en-GB-RyanNeural` (Erkek) `en-GB-SoniaNeural` (Kadın)
`es-ES`	İspanyolca (İspanya)	`es-ES-AbrilNeural` (Kadın) `es-ES-ArnauNeural` (Erkek) `es-ES-DarioNeural` (Erkek) `es-ES-EliasNeural` (Erkek) `es-ES-EstrellaNeural` (Kadın) `es-ES-IreneNeural` (Kadın) `es-ES-LaiaNeural` (Kadın) `es-ES-LiaNeural` (Kadın) `es-ES-NilNeural` (Erkek) `es-ES-SaulNeural` (Erkek) `es-ES-TeoNeural` (Erkek) `es-ES-TrianaNeural` (Kadın) `es-ES-VeraNeural` (Kadın)
`es-MX`	İspanyolca (Meksika)	`es-MX-JorgeNeural` (Erkek)
`fr-FR`	Fransızca (Fransa)	`fr-FR-HenriNeural` (Erkek)
`it-IT`	İtalyanca (İtalya)	`it-IT-IsabellaNeural` (Kadın)
`ja-JP`	Japonca (Japonya)	`ja-JP-AoiNeural` (Kadın) `ja-JP-DaichiNeural` (Erkek) `ja-JP-MayuNeural` (Kadın) `ja-JP-NaokiNeural` (Erkek) `ja-JP-ShioriNeural` (Kadın)

Sesle stil de-DE-ConradNeural için cheerful destek eklendi.

Şubat 2023 sürümü

Önceden Oluşturulmuş Nöral TTS Sesleri

Aşağıdaki sesler artık genel kullanıma sunulmuştur. Daha fazla bilgi için tam dil ve ses listesine bakın.

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`zh-CN`	Çince (Mandarin, Basitleştirilmiş)	`zh-CN-XiaomengNeural` (Kadın) `zh-CN-XiaoyiNeural` (Kadın) `zh-CN-XiaozhenNeural` (Kadın) `zh-CN-YunfengNeural` (Erkek) `zh-CN-YunhaoNeural` (Erkek) `zh-CN-YunjianNeural` (Erkek) `zh-CN-YunxiaNeural` (Erkek) `zh-CN-YunzeNeural` (Erkek)
`zh-CN-henan`	Çince (Zhongyuan Mandarin Henan, Basitleştirilmiş)	`zh-CN-henan-YundengNeural` (Erkek)

Aralık 2022 sürümü

Toplu sentez REST API'si (Önizleme)

Batch sentez API'si şu anda genel önizleme aşamasındadır. Genel kullanıma sunulduktan sonra, Uzun Ses API'si kullanım dışıdır. Daha fazla bilgi için bkz . Toplu sentez API'sine geçiş.

Kasım 2022 sürümü

Önceden Oluşturulmuş Nöral TTS Sesleri (GA)

Aşağıdaki sesler artık genel kullanıma sunulmuştur. Daha fazla bilgi için tam dil ve ses listesine bakın.

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`es-MX`	İspanyolca (Meksika)	`es-MX-BeatrizNeural` (Kadın) `es-MX-CandelaNeural` (Kadın) `es-MX-CarlotaNeural` (Kadın) `es-MX-CecilioNeural` (Erkek) `es-MX-GerardoNeural` (Erkek) `es-MX-LarissaNeural` (Kadın) `es-MX-LibertoNeural` (Erkek) `es-MX-LucianoNeural` (Erkek) `es-MX-MarinaNeural` (Kadın) `es-MX-NuriaNeural` (Kadın) `es-MX-PelayoNeural` (Erkek) `es-MX-RenataNeural` (Kadın) `es-MX-YagoNeural` (Erkek)
`it-IT`	İtalyanca (İtalya)	`it-IT-BenignoNeural` (Erkek) `it-IT-CalimeroNeural` (Erkek) `it-IT-CataldoNeural` (Erkek) `it-IT-FabiolaNeural` (Kadın) `it-IT-FiammaNeural` (Kadın) `it-IT-GianniNeural` (Erkek) `it-IT-ImeldaNeural` (Kadın) `it-IT-IrmaNeural` (Kadın) `it-IT-LisandroNeural` (Erkek) `it-IT-PalmiraNeural` (Kadın) `it-IT-PierinaNeural` (Kadın) `it-IT-RinaldoNeural` (Erkek)
`pt-BR`	Portekizce (Brezilya)	`pt-BR-BrendaNeural` (Kadın) `pt-BR-DonatoNeural` (Erkek) `pt-BR-ElzaNeural` (Kadın) `pt-BR-FabioNeural` (Erkek) `pt-BR-GiovannaNeural` (Kadın) `pt-BR-HumbertoNeural` (Erkek) `pt-BR-JulioNeural` (Erkek) `pt-BR-LeilaNeural` (Kadın) `pt-BR-LeticiaNeural` (Kadın) `pt-BR-ManuelaNeural` (Kadın) `pt-BR-NicolauNeural` (Erkek) `pt-BR-ValerioNeural` (Erkek) `pt-BR-YaraNeural` (Kadın)

Özel sinir sesi

Özel sinir sesi için aşağıdaki yerel ayar desteği eklenmiştir. Daha fazla bilgi için tam dil ve ses listesine bakın.

Özel sinir sesi Pro ile yerel ayar desteği fr-BE eklendi.
Özel nöral voice lite ile yerel ayar desteği es-ES eklendi.

Ekim 2022 sürümü

Önceden Oluşturulmuş Nöral TTS Sesleri (GA)

Aşağıdaki sesler artık genel kullanıma sunulmuştur. Daha fazla bilgi için tam dil ve ses listesine bakın.

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`eu-ES`	Baskça	`eu-ES-AinhoaNeural` (Kadın) `eu-ES-AnderNeural` (Erkek)
`hy-AM`	Ermenice (Ermenistan)	`hy-AM-AnahitNeural` (Kadın) `hy-AM-HaykNeural` (Erkek)

Önceden Oluşturulmuş Nöral TTS Sesleri (Önizleme)

Aşağıdaki sesler artık genel önizlemede kullanılabilir. Daha fazla bilgi için tam dil ve ses listesine bakın.

Yerel Ayar (BCP-47)	Dil	Metin okuma sesleri
`en-AU`	İngilizce (Avustralya)	`en-AU-AnnetteNeural`(Kadın) `en-AU-CarlyNeural`(Kadın) `en-AU-DarrenNeural`(Erkek) `en-AU-DuncanNeural`(Erkek) `en-AU-ElsieNeural`(Kadın) `en-AU-FreyaNeural`(Kadın) `en-AU-JoanneNeural`(Kadın) `en-AU-KenNeural`(Erkek) `en-AU-KimNeural`(Kadın) `en-AU-NeilNeural`(Erkek) `en-AU-TimNeural`(Erkek) `en-AU-TinaNeural`(Kadın)
`es-ES`	İspanyolca (İspanya)	`es-ES-AbrilNeural`(Kadın) `es-ES-AlvaroNeural`(Erkek) `es-ES-ArnauNeural`(Erkek) `es-ES-DarioNeural`(Erkek) `es-ES-EliasNeural`(Erkek) `es-ES-EstrellaNeural`(Kadın) `es-ES-IreneNeural`(Kadın) `es-ES-LaiaNeural`(Kadın) `es-ES-LiaNeural`(Kadın) `es-ES-NilNeural`(Erkek) `es-ES-SaulNeural`(Erkek) `es-ES-TeoNeural`(Erkek) `es-ES-TrianaNeural`(Kadın) `es-ES-VeraNeural`(Kadın)
`ja-JP`	Japonca (Japonya)	`ja-JP-AoiNeural`(Kadın) `ja-JP-DaichiNeural`(Erkek) `ja-JP-MayuNeural`(Kadın) `ja-JP-NaokiNeural`(Erkek) `ja-JP-ShioriNeural`(Kadın)
`ko-KR`	Korece (Kore)	`ko-KR-BongJinNeural`(Erkek) `ko-KR-GookMinNeural`(Erkek) `ko-KR-JiMinNeural`(Kadın) `ko-KR-SeoHyeonNeural`(Kadın) `ko-KR-SoonBokNeural`(Kadın) `ko-KR-YuJinNeural`(Kadın)
`wuu-CN`	Çince (Wu, Basitleştirilmiş)	`wuu-CN-XiaotongNeural` (Kadın) `wuu-CN-YunzheNeural` (Erkek)
`yue-CN`	Çince (Kantonca, Basitleştirilmiş)	`yue-CN-XiaoMinNeural` (Kadın) `yue-CN-YunSongNeural` (Erkek)

Genel TTS ses güncelleştirmeleri

ve fil-PH-BlessicaNeural sesleri için fil-PH-AngeloNeural geliştirilmiş kalite.
Metin Normalleştirme kuralları, İspanyolca (Şili) ve uz-UZ Özbek (Özbekistan) yerel ayarlarına sahip es-CL sesler için güncelleştirilir.
Arnavut (Arnavutluk) ve az-AZ Azerbaycan (Azerbaycan) yerel ayarlarıyla sq-AL seslerde İngilizce harf yazım denetimi eklendi.
Ses için zh-HK-WanLungNeural iyileştirilmiş İngilizce telaffuz.
ve pt-BR-AntonioNeural sesleri için geliştirilmiş soru tonunl-NL-MaartenNeural.
Aşağıdaki seslerle daha iyi İngilizce söylenişi <lang ="en-US"> için etiket desteği eklendi: de-DE-ConradNeural, de-DE-KatjaNeural, es-ES-AlvaroNeural, es-MX-DaliaNeural, es-MX-JorgeNeural, , fr-CA-SylvieNeural, fr-FR-DeniseNeural, fr-FR-HenriNeural, it-IT-DiegoNeuralve it-IT-IsabellaNeural.
Etiketi için style="chat" şu seslere sahip destek eklendi: en-GB-RyanNeural, es-MX-JorgeNeuralve it-IT-IsabellaNeural.
Etiketi için style="cheerful" şu seslere sahip destek eklendi: en-GB-RyanNeural, en-GB-SoniaNeural, es-MX-JorgeNeural, fr-FR-DeniseNeural, fr-FR-HenriNeural, ve it-IT-IsabellaNeural.
Etiketi için style="sad" şu seslere sahip destek eklendi: en-GB-SoniaNeural, fr-FR-DeniseNeural ve fr-FR-HenriNeural.

Eylül 2022 sürümü

Önceden Oluşturulmuş Sinir TTS Sesi

Önceden oluşturulmuş tüm nöral sesler 48kHz örnek hızıyla yüksek aslına uygun seslere yükseltilmiştir.

Ağustos 2022 sürümü

Önceden Oluşturulmuş Sinir TTS Sesi

Genel önizlemede yeni sesler yayınlandı:

İngilizce için Sesler (Birleşik Devletler): en-US-AIGenerate1Neural ve en-US-AIGenerate2Neural.
Çince bölgesel diller için sesler: zh-CN-henan-YundengNeural, zh-CN-shaanxi-XiaoniNeuralve zh-CN-shandong-YunxiangNeural.

Daha fazla bilgi için dil ve ses listesine bakın.

Temmuz 2022 sürümü

Önceden Oluşturulmuş Sinir TTS Sesi

Genel Önizleme'de zh-CN 5 yeni Çince (Mandarin, Basitleştirilmiş) ve 1 yeni İngilizce (Birleşik Devletler) sesi en-US eklendi. Tam dil ve ses listesine bakın.

Dil	Yerel ayar	Cinsiyet	Ses adı	Stil desteği
Çince (Mandarin, Basitleştirilmiş)	`zh-CN`	Kadın	`zh-CN-XiaomengNeural`^New	Genel, SSML kullanılarak kullanılabilen birden çok stil
Çince (Mandarin, Basitleştirilmiş)	`zh-CN`	Kadın	`zh-CN-XiaoyiNeural`^New	Genel, SSML kullanılarak kullanılabilen birden çok stil
Çince (Mandarin, Basitleştirilmiş)	`zh-CN`	Kadın	`zh-CN-XiaozhenNeural`^New	Genel, SSML kullanılarak kullanılabilen birden çok stil
Çince (Mandarin, Basitleştirilmiş)	`zh-CN`	Erkek	`zh-CN-YunxiaNeural`^New	Genel, SSML kullanılarak kullanılabilen birden çok stil
Çince (Mandarin, Basitleştirilmiş)	`zh-CN`	Erkek	`zh-CN-YunzeNeural`^New	Genel, SSML kullanılarak kullanılabilen birden çok stil
İngilizce (ABD)	`en-US`	Erkek	`en-US-RogerNeural`^New	Genel

Eklenen sinir sesleri için desteklenen stiller ve roller.

Ses	Stiller	Stil derecesi	Roller
zh-CN-XiaomengNeural ^{Genel önizlemesi}	`chat`	Desteklenir
zh-CN-XiaoyiNeural ^{Genel önizlemesi}	`affectionate`, `angry`, `cheerful`, , `disgruntled`, `embarrassed`, `fearful`, `gentle`, `sad`, `serious`	Desteklenir
zh-CN-XiaozhenNeural ^{Genel önizlemesi}	`angry`, `cheerful`, `disgruntled`, , `fearful`, `sad`, `serious`	Desteklenir
zh-CN-YunxiaNeural ^{Genel önizlemesi}	`angry`, `calm`, `cheerful`, `fearful`, , `sad`	Desteklenir
zh-CN-YunzeNeural ^{Genel önizlemesi}	`angry`, `calm`, `cheerful`, , `depressed`, `disgruntled`, `documentary-narration`, `fearful`, `sad`, `serious`	Desteklenir	Desteklenir

Viseme ile yüz konumunu alma

Tasarladığınız bir 3B karakterin yüz hareketlerini yönlendirmek için blend şekilleri desteği eklendi. Viseme ile yüz pozisyonu alma hakkında daha fazla bilgi edinin.
SSML, viseme öğesini destekleyecek şekilde güncelleştirildi. Bkz. konuşma sentezi işaretlemesi.

Haziran 2022 sürümü

Önceden Oluşturulmuş Sinir TTS Sesi

Nöral metin için konuşmaya 9 yeni dil ve çeşit eklendi:

Dil	Yerel ayar	Cinsiyet	Ses adı	Stil desteği
Arapça (Lübnan)	`ar-LB`	Kadın	`ar-LB-LaylaNeural`^New	Genel
Arapça (Lübnan)	`ar-LB`	Erkek	`ar-LB-RamiNeural`^New	Genel
Arapça (Umman)	`ar-OM`	Kadın	`ar-OM-AyshaNeural`^New	Genel
Arapça (Umman)	`ar-OM`	Erkek	`ar-OM-AbdullahNeural`^New	Genel
Azerbaycan dili (Azerbaycan)	`az-AZ`	Kadın	`az-AZ-BabekNeural`^New	Genel
Azerbaycan dili (Azerbaycan)	`az-AZ`	Erkek	`az-AZ-BanuNeural`^New	Genel
Boşnakça (Bosna-Hersek)	`bs-BA`	Kadın	`bs-BA-VesnaNeural`^New	Genel
Boşnakça (Bosna-Hersek)	`bs-BA`	Erkek	`bs-BA-GoranNeural`^New	Genel
Gürcüce (Gürcistan)	`ka-GE`	Kadın	`ka-GE-EkaNeural`^New	Genel
Gürcüce (Gürcistan)	`ka-GE`	Erkek	`ka-GE-GiorgiNeural`^New	Genel
Moğolca (Moğolistan)	`mn-MN`	Kadın	`mn-MN-YesuiNeural`^New	Genel
Moğolca (Moğolistan)	`mn-MN`	Erkek	`mn-MN-BataaNeural`^New	Genel
Nepal dili (Nepal)	`ne-NP`	Kadın	`ne-NP-HemkalaNeural`^New	Genel
Nepal dili (Nepal)	`ne-NP`	Erkek	`ne-NP-SagarNeural`^New	Genel
Arnavut dili (Arnavutluk)	`sq-AL`	Kadın	`sq-AL-AnilaNeural`^New	Genel
Arnavut dili (Arnavutluk)	`sq-AL`	Erkek	`sq-AL-IlirNeural`^New	Genel
Tamil dili (Malezya)	`ta-MY`	Kadın	`ta-MY-KaniNeural`^New	Genel
Tamil dili (Malezya)	`ta-MY`	Erkek	`ta-MY-SuryaNeural`^New	Genel

İngilizce (Birleşik Krallık), fr-FR Fransızca (Fransa) ve de-DE Almanca (Almanya) için en-GB Genel Önizleme'den GA 36 sesleri:

Dil	Yerel ayar	Cinsiyet	Ses adı	Stil desteği
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-AbbiNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-BellaNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-HollieNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-MaisieNeural`	Genel, çocuk sesi
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-OliviaNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-SoniaNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-AlfieNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-ElliotNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-EthanNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-NoahNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-OliverNeural`	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-ThomasNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-BrigitteNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-CelesteNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-CoralieNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-EloiseNeural`	Genel, çocuk sesi
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-JacquelineNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-JosephineNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-YvetteNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-AlainNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-ClaudeNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-JeromeNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-MauriceNeural`	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-YvesNeural`	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-AmalaNeural`	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-ElkeNeural`	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-GiselaNeural`	Genel, çocuk sesi
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-KlarissaNeural`	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-LouisaNeural`	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-MajaNeural`	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-TanjaNeural`	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-BerndNeural`	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-ChristophNeural`	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-KasperNeural`	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-KillianNeural`	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-KlausNeural`	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-RalfNeural`	Genel

Genel Önizleme'de İspanyolca (Meksika), İtalyanca (İtalya), it-ITpt-BR Portekizce (Brezilya) ve Çince (Mandarin, Basitleştirilmiş) için zh-CN 2 temanın 40 yeni sesi es-MX eklendi:

Dil	Yerel ayar	Cinsiyet	Ses adı	Stil desteği
İspanyolca (Meksika)	`es-MX`	Kadın	`es-MX-BeatrizNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Kadın	`es-MX-CarlotaNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Kadın	`es-MX-NuriaNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Kadın	`es-MX-RenataNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Kadın	`es-MX-LarissaNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Kadın	`es-MX-CandelaNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Kadın	`es-MX-MarinaNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Kadın	`it-IT-FiammaNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Kadın	`it-IT-IrmaNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Kadın	`it-IT-FabiolaNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Kadın	`it-IT-PalmiraNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Kadın	`it-IT-ImeldaNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Kadın	`it-IT-PierinaNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Kadın	`pt-BR-ElzaNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Kadın	`pt-BR-ManuelaNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Kadın	`pt-BR-BrendaNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Kadın	`pt-BR-LeilaNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Kadın	`pt-BR-YaraNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Kadın	`pt-BR-GiovannaNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Kadın	`pt-BR-LeticiaNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Erkek	`es-MX-CecilioNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Erkek	`es-MX-LibertoNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Erkek	`es-MX-LucianoNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Erkek	`es-MX-PelayoNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Erkek	`es-MX-YagoNeural`^New	Genel
İspanyolca (Meksika)	`es-MX`	Erkek	`es-MX-GerardoNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Erkek	`it-IT-BenignoNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Erkek	`it-IT-CataldoNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Erkek	`it-IT-LisandroNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Erkek	`it-IT-CalimeroNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Erkek	`it-IT-RinaldoNeural`^New	Genel
İtalyanca (İtalya)	`it-IT`	Erkek	`it-IT-GianniNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Erkek	`pt-BR-DonatoNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Erkek	`pt-BR-HumbertoNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Erkek	`pt-BR-FabioNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Erkek	`pt-BR-JulioNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Erkek	`pt-BR-ValerioNeural`^New	Genel
Portekizce (Brezilya)	`pt-BR`	Erkek	`pt-BR-NicolauNeural`^New	Genel
Çince (Mandarin, Basitleştirilmiş)	`zh-CN-sichuan`	Erkek	`zh-CN-sichuan-YunxiSichuanNeural`^New	Genel, Sichuan vurgusu
Çince (Mandarin, Basitleştirilmiş)	`zh-CN-liaoning`	Kadın	`zh-CN-liaoning-XiaobeiNeural`^New	Genel, Liaoning vurgusu

ve için en-SG-LunaNeural geliştirilmiş kalite en-SG-WayneNeural
En-US-JennyNeural, en-US-AriaNeural ve zh-CN-XiaoxiaoNeural ile Genel Önizleme için 48kHz çıkış desteği

Özel sinir sesi

Veri sorunlarını çevrimiçi olarak düzeltmek için etkinleştirildi. Speech Studio'da veri sorunlarını çözme hakkında daha fazla bilgi edinin.
Eğitim tarifi sürümü eklendi. Ses modeliniz için eğitim tarifi sürümünü seçme hakkında daha fazla bilgi edinin.

Ses İçeriği Oluşturma aracı

Desteklenen sayfalandırma.
İş dosyası sayfasında ada, dosya türüne ve güncelleştirme zamanına göre genel olarak sıralamak için etkinleştirildi.

Mayıs 2022 sürümü

Önceden Oluşturulmuş Sinir TTS Sesi

Amerikan İngilizcesi'ndeki çeşitliliği zenginleştirmek için birden çok stile sahip genel önizlemede 5 yeni ses yayınlandı. Tam dil ve ses listesine bakın.
için bu yeni stilleri Angry, ExcitedFriendly, Hopeful, , Sad, Shouting, , TerrifiedUnfriendlyve Whispering genel önizlemede en-US-AriaNeuraldestekleyin.
için bu yeni stilleri Angry, , ExcitedCheerful, Friendly, Hopeful, Sad, Shouting, UnfriendlyTerrified ve Whispering genel önizlemede en-US-GuyNeuralen-US-JennyNeuraldestekleyin.
için bu yeni stilleri Excited, Friendly, HopefulShouting, , UnfriendlyTerrified ve Whispering genel önizlemede en-US-SaraNeuraldestekleyin. Bkz . ses stilleri ve rolleri.
Genel önizlemede , zh-CN-YunhaoNeuralve zh-CN-YunfengNeural yeni sesler zh-CN-YunjianNeuralyayınlandı. Tam dil ve ses listesine bakın.
için genel önizlemede zh-CN-YunjianNeural2 yeni stili destekleyin.sports-commentarysports-commentary-excited Bkz . ses stilleri ve rolleri.
için genel önizlemede 1 yeni stil advertisement-upbeat desteği zh-CN-YunhaoNeural. Bkz . ses stilleri ve rolleri.
cheerful ve sad stilleri fr-FR-DeniseNeural genel olarak tüm bölgelerde kullanılabilir.
SSML, en-US ve en-AU sesleri için MathML öğelerini destekleyecek şekilde güncelleştirildi. Konuşma sentezi işaretlemesi hakkında daha fazla bilgi edinin.

Özel sinir sesi

Eğitim ses modeli sırasında eğitimi iptal etmek için etkinleştirildi. Eğitimi iptal etme hakkında daha fazla bilgi edinin.
Modeli kopyalamak için etkinleştirildi (ses modelini yeniden adlandırın). Ses modelinizi yeniden adlandırma hakkında daha fazla bilgi edinin.
Kendi test betiğinizi ekleyerek ses modelinizi test etmek için etkinleştirildi. Test betiğinizi karşıya yükleme hakkında daha fazla bilgi edinin.
Ses modelinizin altyapı sürümünü güncelleştirmek için etkinleştirildi. Model altyapısı sürümünü güncelleştirme hakkında daha fazla bilgi edinin.
Daha fazla eğitim bölgesi desteklenir. Bkz. bölge desteği.
Özel nöral voice lite (önizleme) için desteklenen 10 yerel ayar. Bkz. dil desteği.

Ses İçeriği Oluşturma aracı

Oturum açmadan Ses İçeriği Oluşturma aracını denemek için etkinleştirildi.
Fonemleri ayarlamak için geliştirilmiş düzen.
Gelişmiş performans: Bir kerede karşıya yüklenecek en fazla dosya sayısı (200) belirtildi.
Gelişmiş performans: En yüksek dizin derinliği düzeyini (5 düzey) belirtti.

Mart 2022 sürümü

Önceden Oluşturulmuş Sinir TTS Sesi

ile fr-FR-DeniseNeuralve Sad stilleri için genel önizleme desteği Cheerful eklendi. Bkz . ses stilleri ve rolleri.
Genel önizlemede önceden oluşturulmuş nöral TTS sesleri için bağlantısız kapsayıcılar yayınlandı. Bkz . Bağlantısız ortamlarda Docker kapsayıcılarını kullanma.

Özel sinir sesi

Desteklenen rol tabanlı erişim denetimi. Speech Studio'da Azure rol tabanlı erişim denetimi hakkında daha fazla bilgi edinin
Desteklenen özel uç noktalar ve sanal ağ hizmet uç noktaları. Konuşma hizmetiyle özel uç noktaları kullanma hakkında daha fazla bilgi edinin.

Ses İçeriği Oluşturma aracı

Konuşma SDK'sı ve API'leri ile deneyimi tutarlı hale getirmek için serbest katman (F0) kaynakları için dosya boyutu ve eşzamanlılık sınırı güncelleştirildi. Bkz. konuşma hizmeti kotaları ve sınırları.

Şubat 2022 sürümü

Özel sinir sesi

Genel önizlemede özel nöral voice lite yayınlandı. Özel nöral voice lite nedir hakkında daha fazla bilgi edinin.
49 yerel ayara genişletilmiş dil desteği. Bkz. dil desteği.
Desteklenen daha fazla bölge/veri merkezi. Bkz. bölge desteği.

Ses İçeriği Oluşturma aracı

Sesleri indirmek için çıkış uzunluğu sınırı kaldırıldı.

Ocak 2022 sürümü

Yeni diller ve sesler

Nöral metin için konuşmaya 10 yeni dil ve çeşit eklendi:

Dil	Yerel ayar	Cinsiyet	Ses adı	Stil desteği
Bengal dili (Hindistan)	`bn-IN`	Kadın	`bn-IN-TanishaaNeural`^New	Genel
Bengal dili (Hindistan)	`bn-IN`	Erkek	`bn-IN-BashkarNeural`^New	Genel
İzlanda dili (İzlanda)	`is-IS`	Kadın	`is-IS-GudrunNeural`^New	Genel
İzlanda dili (İzlanda)	`is-IS`	Erkek	`is-IS-GunnarNeural`^New	Genel
Kannada dili (Hindistan)	`kn-IN`	Kadın	`kn-IN-SapnaNeural`^New	Genel
Kannada dili (Hindistan)	`kn-IN`	Erkek	`kn-IN-GaganNeural`^New	Genel
Kazakça (Kazakistan)	`kk-KZ`	Kadın	`kk-KZ-AigulNeural`^New	Genel
Kazakça (Kazakistan)	`kk-KZ`	Erkek	`kk-KZ-DauletNeural`^New	Genel
Lao (Laos)	`lo-LA`	Kadın	`lo-LA-KeomanyNeural`^New	Genel
Lao (Laos)	`lo-LA`	Erkek	`lo-LA-ChanthavongNeural`^New	Genel
Makedon dili (Kuzey Makedonya Cumhuriyeti)	`mk-MK`	Kadın	`mk-MK-MarijaNeural`^New	Genel
Makedon dili (Kuzey Makedonya Cumhuriyeti)	`mk-MK`	Erkek	`mk-MK-AleksandarNeural`^New	Genel
Malayalam dili (Hindistan)	`ml-IN`	Kadın	`ml-IN-SobhanaNeural`^New	Genel
Malayalam dili (Hindistan)	`ml-IN`	Erkek	`ml-IN-MidhunNeural`^New	Genel
Peşto (Afganistan)	`ps-AF`	Kadın	`ps-AF-LatifaNeural`^New	Genel
Peşto (Afganistan)	`ps-AF`	Erkek	`ps-AF-GulNawazNeural`^New	Genel
Sırpça (Sırbistan, Kiril)	`sr-RS`	Kadın	`sr-RS-SophieNeural`^New	Genel
Sırpça (Sırbistan, Kiril)	`sr-RS`	Erkek	`sr-RS-NicholasNeural`^New	Genel
Sinhala (Sri Lanka)	`si-LK`	Kadın	`si-LK-ThiliniNeural`^New	Genel
Sinhala (Sri Lanka)	`si-LK`	Erkek	`si-LK-SameeraNeural`^New	Genel

Kullanılabilir seslerin tam listesi için bkz . Dil desteği.

Önizlemede yeni sesler

Önizlemede en-GB, fr-FR ve de-DE için yeni sesler eklendi:

Dil	Yerel ayar	Cinsiyet	Ses adı	Stil desteği
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-AbbiNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-BellaNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-HollieNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Kadın	`en-GB-OliviaNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Kız	`en-GB-MaisieNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-AlfieNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-ElliotNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-EthanNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-NoahNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-OliverNeural`^New	Genel
İngilizce (İngiltere)	`en-GB`	Erkek	`en-GB-ThomasNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-BrigitteNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-CelesteNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-CoralieNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-JacquelineNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-JosephineNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Kadın	`fr-FR-YvetteNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Kız	`fr-FR-EloiseNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-AlainNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-ClaudeNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-JeromeNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-MauriceNeural`^New	Genel
Fransızca (Fransa)	`fr-FR`	Erkek	`fr-FR-YvesNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-AmalaNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-ElkeNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-KlarissaNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-LouisaNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-MajaNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Kadın	`de-DE-TanjaNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Kız	`de-DE-GiselaNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-BerndNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-ChristophNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-KasperNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-KillianNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-KlausNeural`^New	Genel
Almanca (Almanya)	`de-DE`	Erkek	`de-DE-RalfNeural`^New	Genel

Kullanılabilir seslerin tam listesi için bkz . Dil desteği.

Söyleniş doğruluğu

Tüm he-IL sesler için iyileştirilmiş İngilizce sözcük söylenişi.
ve da-DKiçin cs-CZ sözcük düzeyinde telaffuz doğruluğu geliştirildi.
Arapça aksan ve İbranice Nikud işleme geliştirildi.
için geliştirilmiş varlık okuma ja-JP

Speech Studio

Özel sinir sesi: toplu iş API'sini (uzun ses API'si) kullanarak ek model testi etkinleştirildi
Ses İçeriği Oluşturma: daha fazla çıkış biçimi etkinleştirildi

Ekim 2021 sürümü

Yeni diller ve sesler

Nöral metin için 49 yeni dil ve 98 ses eklendi:

Afrikaan'da af-ZA Adri (Güney Afrika), Afrikaan'da af-ZA Willem (Güney Afrika), Amharca'da am-ET Mekdes (Etiyopya), Amharca'da am-ET Ameha (Etiyopya), Arapça Fatima ar-AE (Birleşik Arap Emirlikleri), Arapça Hamdan ar-AE (Birleşik Arap Emirlikleri), Arapça Laila ar-BH (Bahreyn), Arapça Ali ar-BH (Bahreyn), Arapça Amina ar-DZ (Cezayir), Arapça İsmael ar-DZ (Cezayir), Arapça Rana ar-IQ (Irak), Arapça Bassel ar-IQ (Irak), Sana in ar-JO Arapça (Ürdün), Arapça taim ar-JO (Ürdün), Arapça (Ürdün), Arapça Noura ar-KW (Kuveyt), Arapça Fahed ar-KW (Kuveyt), Arapça İman ar-LY (Libya), Arapçada Ömer ar-LY (Libya), Arapça Mouna ar-MA (Fas), ArapçaDa Jamal ar-MA (Fas), Arapçada ar-QA Amal (Katar), Arapça Moaz ar-QA (Katar), Arapçada Amany ar-SY (Suriye), Arapçada Laith ar-SY (Suriye), Arapça Reem ar-TN (Tunus), Arapçada Hediar-TN, Arapçada Maryam ar-YE (Yemen), Arapçada ar-YE Saleh (Yemen), Bangla'da bn-BD Nabanita (Bangladeş), Bangla'da bn-BD Pradeep (Bangladeş), İngilizce Asilia en-KE (Kenya), İngilizce Şilimba en-KE (Kenya), İngilizce Ezinne en-NG (Nijerya), Abeo en-NG İngilizce (Nijerya), İngilizce Imani en-TZ (Tanzanya), İngilizce Elimu en-TZ (Tanzanya), sofya es-BO İspanyolca (Bolivya), Marcelo es-BO İspanyolca (Bolivya), Katalina es-CL İspanyolca (Şili), Lorenzo es-CL İspanyolca (Şili), Maria es-CR İspanyolca (Kosta Rika), İspanyolcada Juan es-CR (Kosta Rika), İspanyolca 'da es-CU Belkys (Küba), manuel es-CU İspanyolca (Küba), Ramona es-DO İspanyolca (Dominik Cumhuriyeti), Emilio es-DO İspanyolca (Dominik Cumhuriyeti), Andrea es-EC İspanyolca (Ekvador), Luis es-EC İspanyolca (Ekvador), Teresa es-GQ İspanyolca (Ekvator Ginesi), Javier İspanyolca (Ekvator Ginesi), İspanyolca 'da es-GTes-GQ Marta (Guatemala), Andres es-GT İspanyolca (Guatemala), Karla es-HN İspanyolca (Honduras), carlos in es-HN İspanyolca (Honduras), Yolanda in es-NI İspanyolca (Nikaragua), Federico in es-NI İspanyolca (Nikaragua), Margarita in es-PA İspanyolca (Panama), Roberto in es-PA İspanyolca (Panama), Camila in es-PE İspanyolca (Peru), alex es-PE İspanyolca (Peru), Karina es-PR İspanyolca (Porto Riko), Victor es-PR İspanyolca (Porto Riko), Tania es-PY İspanyolca (Paraguay), Mario es-PY İspanyolca (Paraguay), Lorena es-SV İspanyolca (El Salvador), Rodrigo içinde es-SV İspanyolca (El Salvador), İspanyolca (Uruguay), Mateo es-UYes-UY İspanyolca (Uruguay), Paola es-VE İspanyolca (Venezuela), Sebastian es-VE İspanyolca (Venezuela), Dilara fa-IR farsça (İran), Farsça fa-IR (İran), Blessica fil-PH In Filipinli (Filipinler), Angelo fil-PH Filipinli (Filipinler), Sabela galiçya, gl-ES Galiçya'da gl-ES Roi, Javanese'de jv-ID Siti (Endonezya), Javanese'de jv-ID Dimas (Endonezya), Khmer'de km-KH Sreymom (Kamboçya), Piseth in km-KH Khmer (Kamboçya), Nilar in my-MM Burma dili (Myanmar), Burmese'de my-MM Thiha (Myanmar), Somali'de Ubax (Somali), Somali'de so-SOso-SO Muuse (Somali), Sundanese'de su-ID Tuti (Endonezya), Sundanese'de Jajang (Endonezya), Swahili'de su-IDsw-TZ Rehema (Tanzanya) ), Svahili'de sw-TZ Daudi (Tanzanya), Tamil'de ta-LK Saranya (Sri Lanka), Tamil'de ta-LK Kumar (Sri Lanka), Tamil'de ta-SG Venba (Singapur), Tamil dilinde Anbu (Singapur), Urduca'da ta-SG Gül (Hindistan), Urduca'da ur-INur-IN Salman (Hindistan), Özbekçe'de uz-UZ Madina (Özbekistan), Özbekçe'de uz-UZ Sardor (Özbekistan), Zulu'da zu-ZA Thando (Güney Afrika), Zulu'da zu-ZA Themba (Güney Afrika).

Eylül 2021 sürümü

İngilizce (ABD) dilinde en-US yeni sohbet botu sesi: Sara, daha rahat konuşan ve sohbet botu senaryolarına en uygun genç kadın yetişkini temsil eder.
Japon sesi Nanami için ja-JP yeni stiller eklendi: Nanami ile artık üç yeni stil kullanılabilir: sohbet, müşteri hizmetleri ve neşeli.
Genel telaffuz geliştirmesi: Ardi in id-ID, Premwadee in th-TH, Christel in da-DK, HoaiMy ve NamMinh in vi-VN.
Önizlemede zh-CNÇince (Mandarin, Çin) olarak iki yeni ses: Xiaochen & Xiaoyan, spontane konuşma ve müşteri hizmetleri senaryoları için optimize edilmiştir.

Temmuz 2021 sürümü

Nöral metinden konuşmaya güncelleştirmeler

İbranice'de telaffuz hataları %20 azaltıldı.

Speech Studio güncelleştirmeleri

Özel sinir sesi: Eğitim işlem hattı UniTTSv3 olarak güncelleştirildi. Bu işlem hattında model kalitesi artırılırken akustik modeller için eğitim süresi %50 azaltıldı.
Ses İçeriği Oluşturma: "Dışarı Aktarma" performans sorunu ve özel sinir sesi seçimindeki hata düzeltildi.

Haziran 2021 sürümü

Speech Studio güncelleştirmeleri

Özel nöral ses: Güneydoğu Asya'ya destek olmak için genişletilmiş özel sinir sesi eğitimi. Veri yükleme durum denetimini desteklemek için kullanıma sunulan yeni özellikler.
Ses İçeriği Oluşturma: Özel sözlüğü desteklemek için yeni bir özellik yayınlandı. Bu özellik sayesinde kullanıcılar kolayca sözlük dosyalarını oluşturabilir ve ses çıkışları için özelleştirilmiş söylenişi tanımlayabilir.

Mayıs 2021 sürümü

Nöral TTS için yeni diller ve sesler eklendi

Tanıtılan on yeni dil - Nöral TTS dil listesine 10 yeni yerel ayarda 20 yeni ses eklendi: en-HK İngilizce yan (Hongkong), en-HK sam in english (Hongkong), Molly in en-NZ english (New Zealand), Mitchell in en-NZ english (New Zealand), Luna in en-SG English (Singapur), Wayne en-SG in English (Singapur), Leah in en-ZA english (Güney Africa), Luke en-ZA in English (Güney Africa), Dhwani in gu-IN Gujarati (Hindistan), gu-IN Gujarati(Hindistan), Aarohi in mr-IN Marathi (Hindistan), Manohar in mr-IN Marathi (Hindistan), Elena es-AR in İspanyolca (Arjantin), Tomas es-AR in İspanyolca (Arjantin), Salome es-CO in İspanyolca (Kolombiya), Gonzalo es-CO in İspanyolca (Kolombiya), Paloma es-US in İspanyolca (ABD), Alonso es-US in İspanyolca (ABD), Zuri in sw-KE Swahili (Kenya), Rafiki in sw-KE Swahili (Kenya).
Önizlemede on bir yeni en-US sesi - Önizlemede 11 yeni EN-US sesi Amerikan İngilizcesine eklendi, Ashley, Amber, Ana, Brandon, Christopher, Cora, Elizabeth, Eric, Michelle, Monica, Jacob.
Beş zh-CN Çince (Mandarin, Basitleştirilmiş) ses genel olarak kullanılabilir - 5 Çince (Mandarin, Basitleştirilmiş) ses önizlemeden genel kullanıma sunuldu olarak değiştirilir. Bunlar Yunxi, Xiaomo, Xiaoman, Xiaoxuan, Xiaorui. Artık bu sesler tüm bölgelerde kullanılabilir. Yunxi, sohbet botu ve ses aracısı için uygun olan yeni bir 'asistan' stiliyle eklenir. Xiaomo'nun ses stilleri daha doğal ve öne çıkan olacak şekilde geliştirilmiştir.

Nisan 2021 sürümü

Nöral metin okuma özelliği 21 bölgede kullanılabilir

Eklenen on iki yeni bölge - Konuşmaya nöral metin şu yeni 12 bölgede kullanılabilir: Japan East, Japan West, Korea Central, , North Central US, North Europe, , South Central US, west Central USUK SouthWest EuropeSoutheast AsiaWest US, . West US 2 Desteklenen 21 bölgenin tam listesi için buraya bakın.

Mart 2021 sürümü

Nöral TTS için yeni diller ve sesler eklendi

Altı yeni dil eklendi - Nöral TTS dil listesine 6 yeni yerel ayarda 12 yeni ses eklendi: Galce'de cy-GB Nia (Birleşik Krallık), Galce'de cy-GB Aled (Birleşik Krallık), İngilizce Rosa en-PH (Filipinler), İngilizce James en-PH (Filipinler), Fransızca Charline (Belçika), Fransızca'da fr-BEfr-BE Gerard (Belçika), Felemenkçe'de nl-BE Dena (Belçika), Felemenkçe Arnaud nl-BE (Belçika), Ukraynaca Polina uk-UA (Ukrayna), Ukraynaca uk-UA Ostap (Ukrayna), Urduca Uzma ur-PK (Pakistan), Urduca Asad ur-PK (Pakistan).
Önizlemeden GA'ya beş dil - Kasım ayında tanıtılan 5 yerel ayarda 10 ses ga: Estonya'da et-EE Kert (Estonya), İrlanda'da Colm (İrlanda), Letonya'da lv-LVga-IE Niller (Letonya), Litvanyalı Leonas lt-LT (Litvanya), Malta'da mt-MT Joseph (Malta).
Fransızca (Kanada) için yeni erkek sesi eklendi - Antoine fransızca (Kanada) için fr-CA yeni bir ses eklendi.
Kalite iyileştirmesi - Macarcada hu-HU söyleniş hata oranının azaltılması - %48,17, nb-NO Norveç dili - %52,76, nl-NL Felemenkçe (Hollanda) - %22,11.

Bu sürümle birlikte 60 dilde/yerel ayarda toplam 142 sinir sesini destekliyoruz. Ayrıca 49 dilde/yerel ayarda 70'in üzerinde standart ses mevcuttur. Tam liste için Dil desteği sayfasını ziyaret edin.

Karakterlere animasyon eklemek için yüz pozu olaylarını alma

Nöral Metin okuma özelliği artık viseme olayını da içeriyor. Viseme olayları, kullanıcıların sentezlenmiş konuşmayla birlikte bir dizi yüz pozu almasına olanak tanır. Visemes, 2B ve 3B avatar modellerinin hareketini kontrol etmek için kullanılabilir, ağız hareketlerini sentezlenmiş konuşmayla eşleştirebilir. Viseme etkinlikleri şu anda yalnızca ses için en-US-AriaNeural kullanılabilir.

Konuşma Sentezi biçimlendirme diline (SSML) yer işareti öğesini ekleme

bookmark öğesi, ses akışındaki her işaretçinin uzaklığını elde etmek için SSML'ye özel işaretçiler eklemenize olanak tanır. Metin veya etiket dizisindeki belirli bir konuma başvurmak için kullanılabilir.

Şubat 2021 sürümü

Özel nöral ses GA

Özel sinir sesi Şubat ayında 13 dilde GA'dır: Çince (Mandarin, Basitleştirilmiş), İngilizce (Avustralya), İngilizce (Hindistan), İngilizce (Birleşik Krallık), İngilizce (Birleşik Devletler), Fransızca (Kanada), Fransızca (Fransa), Almanca (Almanya), İtalyanca (İtalya), Japonca (Japonya), Korece (Kore), Portekizce (Brezilya), İspanyolca (Meksika) ve İspanyolca (İspanya). Özel sinir sesi nedir ve bunu sorumlu bir şekilde kullanma hakkında daha fazla bilgi edinin. Özel nöral ses özelliği kayıt gerektirir ve Microsoft, Microsoft'un uygunluk ölçütlerine göre erişimi sınırlandırabilir. Sınırlı erişim hakkında daha fazla bilgi edinin.

Aralık 2020 sürümü

GA ve önizlemede yeni nöral sesler

54 dilde/yerel ayarda toplam 129 nöral ses için 51 yeni ses yayınlandı:

GA yerel ayarlarında 46 yeni ses: Arapça 'da ar-EG Shakir (Mısır), Arapça Hamed ar-SA (Suudi Arabistan), Bulgarca (Bulgaristan), Katalanca'da bg-BG Joana, Çekçe 'de ca-EScs-CZ Antonin (Çek Cumhuriyeti), Danca Jeppe da-DK (Danimarka), Almanca (Avusturya), de-AT Jan de-CH Almanca (İsviçre), Yunanca 'da el-GR Nestoras (Yunanistan), İngilizce Liam en-CA (Kanada), İngilizce connor en-IE (İrlanda), Hintçede Madhur en-IN (Hindistan), Telugu'da en-IN Mohan (Hindistan), prabhat en-IN in english (India), Valluvar in en-IN Tamil (India), Enric in es-ES Catalan, Kert in et-EE Estonya (Estonya), Harri in fi-FI Fince (Finlandiya), Selma fi-FI in Fince (Finlandiya), Fabrice fr-CH in French (İsviçre), Colm in ga-IE Irish (İrlanda), Avri he-IL in İbranice (İsrail), Srecko in hr-HR Hırvatça (Hırvatistan), Tamas in hu-HU Macarca (Macaristan), Gadis id-ID in Indonesia (Endonezya), Leonas in lt-LT Litvanca (Litvanya), Nils in lv-LV Letonca (Letonya), Malayca'da ms-MY Osman (Malezya), Malta'da mt-MT Joseph (Malta), Norveçli Finnnb-NO, Bokmål (Norveç), Norveççe Pernillenb-NO, Bokmål (Norveç), Felemenkçe (Hollanda), nl-NL Felemenkçe Maarten nl-NL (Hollanda), Lehçe agnieszka pl-PL (Polonya), Lehçe Marek pl-PL (Polonya), Portekizce Duarte pt-BR (Brezilya), Raquel pt-PT Portekizce (Potugal), Rumence Emil ro-RO (Romanya), Rusça Dmitry ru-RU (Rusya), Svetlana ru-RU Rusça (Rusya), Slovakça (Slovakya), Slovakça (Slovakya), sk-SK Rok slovence sl-SI (Slovenya), Mattias sv-SE İsveççe (İsveç), Sofie sv-SE İsveççe (İsveç), Niwat th-TH tay dili (Tayland), Ahmet tr-TR türkçe (Türkiye), NamMinh vi-VN Vietnamca (Vietnam), HsiaoChen zh-TW tayvan mandarin (Tayvan), YunJhe zh-TW Tayvan Mandarin (Tayvan), HiuMaan zh-HK Çin Kantonu (Hong Kong Özel Yönetici istrative Region), WanLung zh-HK Çin Kantonu (Hong Kong ÖİB).
Önizleme yerel ortamlarında 5 yeni ses: Estonca'da et-EE Kert (Estonya), İrlanda'da ga-IE Colm (İrlanda), Letonya'da lv-LV Nils (Letonya), Litvanca Leonas (Litvanya), Malta'da mt-MTlt-LT Joseph (Malta).

Bu sürümle birlikte 54 dilde/yerel ayarda toplam 129 sinir sesini destekliyoruz. Ayrıca 49 dilde/yerel ayarda 70'in üzerinde standart ses mevcuttur. Tam liste için Dil desteği sayfasını ziyaret edin.

Ses İçeriği Oluşturma için Güncelleştirmeler

Ses kategorileri ve ayrıntılı ses açıklamaları ile geliştirilmiş ses seçimi kullanıcı arabirimi.
Farklı dillerdeki tüm sinir sesleri için intonasyon ayarı etkinleştirildi.
Kullanıcı arabirimi yerelleştirmesini tarayıcının diline göre otomatik hale getirme.
Tüm zh-CN Nöral sesler için etkin StyleDegree denetimler. Yeni özelliklere göz atmak için Ses İçeriği Oluşturma aracını ziyaret edin.

zh-CN sesleri için Güncelleştirmeler

Tüm zh-CN sinir sesleri İngilizce konuşmayı destekleyecek şekilde güncelleştirildi.
Tonlama ayarlamasını desteklemek için tüm zh-CN sinir seslerini etkinleştirdi. En iyi tonlamayı ayarlamak için SSML veya Ses İçeriği Oluşturma aracı kullanılabilir.
Tüm zh-CN çok stilli sinir sesleri denetimi destekleyecek StyleDegree şekilde güncelleştirildi. Duygu yoğunluğu (yumuşak veya güçlü) ayarlanabilir.
Farklı duygular gerçekleştirebilen birden çok stili destekleyecek şekilde güncelleştirildi zh-CN-YunyeNeural .

Kasım 2020 sürümü

Yeni yerel ayarlar ve sesler önizlemede

Nöral metinden konuşmaya portföyüne beş yeni ses ve dil eklendi. Bunlar: Malta'da Grace (Malta), Litvanca'da Ona (Litvanya), Estonya'da Anu (Estonya), İrlanda'da Orla (İrlanda) ve Letonya'da Everita (Letonya).
Birden fazla stile ve rollere sahip beş yeni zh-CN ses: Xiaohan, Xiaomo, Xiaorui, Xiaoxuan ve Yunxi.

Bu sesler üç Azure bölgesinde genel önizlemede kullanılabilir: EastUS, SouthEastAsia ve WestEurope.

Nöral metinden konuşmaya Kapsayıcı GA

Sinir metninden konuşmaya Kapsayıcı ile geliştiriciler, belirli güvenlik ve veri idaresi gereksinimleri için kendi ortamlarındaki en doğal dijital seslerle konuşma sentezini çalıştırabilir. Konuşma Kapsayıcıları'nın nasıl yükleneceğini denetleyin.

Yeni özellikler

Özel ses: Kullanıcıların ses modelini bir bölgeden diğerine kopyalamasına olanak tanır; uç noktanın askıya alınması ve devam ettirilmesi desteklenir. Buradan portala gidin.
SSML sessizlik etiketi desteği.
Genel TTS ses kalitesi iyileştirmeleri: nb-NO'da sözcük düzeyinde telaffuz doğruluğu geliştirildi. %53 telaffuz hatası azaltıldı.

Bu teknik blogda daha fazla bilgi edinin.

Ekim 2020 sürümü

Yeni özellikler

Jenny yeni newscast bir stili destekliyor. SSML'de konuşma stillerini kullanmayı öğrenin.
Sinir sesleri, daha yüksek ses doğruluğu ve daha hızlı sentez hızıyla HiFiNet vocoder'a yükseltildi. Bu, senaryosu video dublaj, sesli kitaplar veya çevrimiçi eğitim malzemeleri dahil olmak üzere hi-fi ses veya uzun etkileşimlere dayalı olan müşterilere avantaj sağlar. Hikaye hakkında daha fazla bilgi edinin ve teknoloji topluluğu blogumuzdaki ses örneklerini dinleyin
Özel ses ve Ses İçeriği Oluşturma Studio 17 yerel ayara yerelleştirildi. Kullanıcılar daha kolay bir deneyim için kullanıcı arabirimini kolayca yerel bir dile geçebilir.
Ses İçeriği Oluşturma: XiaoxiaoNeural için stil derecesi denetimi eklendi; Özelleştirilmiş kesme özelliğini 50ms'lik artımlı kesmeler içerecek şekilde geliştirdik.

Genel TTS ses kalitesi geliştirmeleri

(hata oranı azaltma: %51) ve fi-FI (hata oranı azaltma: %58) sözcük düzeyinde telaffuz doğruluğu pl-PL iyileştirildi
Sözlük senaryosu için geliştirilmiş ja-JP tek sözcük okuma. Söyleniş hatası %80 azaltıldı.
zh-CN-XiaoxiaoNeural: Geliştirilmiş yaklaşım/CustomerService/Newscast/Cheerful/Angry tarzı ses kalitesi.
zh-CN: Geliştirilmiş Erhua söyleniş ve açık ton ve rafine uzay prosody, bu büyük ölçüde intelligibility artırır.

Eylül 2020 sürümü

Yeni özellikler

Nöral metinden konuşmaya
- 18 yeni dili/yerel ayarı destekleyecek şekilde genişletilmiştir. Bulgarca, Çekçe, Almanca (Avusturya), Almanca (İsviçre), Yunanca, İngilizce (İrlanda), Fransızca (İsviçre), İbranice, Hırvatçe, Macarca, Endonezyaca, Malayca, Rumence, Slovakça, Slovence, Tamilce, Telugu ve Vietnamcadır.
- Mevcut dillerdeki çeşitliliği zenginleştirmek için 14 yeni ses yayınlandı. Tam dil ve ses listesine bakın.
- ve zh-CN sesleri için en-US yeni konuşma stilleri. jenny, İngilizce (ABD) yeni ses sohbet botu, müşteri hizmetleri ve yardımcı stilleri destekler. Zh-CN sesimiz XiaoXiao ile 10 yeni konuşma stili mevcuttur. Buna ek olarak, XiaoXiao sinir sesi ayarlamayı destekler StyleDegree . SSML'de konuşma stillerini kullanmayı öğrenin.
Kapsayıcılar: 14 dilde kullanılabilen 16 ses ile genel önizlemede yayınlanan Kapsayıcı, nöral metinden konuşmaya. Sinir metni için Konuşma Kapsayıcılarını konuşmaya dağıtma hakkında daha fazla bilgi edinin

Ignite 2020 için TTS güncelleştirmelerinin tüm duyurusunu okuyun

Ağustos 2020 sürümü

Yeni özellikler

Nöral metinden konuşmaya: Aria sesi için en-US yeni konuşma stili. AriaNeural, haberleri okurken haber oyuncuları gibi görünebilir. 'Newscast-formal' stili daha ciddi, 'newscast-casual' stili ise daha rahat ve resmi değil. SSML'de konuşma stillerini kullanmayı öğrenin.
Özel ses: Eğitim veri kalitesini otomatik olarak denetlemek için yeni bir özellik yayınlanır. Verilerinizi karşıya yüklediğinizde, sistem ses ve transkript verilerinizin çeşitli yönlerini inceler ve ses modelinin kalitesini artırmak için sorunları otomatik olarak düzeltir veya filtreler. Bu, ses ve betik biçimine ek olarak ses ses düzeyini, gürültü düzeyini, konuşmanın telaffuz doğruluğunu, normalleştirilmiş metinle konuşma hizalamasını, seste sessizliği kapsar.
Ses İçeriği Oluşturma: Daha güçlü ses ayarlama ve ses yönetimi özellikleri sağlamak için bir dizi yeni özellik.
- Söyleniş: Telaffuz ayarlama özelliği en son phoneme kümesine güncelleştirildi. Kitaplıktan doğru phoneme öğesini seçebilir ve seçtiğiniz sözcüklerin söylenişini geliştirebilirsiniz.
- İndir: Ses "İndir"/"Dışarı Aktar" özelliği, paragrafa göre ses oluşturulmasını destekleyecek şekilde geliştirilmiştir. Birden çok ses çıkışı oluştururken içeriği aynı dosyada/SSML'de düzenleyebilirsiniz. "İndir"in dosya yapısı da geliştirilmiştir. Artık tüm ses dosyalarını tek bir klasöre kolayca alabilirsiniz.
- Görev durumu: Çok dosyalı dışarı aktarma deneyimi geliştirildi. Geçmişte birden çok dosyayı dışarı aktardığınızda, dosyalardan biri başarısız olduysa, görevin tamamı başarısız olur. Ancak şimdi diğer tüm dosyalar başarıyla dışarı aktarılacak. Görev raporu daha ayrıntılı ve yapılandırılmış bilgilerle zenginleştirilmiştir. Artık raporla tüm başarısız dosyalar ve cümleler için günlükleri de de kontrol edebilirsiniz.
- SSML belgeleri: Tüm ayarlama özelliklerinin nasıl kullanılacağına ilişkin kuralları denetlemenize yardımcı olması için SSML belgesine bağlıdır.
Ses Listesi API'si, kullanıcı dostu bir görünen ad ve sinir sesleri için desteklenen konuşma stillerini içerecek şekilde güncelleştirilir.

Genel TTS ses kalitesi geliştirmeleri

için ru-RU sözcük düzeyinde telaffuz hatası yüzdesi azaltıldı (hatalar %56 azaltıldı ve sv-SE (%49 azaltılan hatalar)
Nöral seslerde en-US okumada %40 geliştirilmiş polifonik sözcük. Çok sesli sözcüklere örnek olarak "read", "live", "content", "record", "object" vb. verilebilir.
içindeki soru tonunun fr-FRdoğallığı geliştirildi. MOS (Ortalama Görüş Puanı) kazancı: +0,28
Aşağıdaki sesler için vocoder'lar, uygunluk iyileştirmeleri ve genel performans hızı %40 artırılarak güncelleştirildi.

Yerel ayar Ses

en-GB Mia

es-MX Dalia

fr-CA Sylvie

fr-FR Denise

ja-JP Nanami

ko-KR Güneş-Merhaba

Yerel ayar	Ses
`en-GB`	Mia
`es-MX`	Dalia
`fr-CA`	Sylvie
`fr-FR`	Denise
`ja-JP`	Nanami
`ko-KR`	Güneş-Merhaba

Hata düzeltmeleri

Ses İçeriği Oluşturma aracıyla bir dizi hata düzeltildi
- Otomatik yenileme ile ilgili sorun düzeltildi.
- Güney Doğu Asya bölgesindeki zh-CN ses stilleriyle ilgili sorunlar düzeltildi.
- 'break' etiketiyle dışarı aktarma hatası ve noktalama işaretlerindeki hatalar da dahil olmak üzere kararlılık sorunu düzeltildi.

Mayıs 2024 sürümü

Söyleniş Değerlendirmesi

Konuşma Söylenişi Değerlendirmesi artık genel kullanıma sunulan 24 dili (bir yeni dil eklenerek) ve genel önizlemede 7 dili daha destekliyor. Daha fazla bilgi için Söyleniş Değerlendirmesi için tam dil listesine bakın.

Dil	Yerel Ayar (BCP-47)
Arapça (Mısır)	`ar-EG`¹
Arapça (Suudi Arabistan)	`ar-SA`
Katalanca	`ca-ES`¹
Çince (Kantonca, Geleneksel)	`zh-HK`¹
Çince (Mandarin, Basitleştirilmiş)	`zh-CN`
Çince (Tayvan Mandarin, Geleneksel)	`zh-TW`¹
Felemenkçe (Hollanda)	`nl-NL`
İngilizce (Avustralya)	`en-AU`
İngilizce (Kanada)	`en-CA`
İngilizce (Hindistan)	`en-IN`
İngilizce (İngiltere)	`en-GB`
İngilizce (ABD)	`en-US`
Fince (Finlandiya)	`fi-FI`¹
Fransızca (Kanada)	`fr-CA`
Fransızca (Fransa)	`fr-FR`
Almanca (Almanya)	`de-DE`
Hintçe (Hindistan)	`hi-IN`
İtalyanca (İtalya)	`it-IT`
Japonca (Japonya)	`ja-JP`
Korece (Kore)	`ko-KR`
Malay dili (Malezya)	`ms-MY`
Norveççe Bokmål (Norveç)	`nb-NO`
Lehçe (Polonya)	`pl-PL`¹
Portekizce (Brezilya)	`pt-BR`
Portekizce (Portekiz)	`pt-PT`¹
Rusça (Rusya)	`ru-RU`
İspanyolca (Meksika)	`es-MX`
İspanyolca (İspanya)	`es-ES`
İsveççe (İsveç)	`sv-SE`
Tamilce (Hindistan)	`ta-IN`
Vietnamca (Vietnam)	`vi-VN`

¹ Dil, telaffuz değerlendirmesi için genel önizleme aşamasındadır.

Nisan 2024 sürümü

Otomatik çok dilli konuşma çevirisi (Önizleme)

Otomatik çok dilli konuşma çevirisi genel önizlemede kullanılabilir. Bu yenilikçi özellik, dil engellerinin aşılma yönteminde devrim oluşturur ve farklı dil ortamlarında sorunsuz iletişim için benzersiz özellikler sunar.

Önemli Noktalar

Belirtilmemiş giriş dili: Çok dilli konuşma çevirisi çok çeşitli dillerde ses alabilir ve beklenen giriş dilinin ne olduğunu belirtmenize gerek yoktur. Bunu, önceden sıfırlamaya gerek kalmadan küresel bağlamlar arasında anlamak ve işbirliği yapmak için çok değerli bir özellik haline getirir.
Dil değiştirme: Çok dilli konuşma çevirisi, aynı oturum sırasında birden çok dilin konuşulmasını sağlar ve tümünün aynı hedef dile çevrilmesini sağlar. Giriş dili değiştiğinde veya sizin tarafınızdan yapılan diğer eylemlerde oturumu yeniden başlatmanız gerekmez.

Nasıl çalışır?

Seyahat yorumlayıcısı: Çok dilli konuşma çevirisi, yabancı varış noktalarını ziyaret eden turistlere tercih ettikleri dilde bilgi ve yardım sağlayarak deneyimlerini geliştirebilir. Otel konsiyerj hizmetleri, rehberli turlar ve ziyaretçi merkezleri bu teknolojiden yararlanarak farklı dil ihtiyaçlarını karşılayabilir.
Uluslararası konferanslar: Çok dilli konuşma çevirisi, farklı bölgelerden canlı çeviri başlık kullanarak farklı dillerde konuşabilen katılımcılar arasında iletişimi kolaylaştırabilir. Katılımcılar, belirtmeye gerek kalmadan kendi ana dillerinde konuşarak sorunsuz bir anlayış ve işbirliği sağlayabilir.
Eğitim toplantıları: Çok kültürlü sınıflarda veya çevrimiçi öğrenme ortamlarında, çok dilli konuşma çevirisi öğrenciler ve öğretmenler arasında dil çeşitliliğini destekleyebilir. Her öğrencinin veya eğitmenin dilini belirtmeye gerek kalmadan sorunsuz iletişim ve katılım sağlar.

Erişim

Ayrıntılı bir giriş için Konuşma çevirisi genel bakış bölümünü ziyaret edin. Ayrıca, konuşmanın nasıl çevrildiği konusunda kod örneklerine başvurabilirsiniz. Bu yeni özellik, 1.37.0'dan itibaren tüm SDK sürümleri tarafından tam olarak desteklenir.

Sıtma ile metne gerçek zamanlı konuşma (GA)

Sıtma ile metne gerçek zamanlı konuşma genel kullanıma sunuldu.

Konuşmaya katılan farklı konuşmacıları ayırt etmek için gündizleme kullanan metin uygulamalarına konuşma oluşturabilirsiniz. Gerçek zamanlı darizasyon hakkında daha fazla bilgi için gerçek zamanlı kesinleştirme hızlı başlangıcına göz atın.

Konuşmayı metin modeline güncelleştirme

Metne gerçek zamanlı konuşma, iki dilli özelliklere sahip yeni modeller yayımladı. Model en-IN artık hem İngilizce hem de Hintçe iki dilli senaryoları destekliyor ve geliştirilmiş doğruluk sunuyor. Arapça yerel ayarlar (ar-AE, ar-BH, ar-DZ, , ar-IL, ar-IQ, ar-KW, ar-LB, ar-LY, ar-MA, , , ar-OM), ar-SYar-YEar-PSar-QAar-SAar-TNartık İngilizce için iki dil desteği, gelişmiş doğruluk ve çağrı merkezi desteği ile donatılmıştır.

Toplu transkripsiyon , şu yerel ayarlar için yeni mimariye sahip modeller sağlar: es-ES, es-MX, fr-FR, it-IT, ja-JP, ko-KR, pt-BRve zh-CN. Bu modeller okunabilirliği ve varlık tanımayı önemli ölçüde geliştirir.

Mart 2024 sürümü

Fısıltı genel kullanılabilirliği (GA)

Azure AI Konuşma ile Fısıltı konuşma metin modeli genel kullanıma sunuldu.

Azure AI Konuşma ve Azure OpenAI Hizmeti'nin ne zaman kullanılacağı hakkında daha fazla bilgi edinmek için Fısıltı modeli nedir? konusuna göz atın.

Şubat 2024 sürümü

Söyleniş Değerlendirmesi

Konuşma Söylenişi Değerlendirmesi artık genel kullanıma sunulan 23 dili (5 yeni dil eklenerek) ve genel önizlemede 3 dili daha destekliyor. Daha fazla bilgi için Söyleniş Değerlendirmesi için tam dil listesine bakın.

Tümcecik listesi

Aşağıdaki yerel ayarlar için tümcecik listesi desteği eklendi: ar-SA, de-CH, en-IE, en-ZA, es-US, id-ID, nl-NL, pl-PL, pt-PT, ru-RU, sv-SE, th-TH, vi-VN, zh-HK, zh-TW.

Kasım 2023 sürümü

İki Dilli Konuşma Modelleme ile tanışın!

Gerçek zamanlı konuşma modellememize (İki Dilli Konuşma Modellemesi) çığır açan bir ekleme sunduğumuz için heyecanlıyız. Bu önemli geliştirme, konuşma modelimizin İngilizce ve İspanyolca gibi iki dilli dil çiftlerinin yanı sıra İngilizce ve Fransızca dil çiftlerini sorunsuz bir şekilde desteklemesini sağlar. Bu özellik, kullanıcıların gerçek zamanlı etkileşimler sırasında diller arasında zahmetsizce geçiş yapmalarını sağlayarak iletişim deneyimlerini geliştirme taahhüdümüzün önemli bir anını işaret eder.

Önemli Noktalar:

İki Dilli Destek: Son sürümümüzle, kullanıcılar gerçek zamanlı konuşma etkileşimleri sırasında İngilizce ve İspanyolca arasında veya İngilizce ve Fransızca arasında sorunsuz bir şekilde geçiş yapabilir. Bu işlev, bu iki dil arasında sık sık geçiş yapan iki dilli konuşmacıları barındıracak şekilde uyarlanmıştır.
Gelişmiş Kullanıcı Deneyimi: İster iş yerinde, ister evde ister çeşitli topluluk ayarlarında iki dilli konuşmacılar bu özelliği son derecede yararlı bulur. Modelin hem İngilizce hem de İspanyolcayı gerçek zamanlı olarak anlama ve yanıtlama becerisi, etkili ve akıcı iletişim için yeni olasılıklar ortaya çıkar.

Nasıl Kullanılır:

Konuşma Tanıma Hizmeti API'sini çağırırken veya Speech Studio'da denerken es-US (İspanyolca ve İngilizce) veya fr-CA (Fransızca ve İngilizce) seçeneğini belirleyin. Her iki dilde de doğru ve bağlama duyarlı yanıtlar sağlayan model dinamik olarak uyum sağlayacak şekilde tasarlanmıştır.

En son özellik sürümümüzle iletişim oyununuzu yükseltmenin zamanı geldi. Sorunsuz, çok dilli iletişim parmaklarınızın ucunda!

Konuşmayı Metne dönüştürme modelleri güncelleştirildi

Konuşma modellerimize önemli bir güncelleştirme eklemek, daha iyi doğruluk, geliştirilmiş okunabilirlik ve gelişmiş varlık tanıma vaat ediyoruz. Bu yükseltme, genişletilmiş bir eğitim veri kümesiyle güçlendirilen sağlam yeni bir yapıyla birlikte gelir ve genel performansta belirgin bir ilerleme sağlar. En-US, zh-CN, ja-JP, it-IT, pt-BR, es-MX, es-ES, fr-FR, de-DE, ko-KR, tr-TR, sv-SE ve he-IL için yeni yayımlanan modelleri içerir.

Vurgulamalar:

Yeni model yapısıyla daha iyi doğruluk: Daha zengin bir eğitim veri kümesiyle birlikte yeniden tanımlanan model yapısı, doğruluk düzeylerini yükselterek daha hassas konuşma çıkışı vaat eder.
Okunabilirlik iyileştirmesi: En son modelimiz okunabilirliği önemli ölçüde artırarak konuşulan içeriğin tutarlılığını ve netliğini artırır.
Gelişmiş varlık tanıma: Varlık tanıma önemli bir yükseltme alır ve böylece daha doğru ve ayrıntılı sonuçlar elde edilir.

Olası etkiler: Bu ilerlemelere rağmen olası etkilere dikkat etmek çok önemlidir:

Özel Sessizlik Zaman Aşımı Özelliği: Özellikle düşük ayarlarla özel sessizlik zaman aşımı kullanan kullanıcılar, tek sözcüklü tümceciklerde fazla segmentasyon ve olası eksikliklerle karşılaşabilir.
Yeni model anahtar sözcük ön eki özelliğiyle uyumluluk sorunları gösterebilir ve kullanıcıların kendi uygulamalarında performansını değerlendirmeleri önerilir.
Azaltılmış uyumsuz sözcükler veya tümcecikler: Kullanıcılar konuşma çıkışında "um" veya "uh" gibi uyumsuz sözcüklerin veya tümceciklerin azalmış olduğunu fark edebilir.
Sözcük zaman damgası süresindeki yanlışlıklar: Bazı disfluency sözcükleri zaman damgası süresinde tutarsızlıklar görüntüleyebilir ve hassas zamanlamaya bağlı uygulamalarda dikkat gösterilmesini gerektirebilir.
Güvenilirlik puanı dağılımı varyansı: Güvenilirlik puanlarına ve ilişkili eşiklere dayanan kullanıcılar, dağıtımdaki olası değişimlerin farkında olmalı ve en iyi performans için ayarlamaları zorunlu kılmalıdır.
Tümcecik listesi özelliğinin doğruluk geliştirmesi, belirli tümceciklerin yanlış algılanmasından etkilenebilir.

Bu iyileştirmeleri incelemenizi ve sorunsuz bir geçiş için olası sorunları göz önünde bulundurmanızı öneririz ve her zaman olduğu gibi geri bildirimleriniz hizmetlerimizi iyileştirme ve geliştirme konusunda etkili olur.

Söyleniş Değerlendirmesi

Konuşma Söylenişi Değerlendirmesi artık genel önizlemede altı dil daha bulunan genel kullanıma açık 18 dili destekliyor. Daha fazla bilgi için Söyleniş Değerlendirmesi için tam dil listesine bakın.
Söyleniş Değerlendirmesi'nin 1 Kasım 2023'den itibaren yeni özellikleri kullanıma sunduğumuzu duyurmaktan heyecan duyuyoruz: Prosody, Dilbilgisi, Sözlük ve Konu. Bu geliştirmeler hem okuma hem de konuşma değerlendirmeleri için daha kapsamlı bir dil öğrenme deneyimi sağlamayı hedefler. Speech Studio'da söyleniş değerlendirmesini ve Telaffuz değerlendirmesini kullanma makalesindeki diğer ayrıntıları keşfetmek için SDK sürüm 1.35.0 veya sonraki bir sürüme yükseltin.

Eylül 2023 yayını

Fısıltı genel önizlemesi

Azure AI Konuşma artık toplu transkripsiyon API'sini kullanarak OpenAI'nin Fısıltı modelini destekliyor. Daha fazla bilgi edinmek için Toplu transkripsiyon oluşturma kılavuzuna göz atın.

Not

Azure OpenAI Hizmeti, zaman uyumlu REST API'siyle konuşmayı metne dönüştürmeye yönelik OpenAI Fısıltı modelini de destekler. Daha fazla bilgi edinmek için hızlı başlangıç bölümüne göz atın.

Azure AI Konuşma ve Azure OpenAI Hizmeti'nin ne zaman kullanılacağı hakkında daha fazla bilgi edinmek için Fısıltı modeli nedir? konusuna göz atın.

Konuşmayı metne dönüştürme REST API v3.2 genel önizlemesi

Konuşmayı metne dönüştürme REST API v3.2 önizleme sürümünde kullanılabilir. Konuşmayı metne dönüştürme REST API v3.1 genel olarak kullanılabilir. Konuşmayı metne dönüştürme REST API v3.0, 1 Nisan 2026'da kullanımdan kaldırılacaktır. Daha fazla bilgi için bkz. Konuşmayı metne dönüştürme REST API v3.0 -v3.1 ve v3.1 to v3.2 geçiş kılavuzları.

Ağustos 2023 sürümü

Metin yerel ayarlarına yeni konuşma:

Metne konuşma, aşağıdaki tabloda gösterildiği gibi iki yeni yerel ayarı destekler. Burada tam dil listesine bakın.

Yerel ayar	Dil
`pa-IN`	Pencapça (Hindistan)
`ur-IN`	Urduca (Hindistan)

Söyleniş Değerlendirmesi

Konuşma Söylenişi Değerlendirmesi artık İngilizce (Kanada), İngilizce (Hindistan) ve Fransızca (Kanada) dillerinde genel kullanıma sunulan 3 ek dili ve önizlemede 3 ek dili desteklemektedir. Daha fazla bilgi için Söyleniş Değerlendirmesi için tam dil listesine bakın.

Mayıs 2023 sürümü

Söyleniş Değerlendirmesi

Konuşma Söylenişi Değerlendirmesi artık Almanca (Almanya), Japonca (Japonya) ve İspanyolca (Meksika) dillerinde genel kullanıma sunulan 3 ek dili ve önizlemede 4 dil daha kullanılabilmektedir. Daha fazla bilgi için Söyleniş Değerlendirmesi için tam dil listesine bakın.
Artık tüm genel bölgelerde söyleniş değerlendirmesi için standart Konuşmayı Metne Dönüştürme taahhüdü katmanını kullanabilirsiniz. Standart Konuşmayı metne dönüştürme için bir taahhüt katmanı satın alırsanız söyleniş değerlendirmesi için harcama, taahhüdü karşılamaya gider. Bkz . taahhüt katmanı fiyatlandırması.

Şubat 2023 sürümü

Söyleniş Değerlendirmesi

Konuşma Söylenişi Değerlendirmesi artık İngilizce (Birleşik Krallık), İngilizce (Avustralya), Fransızca (Fransa), İspanyolca (İspanya) ve Çince (Mandarin, Basitleştirilmiş) dillerinde genel kullanıma sunulan 5 ek dili desteklemektedir.
Kendi uygulamanızda akış modunda Söyleniş Değerlendirmesi'ni kullanmayı gösteren örnek kodlar eklendi.
- C#: Bkz . örnek kod.
- C++: Örnek koda bakın.
- java: Örnek koda bakın.
- javascript: Örnek koda bakın.
- Objective-C: Örnek koda bakın.
- Python: Bkz . örnek kod.
- Swift: Örnek koda bakın.

Özel konuşma

Yerel ayarlar için ses + insan etiketli transkript desteği de-AT eklenir.

Ocak 2023 sürümü

Özel konuşma

Ek yerel ayarlar için ses + insan etiketli transkript desteği eklenir: ar-BH, ar-DZ, ar-EG, ar-MA, ar-SA, , ar-TN, ar-YEve ja-JP.

Yerel ayar de-ATiçin yapılandırılmış metin uyarlama desteği eklenir.

Aralık 2022 sürümü

Konuşmayı metne dönüştürme REST API'si

Konuşmayı metne dönüştürme REST API'sinin 3.1 sürümü genel olarak kullanılabilir. Konuşmayı metne dönüştürme REST API'sinin 3.0 sürümü kullanımdan kaldırılacaktır. Geçiş hakkında daha fazla bilgi için kılavuza bakın.

Ekim 2022 sürümü

Metin yerel ayarına yeni konuşma

Malayalam (Hindistan) için yerel ayar desteği ml-IN eklendi. Burada tam dil listesine bakın.

Temmuz 2022 sürümü

Metin yerel ayarlarına yeni konuşma:

Aşağıdaki tabloda gösterildiği gibi 7 yeni yerel ayar eklendi. Burada tam dil listesine bakın.

Yerel ayar	Dil
`bs-BA`	Boşnakça (Bosna-Hersek)
`yue-CN`	Çince (Kantonca, Basitleştirilmiş)
`zh-CN-sichuan`	Çince (Southwestern Mandarin, Basitleştirilmiş)
`wuu-CN`	Çince (Wu, Basitleştirilmiş)
`ps-AF`	Peşto (Afganistan)
`so-SO`	Somali (Somali)
`cy-GB`	Galler (Birleşik Krallık)

Haziran 2022 sürümü

Metin yerel ayarlarına yeni konuşma:

Aşağıdaki tabloda gösterildiği gibi 10 yeni yerel ayar eklendi. Burada tam dil listesine bakın.

Yerel ayar	Dil
`sq-AL`	Arnavut dili (Arnavutluk)
`hy-AM`	Ermenice (Ermenistan)
`az-AZ`	Azerbaycan dili (Azerbaycan)
`eu-ES`	Baskça
`gl-ES`	Galiçya Dili
`ka-GE`	Gürcüce (Gürcistan)
`it-CH`	İtalyanca (İsviçre)
`kk-KZ`	Kazakça (Kazakistan)
`mn-MN`	Moğolca (Moğolistan)
`ne-NP`	Nepal dili (Nepal)

Nisan 2022 sürümü

Metin yerel ayarlarına yeni konuşma:

Yeni yerel ayarların listesi aşağıdadır. Burada tam dil listesine bakın.

Yerel ayar	Dil
`bn-IN`	Bengal dili (Hindistan)

Ocak 2022 sürümü

Metin yerel ayarlarına yeni konuşma:

Yeni yerel ayarların listesi aşağıdadır. Burada tam dil listesine bakın.

Yerel ayar	Dil
`af-ZA`	Afrika dili (Güney Afrika)
`am-ET`	Amharca (Etiyopya)
`de-CH`	Almanca (İsviçre)
`fr-BE`	Fransızca (Belçika)
`is-IS`	İzlanda dili (İzlanda)
`jv-ID`	Javanese (Endonezya)
`km-KH`	Khmer (Kamboçya)
`kn-IN`	Kannada dili (Hindistan)
`lo-LA`	Lao (Laos)
`mk-MK`	Makedon dili (Kuzey Makedonya)
`my-MM`	Burma dili (Myanmar)
`nl-BE`	Felemenkçe (Belçika)
`si-LK`	Sinhala (Sri Lanka)
`sr-RS`	Sırpça (Sırbistan)
`sw-TZ`	Svahili dili (Tanzanya)
`uk-UA`	Ukraynaca (Ukrayna)
`uz-UZ`	Özbekçe (Özbekistan)
`zu-ZA`	Zulu (Güney Afrika)

Temmuz 2021 sürümü

Metin yerel ayarlarına yeni konuşma:

Yeni yerel ayarların listesi aşağıdadır. Burada tam dil listesine bakın.

Yerel ayar	Dil
`ar-DZ`	Arapça (Cezayir)
`ar-LY`	Arapça (Libya)
`ar-MA`	Arapça (Fas)
`ar-TN`	Arapça (Tunus)
`ar-YE`	Arapça (Yemen)
`bg-BG`	Bulgarca (Bulgaristan)
`el-GR`	Yunanca (Yunanistan)
`et-EE`	Estonyaca (Estonya)
`fa-IR`	Farsça (İran)
`ga-IE`	İrlandaca (İrlanda)
`hr-HR`	Hırvatça (Hırvatistan)
`lt-LT`	Litvanca (Litvanya)
`lv-LV`	Letonyaca (Letonya)
`mt-MT`	Maltaca (Malta)
`ro-RO`	Romence (Romanya)
`sk-SK`	Slovakça (Slovakya)
`sl-SI`	Slovence (Slovenya)
`sw-KE`	Svahili dili (Kenya)

Ocak 2021 sürümü

Metin yerel ayarlarına yeni konuşma:

Yeni yerel ayarların listesi aşağıdadır. Burada tam dil listesine bakın.

Yerel ayar	Dil
`ar-AE`	Arapça (Birleşik Arap Emirlikleri)
`ar-IL`	Arapça (İsrail)
`ar-IQ`	Arapça (Irak)
`ar-OM`	Arapça (Umman)
`ar-PS`	Arapça (Filistin Yönetimi)
`de-AT`	Almanca (Avusturya)
`en-GH`	İngilizce (Gana)
`en-KE`	İngilizce (Kenya)
`en-NG`	İngilizce (Nijerya)
`en-TZ`	İngilizce (Tanzanya)
`es-GQ`	İspanyolca (Ekvator Ginesi)
`fil-PH`	Filipin dili (Filipinler)
`fr-CH`	Fransızca (İsviçre)
`he-IL`	İbranice (İsrail)
`id-ID`	Endonezce (Endonezya)
`ms-MY`	Malay dili (Malezya)
`vi-VN`	Vietnamca (Vietnam)

Ağustos 2020 Sürümü

Metin yerel ayarlarına yeni konuşma:

Konuşmayı metne dönüştürme, Ağustos ayında 26 yeni yerel ayar yayımladı: 2 Avrupa dili cs-CZ ve hu-HU, 5 İngilizce yerel ayar ve çoğu Güney Amerika ülkesini/bölgesini kapsayan 19 İspanyolca yerel ayar. Yeni yerel ayarların listesi aşağıdadır. Burada tam dil listesine bakın.

Yerel ayar	Dil
`cs-CZ`	Çekçe (Çek Cumhuriyeti)
`en-HK`	İngilizce (Hong Kong Özel Yönetici Istrative Region)
`en-IE`	İngilizce (İrlanda)
`en-PH`	İngilizce (Filipinler)
`en-SG`	İngilizce (Singapur)
`en-ZA`	İngilizce (Güney Afrika)
`es-AR`	İspanyolca (Arjantin)
`es-BO`	İspanyolca (Bolivya)
`es-CL`	İspanyolca (Şili)
`es-CO`	İspanyolca (Kolombiya)
`es-CR`	İspanyolca (Kosta Rika)
`es-CU`	İspanyolca (Küba)
`es-DO`	İspanyolca (Dominik Cumhuriyeti)
`es-EC`	İspanyolca (Ekvador)
`es-GT`	İspanyolca (Guatemala)
`es-HN`	İspanyolca (Honduras)
`es-NI`	İspanyolca (Nikaragua)
`es-PA`	İspanyolca (Panama)
`es-PE`	İspanyolca (Peru)
`es-PR`	İspanyolca (Porto Riko)
`es-PY`	İspanyolca (Paraguay)
`es-SV`	İspanyolca (El Salvador)
`es-US`	İspanyolca (ABD)
`es-UY`	İspanyolca (Uruguay)
`es-VE`	İspanyolca (Venezuela)
`hu-HU`	Macarca (Macaristan)

2024-Şubat sürümü

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 4.6.0
Konuşmayı metne dönüştürme 4.6.0
Nöral metinden konuşmaya 3.1.0

Konuşmayı metin bileşenlerine en son sürüme yükseltin. Tüm es yerel ayarlar modellerini en son sürüme yükseltin. Konuşmayı metne dönüştürme örnekleri için medya dönüştürme arabelleğini artırın.

2023-Kasım sürümü

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 4.5.0
Konuşmayı metne dönüştürme 4.5.0
Nöral metinden konuşmaya 2.19.0

2023-Ekim sürümü

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 4.4.0
Konuşmayı metne dönüştürme 4.4.0
Nöral metinden konuşmaya 2.18.0

Bir dizi yüksek riskli güvenlik açığı sorununu düzeltin.

Kapsayıcılardaki yedekli günlükleri kaldırın.

İç medya bileşenini en son sürüme yükseltin.

ses en-IN-NeerjaNeuraliçin destek ekleyin.

2023-Eylül sürümü

En son model sürümleri için destek ekleyin:

Konuşma dili tanımlama 1.12.0
Özel konuşmayı metne dönüştürme 4.3.0
Konuşmayı metne dönüştürme 4.3.0
Nöral metinden konuşmaya 2.17.0

Özel konuşmayı metne ve konuşmayı metne en son çerçeveye yükseltin.

Güvenlik açığı sorunlarını düzeltin.

ses ar-AE-FatimaNeuraliçin destek ekleyin.

2023-Temmuz sürümü

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 4.1.0
Konuşmayı metne dönüştürme 4.1.0
Nöral metinden konuşmaya 2.15.0

Yerel özel model dosyalarıyla bağlama seçenekleri aracılığıyla docker metin kapsayıcısına konuşma çalıştırma sorunu düzeltildi.

Bazı durumlarda olayın Konuşma SDK'sı RECOGNIZING aracılığıyla yanıt olarak gösterilmemesi sorununu düzeltin.

Güvenlik açığı sorunlarını düzeltin.

2023-Haziran sürümü

En son model sürümleri için destek ekleyin:

4.0.0 metnine özel konuşma
Konuşmayı metne dönüştürme 4.0.0
Nöral metinden konuşmaya 2.14.0

Şirket içi metin görüntülerine konuşma .NET 6.0'a yükseltildi

, , ar-eg, ja-jpar-bh, ko-krve daha fazlası dahil olmak üzere en-usyerel ayarlar için görüntü modellerini yükseltin.

Güvenlik açığı sorunlarını gidermek için konuşmayı metin kapsayıcısı bileşenine yükseltin.

Yerel ayar sesleri de-DE-AmalaNeuraliçin destek ekleme,de-AT-IngridNeuralde-AT-JonasNeural veen-US-JennyMultilingualNeural

2023-Mayıs sürümü

En son model sürümleri için destek ekleyin:

Metne özel konuşma 3.14.0
Konuşmayı metne dönüştürme 3.14.0
Nöral metinden konuşmaya 2.13.0

Noktalama işaretlerini he-IL düzeltme

Güvenlik açığı sorunlarını düzeltme

Yeni yerel ayar sesi en-US-MichelleNeuralekleyin ve es-MX-CandelaNeural

2023-Nisan sürümü

Güvenlik Güncelleştirmeler

Güvenlik açığı sorunlarını düzeltme

2023-Mart sürümü

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 3.12.0
Konuşmayı metne dönüştürme 3.12.0
Konuşma dili tanımlama 1.11.0
Nöral metinden konuşmaya 2.11.0

Güvenlik açığı sorunlarını düzeltme

Büyük harfe tr-TR çevirme sorununu düzeltme

Konuşmayı metin en-US görüntüleme modellerine yükseltme

Konuşma yerel ayarı sesine önceden oluşturulmuş nöral nöral metin için destek ekleme ar-AE-HamdanNeural

2023-Şubat sürümü

Yeni kapsayıcı sürümleri

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 3.11.0
Konuşmayı metne dönüştürme 3.11.0
Nöral metinden konuşmaya 2.10.0

Güvenlik açığı sorunlarını düzeltme

Konuşma modelleri için düzenli yükseltme

Yeni Abraik yerel ayarlar ekleyin:

ar-IL
ar-PS

İbranice ve Türk ekran modellerini yükseltme

2023-Ocak sürümü

Yeni kapsayıcı sürümleri

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 3.10.0
Konuşmayı metne dönüştürme 3.10.0
Nöral metinden konuşmaya 2.9.0

Hipotez modu sorununu düzeltme

HTTP Proxy sorunu düzeltildi

Metin kapsayıcısına özel konuşma bağlantısı kesildi modu

TTS Ön Ucuna CNV Bağlantısı Kesilmiş kapsayıcı desteği ekleme

Bu yerel ayarlar için destek ekleyin:

da-DK-ChristelNeural
da-DK-JeppeNeural
IN-PrabhatNeural

2022-Aralık sürümü

Yeni kapsayıcı sürümleri

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 3.9.0
Konuşmayı metne dönüştürme 3.9.0
Nöral metinden konuşmaya 2.8.0

ipv4/ipv6 sorununu düzeltme

Güvenlik açığı sorununu düzeltme

2022-Kasım sürümü

Yeni kapsayıcı sürümleri

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 3.8.0
Konuşmayı metne dönüştürme 3.8.0
Nöral metinden konuşmaya 2.7.0

2022-Ekim sürümü

Yeni kapsayıcı sürümleri

En son model sürümleri için destek ekleyin:

Özel konuşmayı metne dönüştürme 3.7.0
Konuşmayı metne dönüştürme 3.7.0
Nöral metinden konuşmaya 2.6.0

2022-Eylül sürümü

Konuşmayı metne dönüştürme 3.6.0-amd64

En son model sürümleri için destek ekleyin.

Bu yerel ayarlar için destek ekleyin:

az-az
bn-in
bs-ba
cy-gb
eu-es
fa-ir
gl-es
he-il
hy-am
it-ch
ka-ge
kk-kz
mk-mk
mn-mn
ne-np
ps-af
so-so
sq-al
wuu-cn
yue-cn
zh-cn-sichuan

Güvenlik yükseltmeleri ve güvenlik açığı düzeltmeleri de dahil olmak üzere düzenli aylık güncelleştirmeler.

Özel konuşmayı metne dönüştürme 3.6.0-amd64

Güvenlik yükseltmeleri ve güvenlik açığı düzeltmeleri de dahil olmak üzere düzenli aylık güncelleştirmeler.

Nöral Nöral metinden konuşmaya v2.5.0

Önceden oluşturulmuş bu sinir sesleri için destek ekleyin:

az-az-babekneural
az-az-banuneural
fa-ir-dilaraneural
fa-ir-faridneural
fil-ph-angeloneural
fil-ph-blessicaneural
he-il-avrineural
he-il-hilaneural
id-id-ardineural
id-id-gadisneural
ka-ge-ekaneural
ka-ge-giorgineural

Güvenlik yükseltmeleri ve güvenlik açığı düzeltmeleri de dahil olmak üzere düzenli aylık güncelleştirmeler.

2022-Mayıs sürümü

Konuşma dili algılama Kapsayıcı v1.9.0-amd64-preview

Konuşma dili algılama için hata düzeltmeleri.

2022-Mart sürümü

Özel konuşmayı metne dönüştürme Container v3.1.0

Görüntü modellerini almak için destek ekleyin.

2022-Ocak sürümü

Konuşmayı metne dönüştürme Container v3.0.0

Bağlantısız ortamlarda kapsayıcıları kullanma desteği ekleyin.

Konuşmayı metne dönüştürme Container v2.18.0

Güvenlik yükseltmeleri ve güvenlik açığı düzeltmeleri de dahil olmak üzere düzenli aylık güncelleştirmeler.

Nöral-Nöral metinden konuşmaya Kapsayıcı v1.12.0

Önceden oluşturulmuş bu sinir sesleri için destek ekleyin: am-et-amehaneural, am-et-mekdesneuralve so-so-muuseneuralso-so-ubaxneural.

Güvenlik yükseltmeleri ve güvenlik açığı düzeltmeleri de dahil olmak üzere düzenli aylık güncelleştirmeler.