Aracılığıyla paylaş


Metin okuma hakkında SSS

Bu makalede, metin okuma (TTS) özelliği hakkında sık sorulan sorular yanıtlar. Sorularınızın yanıtlarını burada bulamazsanız diğer destek seçeneklerine göz atın.

Genel

Metin okuma için faturalama nasıl çalışır?

Metin okuma kullanımı karakter başına faturalandırılır. Fiyatlandırma notunda faturalanabilir karakterlerin tanımını denetleyin.

Metinden konuşma sentezine yönelik isteklerin hız sınırı nedir?

Metin okuma sentezi hızı, daha fazla istek aldığında otomatik olarak ölçeklendirilir. Konuşma kaynağı başına varsayılan hız sınırı ayarlanır. Oran, iş gerekçeleriyle ayarlanabilir ve hız sınırı artışı için ek ücret uygulanmaz. Konuşma hizmeti kotaları ve sınırları bölümünde daha fazla ayrıntıyı gözden geçirin.

Son kullanıcıya sesin sentetik bir ses olduğunu nasıl açıklayacağız?

Metin okuma özelliğini kullanırken her kullanıcının davranış kurallarımıza uymasını öneririz. Örtük ve açık satır dahil olmak üzere sesin sentetik doğasını açıklamanın çeşitli yolları vardır. Açıklama tasarım yönergelerine bakın.

Ses uygulamamın gecikme süresini nasıl azaltabilirim?

Gecikme süresini azaltmanız ve kullanıcılarınıza en iyi performansı sunmanız için birkaç ipucu sağlıyoruz. Bkz. Konuşma SDK'sı kullanarak konuşma sentezi gecikme süresini azaltma.

Metin okuma hangi çıkış ses biçimlerini destekler?

Azure AI metin okuma, yaygın olarak kullanılan örnekleme hızlarıyla çeşitli akış ve akışsız ses biçimlerini destekler. Tüm TTS standart sesleri, 48 kHz ve 24 kHz ile yüksek kaliteli ses çıkışlarını desteklemek için oluşturulur. Ses, gerektiğinde diğer fiyatları destekleyecek şekilde yeniden örneklenebilir. Bkz. Ses çıkışları.

Ses belirli sözcükleri strese almak için özelleştirilebilir mi?

Vurgunun ayarlanması, yerel ayara bağlı olarak bazı sesler için desteklenir. Vurgu etiketine bakın.

Her duygu için birden fazla güce sahip olabilir miyiz?

Stil derecesinin ayarlanması, yerel ayara bağlı olarak bazı sesler için desteklenir. Bkz. mstts:express-as etiketi.

Viseme kimlikleri ile ağız şekli arasında eşleme var mı?

Evet. Bkz . Viseme ile yüz konumunu alma.

Ses İçeriği Oluşturma

Kodumdaki Ses İçeriği Oluşturma platformunda oluşturduğum bir sözlük dosyasına nasıl başvurabilirim?

İlk olarak, Ses İçeriği Oluşturma'da lexicon dosyasını açabilir ve dosya yolunda "?fileKind=CustomLexiconFile" dosyasından önce bulunan lexicon dosya kimliğini alabilirsiniz. Örneğin, dosya yolu ise https://speech.microsoft.com/portal/d391a094f76846acbcd11dc2ba835f4f/audiocontentcreation/file/6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c?fileKind=CustomLexiconFile, sözcük sözlüğü dosya kimliği şeklindedir 6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c. Ardından, Ses İçeriği Oluşturma'da bu sözcük sözlüğüne başvuran bir dosyayı SSML biçimine geçirin. SSML dosyasında, belirtilen dosya kimliğine <!--ID=FCB göre sözlük dosyasının URI'sini bulabileceğiniz xml düğümünü bulun. Son olarak, kodunuzdaki SSML sözlüğü öğesini kullanarak sözlük dosyası URI bağlantısına başvurun. Örneğin, XML düğümünü <!--ID=FCB5B6FB566-33CA-4B68-BEAF-B013C53B3368;Version=1|{"Files":{"6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c":{"FileKind":"CustomLexiconFile","FileSubKind":"CustomLexiconFile","Uri":"https://cvoiceprodwus2.blob.core.windows.net/acc-public-files/d391a094f76846acbcd11dc2ba835f4f/e9a6a5a2-9cef-47f4-b961-d175be75d92f.xml"}}}bulursanız, sözlük dosyası URI'sini https://cvoiceprodwus2.blob.core.windows.net/acc-public-files/d391a094f76846acbcd11dc2ba835f4f/e9a6a5a2-9cef-47f4-b961-d175be75d92f.xmlalabilirsiniz.

Profesyonel ses ince ayarı

Profesyonel ses ince ayarı için ne kadar veri gerekir?

Profesyonel ses ince ayarı için en az 300 kayıt satırı (veya yaklaşık 30 dakikalık konuşma) eğitim verilerine ihtiyacınız vardır. Üretim kullanımı için bir ses oluşturmak için 2.000 satır kayıt (veya yaklaşık 2-3 saat konuşma) öneririz. Betik seçimi ölçütleri için bkz . Özel ses örneklerini kaydetme.

Aynı eğitim verileri kümesine yinelenen metin cümleleri ekleyebilir miyiz?

Hayır Hizmet yinelenen tümcelere bayrak ekler ve yalnızca içeri aktarılan ilk cümleyi saklar. Betik seçimi ölçütleri için bkz . Özel ses örneklerini kaydetme.

Aynı eğitim verileri kümesine birden çok stil ekleyebilir miyiz?

Tek bir eğitim veri kümesinde stili tutarlı tutmanızı öneririz. Stiller farklıysa, bunları farklı eğitim kümelerine yerleştirin. Bu durumda, profesyonel ses ince ayarının çok stilli eğitim yöntemini kullanmayı göz önünde bulundurun. Betik seçimi ölçütleri için bkz . Özel ses örneklerini kaydetme.

SSML aracılığıyla stiller arasında geçiş yapmak özel seslerde işe yaraıyor mu?

SSML aracılığıyla stiller arasında geçiş yapmak hem çok stilli standart seslerde hem de çok stilli özel seslerde kullanılabilir. Çok stilli eğitim sayesinde farklı stillerde konuşan bir ses oluşturabilir ve bu stilleri SSML aracılığıyla da ayarlayabilirsiniz.

Diller arası ses, farklı söyleniş yapısına ve derlemeye sahip dillerle nasıl çalışır?

Cümle yapısı ve söylenişi doğal olarak İngilizce ve Japonca gibi dillerde farklılık gösterir. Her sinir sesi, yerel konuşan ses yeteneği tarafından kaydedilen ses verileriyle eğitilir. Diller arası ses için, tını gibi önemli özellikleri orijinal konuşmacı gibi sese aktarıyoruz ve doğru telaffuzu koruyoruz. Örneğin, diller arası bir ses, Japonca konuşmak için yerel yolu kullanır ve orijinal İngilizce konuşmacıya benzer (ancak tam olarak değil) gibi görünür.

Etki alanım için söylenişi özelleştirmek için profesyonel ses ince ayarını kullanabilir miyim?

Profesyonel ses ince ayarı, işletmeniz için bir marka sesi oluşturmanıza olanak tanır. Etki alanınız için de iyileştirebilirsiniz. Daha yüksek doğallık için eğitim verilerinize etki alanına özgü örnekler eklemenizi öneririz. Ancak söyleniş, konuşma hizmeti tarafından varsayılan olarak tanımlanır. Profesyonel ses ince ayarı ile telaffuz özelleştirmeyi desteklemiyoruz. Sesinizin söylenişini özelleştirmek istiyorsanız SSML kullanın. Bkz . Konuşma Sentezi biçimlendirme dili (SSML) ile söyleniş.

Bir eğitimden sonra sesimi yeniden eğitebilir miyim?

Tekrar eğitebilirsiniz. Her eğitim yeni bir ses modeli oluşturur. Her eğitim için ücretlendirilirsiniz.

Model sürümü altyapı sürümüyle aynı mı?

Hayır Model sürümü altyapı sürümünden farklıdır. Model sürümü, modeliniz için eğitim tarifinin sürümü anlamına gelir ve desteklenen özelliklere ve model eğitim süresine göre değişir. Azure AI hizmetleri metninden konuşma altyapılarına, dilin söylenişini tanımlayan en son dil modelini yakalamak için zaman zaman güncelleştirilir. Sesinizi eğitdikten sonra en son altyapı sürümüne güncelleştirerek sesinizi yeni dil modeline uygulayabilirsiniz. Yeni bir altyapı kullanılabilir olduğunda, sinir sesi modelinizi güncelleştirmeniz istenir. Bkz . Ses modeliniz için altyapı sürümünü güncelleştirme.

Azure İlkesi veya diğer özellikleri kullanarak eğitim sayısını sınırlandırabilir miyiz? Yoksa yanlış eğitimden kaçınmanın bir yolu var mı?

Eğitim iznini sınırlamak istiyorsanız, kullanıcı rollerini ve erişimini sınırlayabilirsiniz. Konuşma kaynakları için Rol tabanlı erişim denetimine bakın.

Microsoft, oluşturulduğunda sesimizin yetkisiz kullanımını veya kötüye kullanımını önlemek için bir mekanizma ekleyebilir mi?

Ses modeli yalnızca kendi belirtecinizi kullanarak kendiniz kullanabilirsiniz. Microsoft verilerinizi de kullanmaz. Bkz. Veri, gizlilik ve güvenlik. Modelinizi korumak için sesinize filigran ekleme isteğinde de bulunabilirsiniz. Bkz . Microsoft Azure Nöral TTS yapay ses tanımlama için filigran algoritmasını tanıtır.

Ses aktörleriyle yapılan anlaşmalar veya görüşmeler hakkında ipuçlarınız var mı?

Sözleşmeler hakkında hiçbir önerimiz yok ve koşulları müzakere etmek müşteriye ve ses yeteneğine bağlıdır. Ancak, ses yeteneğinin olası riskleri de dahil olmak üzere metin okumanın özelliklerini anladığınızdan emin olmalı ve hem sözleşmede hem de sözlü bir ifadede sesinin sentetik bir sürümünü oluşturmak için açık bir onay vermelisiniz. Bkz . Ses yeteneği için açıklama.

Ses yeteneğinden alınan yazılı izni Microsoft'a geri döndürmemiz gerekiyor mu?

Microsoft'un yazılı izne ihtiyacı yoktur, ancak ses yeteneğinizden onay almanız gerekir. Ses yeteneğinin onay bildirimini kaydetmesi de gerekir ve eğitimin başlayabilmesi için önce Speech Studio'ya yüklenmesi gerekir. Bkz . Profesyonel ses ince ayarı için ses yeteneğini ayarlama.