Question 1

Metin okuma için faturalama nasıl çalışır?

Accepted Answer

Metin okuma kullanımı karakter başına faturalandırılır. Fiyatlandırma notunda faturalanabilir karakterlerin tanımını denetleyin.

Question 2

Metinden konuşma sentezine yönelik isteklerin hız sınırı nedir?

Accepted Answer

Metin okuma sentezi hızı, daha fazla istek aldığında otomatik olarak ölçeklendirilir. Konuşma kaynağı başına varsayılan hız sınırı ayarlanır. Oran, iş gerekçeleriyle ayarlanabilir ve hız sınırı artışı için ek ücret uygulanmaz. Konuşma hizmeti kotaları ve sınırları bölümünde daha fazla ayrıntıyı gözden geçirin.

Question 3

Son kullanıcıya sesin sentetik bir ses olduğunu nasıl açıklayacağız?

Accepted Answer

Metin okuma özelliğini kullanırken her kullanıcının davranış kurallarımıza uymasını öneririz. Örtük ve açık satır dahil olmak üzere sesin sentetik doğasını açıklamanın çeşitli yolları vardır. Açıklama tasarım yönergelerine bakın.

Question 4

Ses uygulamamın gecikme süresini nasıl azaltabilirim?

Accepted Answer

Gecikme süresini azaltmanız ve kullanıcılarınıza en iyi performansı sunmanız için birkaç ipucu sağlıyoruz. Bkz. Konuşma SDK'sı kullanarak konuşma sentezi gecikme süresini azaltma.

Question 5

Metin okuma hangi çıkış ses biçimlerini destekler?

Accepted Answer

Azure AI metin okuma, yaygın olarak kullanılan örnekleme hızlarıyla çeşitli akış ve akışsız ses biçimlerini destekler. Tüm TTS standart sesleri, 48 kHz ve 24 kHz ile yüksek kaliteli ses çıkışlarını desteklemek için oluşturulur. Ses, gerektiğinde diğer fiyatları destekleyecek şekilde yeniden örneklenebilir. Bkz. Ses çıkışları.

Question 6

Ses belirli sözcükleri strese almak için özelleştirilebilir mi?

Accepted Answer

Vurgunun ayarlanması, yerel ayara bağlı olarak bazı sesler için desteklenir. Vurgu etiketine bakın.

Question 7

Her duygu için birden fazla güce sahip olabilir miyiz?

Accepted Answer

Stil derecesinin ayarlanması, yerel ayara bağlı olarak bazı sesler için desteklenir. Bkz. mstts:express-as etiketi.

Question 8

Viseme kimlikleri ile ağız şekli arasında eşleme var mı?

Accepted Answer

Evet. Bkz . Viseme ile yüz konumunu alma.

Question 9

Kodumdaki Ses İçeriği Oluşturma platformunda oluşturduğum bir sözlük dosyasına nasıl başvurabilirim?

Accepted Answer

İlk olarak, Ses İçeriği Oluşturma'da lexicon dosyasını açabilir ve dosya yolunda "?fileKind=CustomLexiconFile" dosyasından önce bulunan lexicon dosya kimliğini alabilirsiniz. Örneğin, dosya yolu ise https://speech.microsoft.com/portal/d391a094f76846acbcd11dc2ba835f4f/audiocontentcreation/file/6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c?fileKind=CustomLexiconFile, sözcük sözlüğü dosya kimliği şeklindedir 6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c. Ardından, Ses İçeriği Oluşturma'da bu sözcük sözlüğüne başvuran bir dosyayı SSML biçimine geçirin. SSML dosyasında, belirtilen dosya kimliğine

Question 10

Profesyonel ses ince ayarı için ne kadar veri gerekir?

Accepted Answer

Profesyonel ses ince ayarı için en az 300 kayıt satırı (veya yaklaşık 30 dakikalık konuşma) eğitim verilerine ihtiyacınız vardır. Üretim kullanımı için bir ses oluşturmak için 2.000 satır kayıt (veya yaklaşık 2-3 saat konuşma) öneririz. Betik seçimi ölçütleri için bkz . Özel ses örneklerini kaydetme.

Question 11

Aynı eğitim verileri kümesine yinelenen metin cümleleri ekleyebilir miyiz?

Accepted Answer

Hayır Hizmet yinelenen tümcelere bayrak ekler ve yalnızca içeri aktarılan ilk cümleyi saklar. Betik seçimi ölçütleri için bkz . Özel ses örneklerini kaydetme.

Question 12

Aynı eğitim verileri kümesine birden çok stil ekleyebilir miyiz?

Accepted Answer

Tek bir eğitim veri kümesinde stili tutarlı tutmanızı öneririz. Stiller farklıysa, bunları farklı eğitim kümelerine yerleştirin. Bu durumda, profesyonel ses ince ayarının çok stilli eğitim yöntemini kullanmayı göz önünde bulundurun. Betik seçimi ölçütleri için bkz . Özel ses örneklerini kaydetme.

Question 13

SSML aracılığıyla stiller arasında geçiş yapmak özel seslerde işe yaraıyor mu?

Accepted Answer

SSML aracılığıyla stiller arasında geçiş yapmak hem çok stilli standart seslerde hem de çok stilli özel seslerde kullanılabilir. Çok stilli eğitim sayesinde farklı stillerde konuşan bir ses oluşturabilir ve bu stilleri SSML aracılığıyla da ayarlayabilirsiniz.

Question 14

Diller arası ses, farklı söyleniş yapısına ve derlemeye sahip dillerle nasıl çalışır?

Accepted Answer

Cümle yapısı ve söylenişi doğal olarak İngilizce ve Japonca gibi dillerde farklılık gösterir. Her sinir sesi, yerel konuşan ses yeteneği tarafından kaydedilen ses verileriyle eğitilir. Diller arası ses için, tını gibi önemli özellikleri orijinal konuşmacı gibi sese aktarıyoruz ve doğru telaffuzu koruyoruz. Örneğin, diller arası bir ses, Japonca konuşmak için yerel yolu kullanır ve orijinal İngilizce konuşmacıya benzer (ancak tam olarak değil) gibi görünür.

Question 15

Etki alanım için söylenişi özelleştirmek için profesyonel ses ince ayarını kullanabilir miyim?

Accepted Answer

Profesyonel ses ince ayarı, işletmeniz için bir marka sesi oluşturmanıza olanak tanır. Etki alanınız için de iyileştirebilirsiniz. Daha yüksek doğallık için eğitim verilerinize etki alanına özgü örnekler eklemenizi öneririz. Ancak söyleniş, konuşma hizmeti tarafından varsayılan olarak tanımlanır. Profesyonel ses ince ayarı ile telaffuz özelleştirmeyi desteklemiyoruz. Sesinizin söylenişini özelleştirmek istiyorsanız SSML kullanın. Bkz . Konuşma Sentezi biçimlendirme dili (SSML) ile söyleniş.

Question 16

Bir eğitimden sonra sesimi yeniden eğitebilir miyim?

Accepted Answer

Tekrar eğitebilirsiniz. Her eğitim yeni bir ses modeli oluşturur. Her eğitim için ücretlendirilirsiniz.

Question 17

Model sürümü altyapı sürümüyle aynı mı?

Accepted Answer

Hayır Model sürümü altyapı sürümünden farklıdır. Model sürümü, modeliniz için eğitim tarifinin sürümü anlamına gelir ve desteklenen özelliklere ve model eğitim süresine göre değişir. Azure AI hizmetleri metninden konuşma altyapılarına, dilin söylenişini tanımlayan en son dil modelini yakalamak için zaman zaman güncelleştirilir. Sesinizi eğitdikten sonra en son altyapı sürümüne güncelleştirerek sesinizi yeni dil modeline uygulayabilirsiniz. Yeni bir altyapı kullanılabilir olduğunda, sinir sesi modelinizi güncelleştirmeniz istenir. Bkz . Ses modeliniz için altyapı sürümünü güncelleştirme.

Question 18

Azure İlkesi veya diğer özellikleri kullanarak eğitim sayısını sınırlandırabilir miyiz? Yoksa yanlış eğitimden kaçınmanın bir yolu var mı?

Accepted Answer

Eğitim iznini sınırlamak istiyorsanız, kullanıcı rollerini ve erişimini sınırlayabilirsiniz. Konuşma kaynakları için Rol tabanlı erişim denetimine bakın.

Question 19

Microsoft, oluşturulduğunda sesimizin yetkisiz kullanımını veya kötüye kullanımını önlemek için bir mekanizma ekleyebilir mi?

Accepted Answer

Ses modeli yalnızca kendi belirtecinizi kullanarak kendiniz kullanabilirsiniz. Microsoft verilerinizi de kullanmaz. Bkz. Veri, gizlilik ve güvenlik. Modelinizi korumak için sesinize filigran ekleme isteğinde de bulunabilirsiniz. Bkz . Microsoft Azure Nöral TTS yapay ses tanımlama için filigran algoritmasını tanıtır.

Question 20

Ses aktörleriyle yapılan anlaşmalar veya görüşmeler hakkında ipuçlarınız var mı?

Accepted Answer

Sözleşmeler hakkında hiçbir önerimiz yok ve koşulları müzakere etmek müşteriye ve ses yeteneğine bağlıdır. Ancak, ses yeteneğinin olası riskleri de dahil olmak üzere metin okumanın özelliklerini anladığınızdan emin olmalı ve hem sözleşmede hem de sözlü bir ifadede sesinin sentetik bir sürümünü oluşturmak için açık bir onay vermelisiniz. Bkz . Ses yeteneği için açıklama.

Question 21

Ses yeteneğinden alınan yazılı izni Microsoft'a geri döndürmemiz gerekiyor mu?

Accepted Answer

Microsoft'un yazılı izne ihtiyacı yoktur, ancak ses yeteneğinizden onay almanız gerekir. Ses yeteneğinin onay bildirimini kaydetmesi de gerekir ve eğitimin başlayabilmesi için önce Speech Studio'ya yüklenmesi gerekir. Bkz . Profesyonel ses ince ayarı için ses yeteneğini ayarlama.

Aracılığıyla paylaş

Genel

Metin okuma için faturalama nasıl çalışır?

Metinden konuşma sentezine yönelik isteklerin hız sınırı nedir?

Son kullanıcıya sesin sentetik bir ses olduğunu nasıl açıklayacağız?

Ses uygulamamın gecikme süresini nasıl azaltabilirim?

Metin okuma hangi çıkış ses biçimlerini destekler?

Ses belirli sözcükleri strese almak için özelleştirilebilir mi?

Her duygu için birden fazla güce sahip olabilir miyiz?

Viseme kimlikleri ile ağız şekli arasında eşleme var mı?

Ses İçeriği Oluşturma

Kodumdaki Ses İçeriği Oluşturma platformunda oluşturduğum bir sözlük dosyasına nasıl başvurabilirim?

Profesyonel ses ince ayarı

Profesyonel ses ince ayarı için ne kadar veri gerekir?

Aynı eğitim verileri kümesine yinelenen metin cümleleri ekleyebilir miyiz?

Aynı eğitim verileri kümesine birden çok stil ekleyebilir miyiz?

SSML aracılığıyla stiller arasında geçiş yapmak özel seslerde işe yaraıyor mu?

Diller arası ses, farklı söyleniş yapısına ve derlemeye sahip dillerle nasıl çalışır?

Etki alanım için söylenişi özelleştirmek için profesyonel ses ince ayarını kullanabilir miyim?

Bir eğitimden sonra sesimi yeniden eğitebilir miyim?

Model sürümü altyapı sürümüyle aynı mı?

Azure İlkesi veya diğer özellikleri kullanarak eğitim sayısını sınırlandırabilir miyiz? Yoksa yanlış eğitimden kaçınmanın bir yolu var mı?

Microsoft, oluşturulduğunda sesimizin yetkisiz kullanımını veya kötüye kullanımını önlemek için bir mekanizma ekleyebilir mi?

Ses aktörleriyle yapılan anlaşmalar veya görüşmeler hakkında ipuçlarınız var mı?

Ses yeteneğinden alınan yazılı izni Microsoft'a geri döndürmemiz gerekiyor mu?

Sonraki adımlar

Aracılığıyla paylaş

Metin okuma hakkında SSS

Genel

Metin okuma için faturalama nasıl çalışır?

Metinden konuşma sentezine yönelik isteklerin hız sınırı nedir?

Son kullanıcıya sesin sentetik bir ses olduğunu nasıl açıklayacağız?

Ses uygulamamın gecikme süresini nasıl azaltabilirim?

Metin okuma hangi çıkış ses biçimlerini destekler?

Ses belirli sözcükleri strese almak için özelleştirilebilir mi?

Her duygu için birden fazla güce sahip olabilir miyiz?

Viseme kimlikleri ile ağız şekli arasında eşleme var mı?

Ses İçeriği Oluşturma

Kodumdaki Ses İçeriği Oluşturma platformunda oluşturduğum bir sözlük dosyasına nasıl başvurabilirim?

Profesyonel ses ince ayarı

Profesyonel ses ince ayarı için ne kadar veri gerekir?

Aynı eğitim verileri kümesine yinelenen metin cümleleri ekleyebilir miyiz?

Aynı eğitim verileri kümesine birden çok stil ekleyebilir miyiz?

SSML aracılığıyla stiller arasında geçiş yapmak özel seslerde işe yaraıyor mu?

Diller arası ses, farklı söyleniş yapısına ve derlemeye sahip dillerle nasıl çalışır?

Etki alanım için söylenişi özelleştirmek için profesyonel ses ince ayarını kullanabilir miyim?

Bir eğitimden sonra sesimi yeniden eğitebilir miyim?

Model sürümü altyapı sürümüyle aynı mı?

Azure İlkesi veya diğer özellikleri kullanarak eğitim sayısını sınırlandırabilir miyiz? Yoksa yanlış eğitimden kaçınmanın bir yolu var mı?

Microsoft, oluşturulduğunda sesimizin yetkisiz kullanımını veya kötüye kullanımını önlemek için bir mekanizma ekleyebilir mi?

Ses aktörleriyle yapılan anlaşmalar veya görüşmeler hakkında ipuçlarınız var mı?

Ses yeteneğinden alınan yazılı izni Microsoft'a geri döndürmemiz gerekiyor mu?

Sonraki adımlar

Geri Bildirim

Ek kaynaklar