Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Metin okuma avatarı, metni, doğal bir sesle konuşan fotogerçekçi bir insanın (ya standart bir avatar ya da özel bir metin okuma avatarı) dijital videosuna dönüştürür. Metin okuma avatarı videosu zaman uyumsuz veya gerçek zamanlı olarak sentezlenebilir. Geliştiriciler API aracılığıyla metinden konuşmaya avatarla tümleştirilmiş uygulamalar oluşturabilir veya kodlama yapmadan video içeriği oluşturmak için Speech Studio'da içerik oluşturma aracı kullanabilir.
Metin okuma avatarlarının gelişmiş sinir ağı modelleriyle bu özellik, kullanıcıların sorumlu yapay zeka uygulamalarına bağlı kalarak çeşitli uygulamalar için yaşam benzeri ve yüksek kaliteli sentetik konuşma avatarı videoları sunmalarını sağlar.
İpucu
Kod içermeyen bir yaklaşımla metni konuşmaya dönüştürmek için Speech Studio'da Metin okuma avatar aracını deneyin.
Avatar özellikleri
Metin okuma avatarı özellikleri şunlardır:
- Metni, Azure yapay zeka metniyle desteklenen doğal seslere sahip fotorealistik bir insan konuşmasının dijital videosuna dönüştürür.
- Standart avatarlardan oluşan bir koleksiyon sağlar.
- Avatarın sesini Azure AI metin-ses dönüştürme ile oluşturur. Daha fazla bilgi için bkz . Avatar sesi ve dili.
- Toplu sentez API'siyle veya gerçek zamanlı olarak metni konuşma avatarı videosunu zaman uyumsuz olarak sentezler.
- Speech Studio'da kodlama olmadan video içeriği oluşturmak için bir içerik oluşturma aracı sağlar.
- Speech Studio'daki canlı sohbet avatar aracı aracılığıyla gerçek zamanlı avatar konuşmalarını etkinleştirir.
Metin okuma avatarlarının gelişmiş sinir ağı modelleriyle bu özellik, sorumlu yapay zeka uygulamalarına bağlı kalarak çeşitli uygulamalar için canlı ve kaliteli sentetik konuşma avatarı videoları sunmanızı sağlar.
Avatar sesi ve dili
Avatar için bir dizi standart ses arasından seçim yapabilirsiniz. Metin okuma avatarı için dil desteği, metin okuma için dil desteğiyle aynıdır. Ayrıntılar için bkz . Konuşma hizmeti için dil ve ses desteği. Standart metinden konuşmaya avatarlara Speech Studio portalından veya API aracılığıyla erişilebilir.
Yapay videodaki ses, Azure AI Konuşma standart sesi veya sizin seçtiğiniz ses yeteneğinin özel sesi olabilir.
Avatar video çıkışı
Hem toplu sentez hem de gerçek zamanlı sentez çözünürlüğü 1920 x 1080 ve saniye başına kare sayısı (FPS) 25'tir. Toplu sentez codec'i h264, hevc veya av1 biçiminde olabilir ve biçim mp4
ise codec'i vp9 veya av1 webm
olarak ayarlayabilir; yalnızca vp9
alfa kanalı içerebilir. Gerçek zamanlı sentez codec'i h264'dür. Video bit hızı, istekte hem toplu sentez hem de gerçek zamanlı sentez için yapılandırılabilir; varsayılan değer 2000000'dir; daha ayrıntılı yapılandırmalar örnek kodda bulunabilir.
Toplu sentez | Gerçek zamanlı sentez | |
---|---|---|
Çözünürlük | 1920 x 1080 | 1920 x 1080 |
FPS | Yirmi beş | Yirmi beş |
Codec | h264/hevc/vp9/av1 | h264 |
Özel metin okuma avatarı
Ürününüz veya markanız için benzersiz olan konuşma avatarları için özel metin oluşturabilirsiniz. Başlamak için gereken tek şey 10 dakikalık video kayıtları almaktır. Ayrıca aktör için profesyonel bir sese ince ayar yapmak istiyorsanız avatar son derece gerçekçi olabilir.
Avatar için ses eşitleme, eğitim videosundan ses kullanan özel avatarla birlikte eğitilir. Ses özel avatarla özel olarak ilişkilendirilir ve bağımsız olarak kullanılamaz.
Profesyonel ses ince ayarı ve özel metinden konuşmaya avatar ayrı özelliklerdir. Bunları bağımsız olarak veya birlikte kullanabilirsiniz. Bir metin okuma avatarı ile profesyonel ses ince ayarını da kullanmayı planlıyorsanız, hassas ayarlanmış profesyonel ses modelinizi avatar tarafından desteklenen bölgelerden birine dağıtmanız veya kopyalamanız gerekir.
Daha fazla bilgi için bkz . Özel metin okuma avatarı nedir?
Örnek kod
Metin okuma avatarı için örnek kod GitHub'da kullanılabilir. Bu örnekler en popüler senaryoları kapsar:
- Toplu sentez (REST)
- Gerçek zamanlı sentez (SDK)
- Azure OpenAI ile arka planda canlı sohbet (SDK)
- Verilerinizde Azure OpenAI ile canlı sohbet UYGULAMASı oluşturmak için bu örnek koda başvurabilirsiniz ("Verilerinizde" araması yapın)
Fiyatlandırma
- Gerçek zamanlı avatar oturumu veya toplu içerik oluşturma işlemi boyunca metin okuma, konuşmayı metne dönüştürme, Azure OpenAI veya diğer Azure hizmetleri ayrı olarak ücretlendirilir.
- Avatar için ses eşitleme (özel avatar eğitimi aracılığıyla) ses oluşturma ve sentez açısından kişisel bir sesle aynı şekilde ücretlendirilir. Sesin depolanması ücretsizdir.
- Metin okuma avatarı özelliği için faturalamanın nasıl çalıştığını öğrenmek için metne konuşma avatarı fiyatlandırma notuna bakın.
- Ayrıntılı fiyatlandırma için bkz . Konuşma hizmeti fiyatlandırması. Avatar fiyatlandırmasının yalnızca güneydoğu Asya, Kuzey Avrupa, Batı Avrupa, Orta İsveç, Orta Güney ABD, Doğu ABD 2 ve Batı ABD 2 dahil olmak üzere özelliğin kullanılabildiği hizmet bölgelerinde görüleceğini unutmayın.
Kullanılabilir konumlar
Metin okuma avatarı özelliği yalnızca şu hizmet bölgelerinde kullanılabilir: Güneydoğu Asya, Kuzey Avrupa, Batı Avrupa, Orta İsveç, Orta Güney ABD, Doğu ABD 2 ve Batı ABD 2.
Sorumlu AI
Yapay zeka kullanan kişilere ve bundan etkilenecek kişilere teknoloji kadar önem veririz. Daha fazla bilgi için bkz. Sorumlu yapay zeka saydamlık notları ve ses ve avatar yeteneği için açıklama.