Aracılığıyla paylaş


Metin okuma avatarlarına genel bakış

Metin okuma avatarı, metni, doğal bir sesle konuşan fotogerçekçi bir insanın (ya standart bir avatar ya da özel bir metin okuma avatarı) dijital videosuna dönüştürür. Metin okuma avatarı videosu zaman uyumsuz veya gerçek zamanlı olarak sentezlenebilir. Geliştiriciler API aracılığıyla metinden konuşmaya avatarla tümleştirilmiş uygulamalar oluşturabilir veya kodlama yapmadan video içeriği oluşturmak için Speech Studio'da içerik oluşturma aracı kullanabilir.

Metin okuma avatarlarının gelişmiş sinir ağı modelleriyle bu özellik, kullanıcıların sorumlu yapay zeka uygulamalarına bağlı kalarak çeşitli uygulamalar için yaşam benzeri ve yüksek kaliteli sentetik konuşma avatarı videoları sunmalarını sağlar.

İpucu

Kod içermeyen bir yaklaşımla metni konuşmaya dönüştürmek için Speech Studio'da Metin okuma avatar aracını deneyin.

Avatar özellikleri

Metin okuma avatarı özellikleri şunlardır:

  • Metni, Azure yapay zeka metniyle desteklenen doğal seslere sahip fotorealistik bir insan konuşmasının dijital videosuna dönüştürür.
  • Standart avatarlardan oluşan bir koleksiyon sağlar.
  • Avatarın sesini Azure AI metin-ses dönüştürme ile oluşturur. Daha fazla bilgi için bkz . Avatar sesi ve dili.
  • Toplu sentez API'siyle veya gerçek zamanlı olarak metni konuşma avatarı videosunu zaman uyumsuz olarak sentezler.
  • Speech Studio'da kodlama olmadan video içeriği oluşturmak için bir içerik oluşturma aracı sağlar.
  • Speech Studio'daki canlı sohbet avatar aracı aracılığıyla gerçek zamanlı avatar konuşmalarını etkinleştirir.

Metin okuma avatarlarının gelişmiş sinir ağı modelleriyle bu özellik, sorumlu yapay zeka uygulamalarına bağlı kalarak çeşitli uygulamalar için canlı ve kaliteli sentetik konuşma avatarı videoları sunmanızı sağlar.

Avatar sesi ve dili

Avatar için bir dizi standart ses arasından seçim yapabilirsiniz. Metin okuma avatarı için dil desteği, metin okuma için dil desteğiyle aynıdır. Ayrıntılar için bkz . Konuşma hizmeti için dil ve ses desteği. Standart metinden konuşmaya avatarlara Speech Studio portalından veya API aracılığıyla erişilebilir.

Yapay videodaki ses, Azure AI Konuşma standart sesi veya sizin seçtiğiniz ses yeteneğinin özel sesi olabilir.

Avatar video çıkışı

Hem toplu sentez hem de gerçek zamanlı sentez çözünürlüğü 1920 x 1080 ve saniye başına kare sayısı (FPS) 25'tir. Toplu sentez codec'i h264, hevc veya av1 biçiminde olabilir ve biçim mp4 ise codec'i vp9 veya av1 webmolarak ayarlayabilir; yalnızca vp9 alfa kanalı içerebilir. Gerçek zamanlı sentez codec'i h264'dür. Video bit hızı, istekte hem toplu sentez hem de gerçek zamanlı sentez için yapılandırılabilir; varsayılan değer 2000000'dir; daha ayrıntılı yapılandırmalar örnek kodda bulunabilir.

Toplu sentez Gerçek zamanlı sentez
Çözünürlük 1920 x 1080 1920 x 1080
FPS Yirmi beş Yirmi beş
Codec h264/hevc/vp9/av1 h264

Özel metin okuma avatarı

Ürününüz veya markanız için benzersiz olan konuşma avatarları için özel metin oluşturabilirsiniz. Başlamak için gereken tek şey 10 dakikalık video kayıtları almaktır. Ayrıca aktör için profesyonel bir sese ince ayar yapmak istiyorsanız avatar son derece gerçekçi olabilir.

Avatar için ses eşitleme, eğitim videosundan ses kullanan özel avatarla birlikte eğitilir. Ses özel avatarla özel olarak ilişkilendirilir ve bağımsız olarak kullanılamaz.

Profesyonel ses ince ayarı ve özel metinden konuşmaya avatar ayrı özelliklerdir. Bunları bağımsız olarak veya birlikte kullanabilirsiniz. Bir metin okuma avatarı ile profesyonel ses ince ayarını da kullanmayı planlıyorsanız, hassas ayarlanmış profesyonel ses modelinizi avatar tarafından desteklenen bölgelerden birine dağıtmanız veya kopyalamanız gerekir.

Daha fazla bilgi için bkz . Özel metin okuma avatarı nedir?

Örnek kod

Metin okuma avatarı için örnek kod GitHub'da kullanılabilir. Bu örnekler en popüler senaryoları kapsar:

Fiyatlandırma

Kullanılabilir konumlar

Metin okuma avatarı özelliği yalnızca şu hizmet bölgelerinde kullanılabilir: Güneydoğu Asya, Kuzey Avrupa, Batı Avrupa, Orta İsveç, Orta Güney ABD, Doğu ABD 2 ve Batı ABD 2.

Sorumlu AI

Yapay zeka kullanan kişilere ve bundan etkilenecek kişilere teknoloji kadar önem veririz. Daha fazla bilgi için bkz. Sorumlu yapay zeka saydamlık notları ve ses ve avatar yeteneği için açıklama.

Sonraki adımlar