Aracılığıyla paylaş


Speech Studio nedir?

Speech Studio , Uygulamalarınızda Azure AI Konuşma Tanıma hizmetinden özellikler oluşturmaya ve tümleştirmeye yönelik bir dizi kullanıcı arabirimi tabanlı araçtır. Speech Studio'da kod içermeyen bir yaklaşım kullanarak projeler oluşturur ve ardından Konuşma SDK'sı, Konuşma CLI'sı veya REST API'lerini kullanarak uygulamalarınızdaki bu varlıklara başvurabilirsiniz.

İpucu

Ayrıca Azure AI Foundry portalında kaydolmadan veya kod yazmadan konuşmayı metne dönüştürmeyi ve metin okuma özelliğini deneyebilirsiniz.

Speech Studio senaryoları

Yaygın kullanım örneklerinden bazıları için örnek kodu keşfedin, deneyin ve görüntüleyin.

  • Açıklamalı alt yazı: Gerçek zamanlı veya çevrimdışı işlenmiş resim yazısı sonuçlarını görmek için örnek bir video klibi seçin. Açıklamalı alt yazıları giriş sesinizle eşitlemeyi, küfür filtreleri uygulamayı, kısmi sonuçlar almayı, özelleştirmeleri uygulamayı ve çok dilli senaryolar için konuşulan dilleri tanımlamayı öğrenin. Daha fazla bilgi için bkz . resim yazısı hızlı başlangıcı.

  • Çağrı Merkezi: Çağrı merkezi konuşmalarını analiz etmek için Dil ve Konuşma hizmetlerinin nasıl kullanılacağına ilişkin bir tanıtım görüntüleyin. Aramaların gerçek zamanlı dökümünü oluşturun veya bir grup aramayı işleyin, kişisel olarak tanımlayan bilgileri yeniden işleyin ve çağrı merkezi kullanım örneğinize yardımcı olmak için yaklaşım gibi içgörüleri ayıklayın. Daha fazla bilgi için çağrı merkezi hızlı başlangıcına bakın.

Speech Studio'da bu senaryoların tanıtımı için bu tanıtım videosunu görüntüleyin.

Speech Studio özellikleri

Speech Studio'da aşağıdaki Konuşma hizmeti özellikleri proje türleri olarak kullanılabilir:

  • Gerçek zamanlı konuşmayı metne dönüştürme: Herhangi bir kod kullanmak zorunda kalmadan ses dosyalarını buraya sürükleyerek konuşmayı metne dönüştürmeyi hızla test edin. Speech Studio,ses örneklerinizde metin okumanın nasıl çalıştığını görmek için bir tanıtım aracına sahiptir. Tüm işlevleri keşfetmek için bkz . Konuşmayı metne dönüştürme nedir?

  • Toplu konuşmayı metne dönüştürme: Depolamada büyük miktarda ses dökümü yapmak ve zaman uyumsuz olarak sonuç almak için toplu iş transkripsiyonu özelliklerini hızla test edin. Batch Konuşmayı metne dönüştürme hakkında daha fazla bilgi edinmek için bkz . Toplu konuşmayı metne dönüştürmeye genel bakış.

  • Özel konuşma: Belirli sözlük kümelerine ve konuşma stillerine göre uyarlanmış konuşma tanıma modelleri oluşturun. Temel konuşma tanıma modelinin aksine, Özel konuşma modelleri genel olarak erişilebilir olmadığından benzersiz rekabet avantajınızın bir parçası haline gelir. Özel konuşma modeli oluşturmak üzere örnek sesi karşıya yüklemeye başlamak için bkz . Eğitim ve test veri kümelerini karşıya yükleme.

  • Söyleniş değerlendirmesi: Konuşma söylenişini değerlendirin ve konuşmacılara konuşulan sesin doğruluğu ve akıcılığı hakkında geri bildirim sağlayın. Speech Studio, bu özelliği kod olmadan hızlı bir şekilde test eden bir korumalı alan sağlar. Özelliği uygulamalarınızda Konuşma SDK'sı ile kullanmak için Söyleniş değerlendirme makalesine bakın.

  • Konuşma Çevirisi: Düşük gecikme süresiyle konuşmayı hızla test edin ve seçtiğiniz diğer dillere çevirin. Tüm işlevleri keşfetmek için bkz . Konuşma çevirisi nedir?

  • Ses Galerisi: Doğal olarak konuşan uygulamalar ve hizmetler oluşturun. Geniş bir dil, ses ve çeşit portföyü arasından seçim yapın. Son derece etkileyici ve insan benzeri sinir sesleriyle senaryolarınızı hayata geçirme.

  • Özel ses: Metin okuma için özel, türünün tek örneği olan sesler oluşturun. Speech Studio'da ses dosyaları sağlar, eşleşen transkripsiyonlar oluşturur ve uygulamalarınızda özel sesleri kullanırsınız. Uç noktalar aracılığıyla özel sesler oluşturmak ve kullanmak için bkz . Ses modelinizi oluşturma ve kullanma.

  • Ses İçeriği Oluşturma: Metinden konuşmaya sentez için kod içermeyen bir yaklaşım. Çıkış sesini olduğu gibi veya daha fazla özelleştirme için başlangıç noktası olarak kullanabilirsiniz. Sesli kitaplar, haber yayınları, video anlatımları ve sohbet botları gibi çeşitli senaryolar için yüksek oranda doğal ses içeriği oluşturabilirsiniz. Daha fazla bilgi için Ses İçeriği Oluşturma belgelerine bakın.

  • Özel Anahtar Sözcük: Özel anahtar sözcük, bir ürünü sesli olarak etkinleştirmek için kullanabileceğiniz bir sözcük veya kısa tümceciktir. Speech Studio'da özel bir anahtar sözcük oluşturur ve ardından uygulamalarınızda Konuşma SDK'sı ile kullanılacak bir ikili dosya oluşturursunuz.

Sonraki adımlar