Özet
Tip
Daha fazla ayrıntı için Metin ve resimler sekmesine bakın!
Bu modülde, ses özellikli uygulamaların ve aracıların temeli olarak konuşma tanıma (konuşmayı metne dönüştürme) tanıtılıyor. Öğrenciler, konuşulan sesin bir mikrofondan veya ses dosyasından nasıl yakalandığını ve Azure Konuşma kullanarak yazılı metne nasıl dönüştürüldüğünü keşfeder. Modülde, konuşmadan metne dönüştürmenin istemci uygulamasında veya arka uç hizmetinde bir uygulamaya nerede sığdığı açıklanır ve canlı transkripsiyon, resim yazıları, sesli mesaj işleme ve yapay zeka aracılarına metin girişi sağlama gibi yaygın senaryolar vurgulanır.
Modül daha sonra uygulamaların metinden doğal sesli ses oluşturmasını sağlayan konuşma sentezini (metin okuma) kapsar. Öğrenciler, Azure Konuşma'nın telaffuz, ton, hız ve perde seviyesini kontrol etmek için nöral ses modellemelerini nasıl kullandığını ve sentezlenen sesin hemen çalınabileceğini veya daha sonra kullanılmak üzere kaydedilebileceğini öğrenir. Bu bölümde, metin okuma özelliğinin uygulamaların ve aracıların sesli yanıt vermesine, erişilebilirliği, eller serbest etkileşimi ve genel kullanıcı deneyimini iyileştirmesine nasıl izin verdiği vurgulanmıştır.
Son olarak modül, Voice Live kullanarak bu özellikleri konuşmadan konuşmaya özelliğiyle bir araya getirir. Öğrenciler, Voice Live'ın gerçek zamanlı konuşmalar için konuşmayı metne dönüştürme, yapay zeka mantığı ve metin okuma özelliğini tek, tam olarak yönetilen bir hizmette nasıl bir araya getirildiğini keşfediyor. Geliştiriciler birden çok bileşeni bir araya getirmek yerine Ses Canlı'yı kullanarak dinleyebilen, düşünebilen ve konuşabilen, azure konuşma ve Microsoft Foundry ile üretime hazır konuşma deneyimleri oluşturmayı kolaylaştıran duyarlı, doğal ses aracıları oluşturabilir.
Daha fazla bilgi edinmek için aşağıdaki bağlantıları kullanın.
- Azure Konuşma Hizmeti belgeleri
- Azure Konuşma Yazılım Geliştirme Setleri (SDK) hakkında daha fazla bilgi edinin
- Belgelerde Azure Konuşma - Voice Live hakkında daha fazla bilgi edinin