Giriş
Yapay zeka konuşma özellikleri, sesli yönergelerle sistemleri yönetmemize, konuşulan sorulara bilgisayarlardan yanıtlar almamıza, sesten açıklamalı alt yazılar oluşturmamıza ve çok daha fazlasına olanak tanır. Ses tabanlı arabirimler, yapay zeka yazılımıyla etkileşim kurmak için daha doğal bir yol sağlar. Konuşulan dil aracılığıyla etkileşim kurabilme özelliği, uygulamaların ve aracıların erişilebilirliğini ve kapsayıcılığını artırabilir.
Bu tür bir etkileşimi etkinleştirmek için yapay zeka sisteminin en az iki özelliği desteklemesi gerekir:
- Konuşma tanıma: Konuşulan girişi algılama ve yorumlama özelliği
- Konuşma sentezi: Konuşulan çıkış oluşturma yeteneği
Bu özelliklere örnek olarak şunlar verilebilir:
Sağlık hizmetlerinde klinik dikte ve not alma: Doktorlar randevu sırasında veya sonrasında hasta notlarını yüksek sesle söyleyebilir. Yapay zeka konuşma uygulaması, sesi doğru tıbbi metne dönüştürerek el ile yazmayı azaltır ve zaman kazandırır.
Müşteri desteğinde arama transkripsiyonu: İletişim merkezleri, müşteri aramalarının gerçek zamanlı olarak dökümünü alır ve bu da konuşmaları gözden geçirmeyi, sorunları algılamayı ve yaklaşımı çözümlemeyi kolaylaştırır.
Medya ve eğlencede otomatik açıklamalı alt yazı: Video platformları, gösteriler ve akışlar için canlı veya kaydedilmiş açıklamalı alt yazılar oluşturarak erişilebilirliği geliştirir ve çok dilli hedef kitleleri destekler.
Eğitimde dil öğrenme ve söyleniş geri bildirimi: Öğrenme uygulamaları, öğrencilerin konuşmalarını dinlemek ve söyleniş geri bildirimi sağlamak için yapay zeka konuşma özelliklerini kullanarak öğrencilerin konuşulan dil becerilerini geliştirmelerine yardımcı olur.
Perakende ve e-ticarette sesli yardımcılar: Sanal alışveriş yardımcıları, ürün bilgileri veya sipariş durumuyla yanıt vermek için konuşulan müşteri isteklerini ve metin okumayı anlamak için konuşma tanımayı kullanır.
Microsoft Foundry Araçları'nda Azure Konuşma , konuşma tanıma ve sentez aracılığıyla konuşmayı metne dönüştürme, metin okuma ve konuşma çevirisi özellikleri sağlar. Sesi yüksek doğrulukla metne dönüştürmeden konuşmalardaki konuşmacıları tanımlamaya, özel sesler oluşturmaya ve daha fazlasına kadar çeşitli görevler için önceden oluşturulmuş ve özel Konuşma tanıma hizmeti modellerini kullanabilirsiniz. Ardından Azure Konuşma ile konuşma tanımayı bir uygulamaya nasıl ekleyeceğinizi öğrenin.
Uyarı
Farklı insanların farklı yollarla öğrenmeyi beğendiğini biliyoruz. Bu modülü video tabanlı biçimde tamamlayabilir veya içeriği metin ve görüntü olarak okuyabilirsiniz. Metin videolardan daha fazla ayrıntı içerdiğinden, bazı durumlarda video sunusuna ek malzeme olarak başvurmak isteyebilirsiniz.