Konuşma çevirisi nedir?
Bu makalede, Azure AI Konuşma ile çevirinin avantajları ve özellikleri hakkında bilgi ediniyorsunuz. Konuşma tanıma hizmeti, ses akışlarının gerçek zamanlı, çok dilli konuşmayı konuşmayı ve konuşmayı metne dönüştürmeyi destekler.
Konuşma SDK'sını veya Konuşma CLI'sını kullanarak uygulamalarınıza, araçlarınıza ve cihazlarınıza sağlanan ses için kaynak transkripsiyonlara ve çeviri çıkışlarına erişim verebilirsiniz. Konuşma algılandığında ara transkripsiyon ve çeviri sonuçları döndürülür ve nihai sonuçlar sentezlenmiş konuşmaya dönüştürülebilir.
Konuşma çevirisi için desteklenen dillerin listesi için bkz . Dil ve ses desteği.
İpucu
Konuşmayı hızlı bir şekilde test etmek ve düşük gecikme süresiyle istediğiniz diğer dillere çevirmek için Speech Studio'ya gidin.
Temel özellikler
Konuşma çevirisinin temel özellikleri şunlardır:
- Konuşmayı metin çevirisine dönüştürme
- Konuşmadan konuşmaya çeviri
- Çok dilli konuşma çevirisi
- Birden çok hedef dil çevirisi
Konuşmayı metin çevirisine dönüştürme
Konuşma hizmeti tarafından sunulan standart özellik, belirtilen kaynak dilinizde bir giriş ses akışı alma ve bunu belirtilen hedef dilinizde metin olarak çevirip çıktısını alma özelliğidir.
Konuşmadan konuşmaya çeviri
Konuşma tanıma hizmeti, yukarıdaki özelliğin bir eki olarak, önceden eğitilmiş seslerden oluşan büyük veritabanımızı kullanarak çevrilmiş metni sesli okuma seçeneği de sunar ve giriş konuşmasının doğal bir çıkışını sağlar.
Çok dilli konuşma çevirisi
Çok dilli konuşma çevirisi, belirtilen giriş dili olmaması, aynı oturumda dil anahtarlarının işlenmesi ve canlı akış çevirilerinin İngilizceye desteklenmesi gibi çeşitli özelliklerin kilidini açan yeni bir konuşma çevirisi teknolojisi sunar. Bu özellikler, ürünlerinize uygulanabilecek yeni bir konuşma çevirisi gücü düzeyi sağlar.
- Belirtilmemiş giriş dili. Çok dilli konuşma çevirisi çok çeşitli dillerde ses alabilir ve beklenen giriş dilinin ne olduğunu belirtmenize gerek yoktur.
- Dil değiştirme. Çok dilli konuşma çevirisi, aynı oturum sırasında birden çok dilin konuşulmasını ve tümünün aynı hedef dile çevrilmesini sağlar. Giriş dili değiştiğinde veya sizin tarafınızdan yapılan diğer eylemlerde oturumu yeniden başlatmanız gerekmez.
- Transkripsiyon. Hizmet, belirtilen hedef dilde bir transkripsiyon çıkışı oluşturur. Kaynak dil transkripsiyonu henüz kullanılamıyor.
Çok dilli konuşma çevirisi için bazı kullanım örnekleri şunlardır:
- Seyahat Yorumlayıcısı. Yurtdışına seyahat ederken, çok dilli konuşma çevirisi müşterilerin herhangi bir giriş sesini yerel dile ve yerel dilden çevirmesine olanak tanıyan bir çözüm oluşturma olanağı sunar. Bu sayede yerel halkla iletişim kurabilir ve çevrelerini daha iyi anlayabilirler.
- İş Toplantısı. Farklı dil konuşan kişilerle yapılan bir toplantıda, çok dilli konuşma çevirisi, toplantı üyelerinin birbirleriyle doğal olarak dil engeli yokmuş gibi iletişim kurmasını sağlar.
Desteklenen giriş (kaynak) dillerinin listesi için metin dillerine konuşma belgelerine bakın. Desteklenen çıkış (hedef) dillerinin listesi için konuşma çevirisi dillerindeki Metin diline çevir belgelerine bakın.
Çok dilli konuşma çevirisi hakkında daha fazla bilgi için GitHub'da konuşma çevirisi nasıl yönlendirilir ve konuşma çevirisi örneklerine bakın.
Birden çok hedef dil çevirisi
Birden çok dilde çıktı almak istediğiniz senaryolarda Konuşma hizmeti doğrudan giriş dilini iki hedef dile çevirmenizi sağlar. Bu, tek bir API çağrısıyla iki çıkış almalarını ve bu çevirileri daha geniş bir hedef kitleyle paylaşmalarını sağlar. Daha fazla çıkış dili gerekiyorsa, çok hizmetli bir kaynak oluşturabilir veya ayrı çeviri hizmetleri kullanabilirsiniz.
İkiden fazla hedef dile çeviri yapmanız gerekiyorsa Azure AI hizmetleri kaynağı oluşturma veya ikincinin ötesinde daha fazla dil için ayrı çeviri hizmetleri kullanmanız gerekir. Konuşma çevirisi hizmetini çok hizmetli bir kaynakla çağırmayı seçerseniz, çevirinin karakter sayısına bağlı olarak çeviri ücretlerinin ikincinin ötesindeki her dil için geçerli olduğunu lütfen unutmayın.
Uygulanan çeviri ücretini hesaplamak için lütfen Azure AI Translator fiyatlandırmasına bakın.
Birden çok hedef dil çevirisi fiyatlandırması
Konuşma çevirisi hizmetinin gerçek zamanlı olarak çalıştığını ve ara konuşma sonuçlarının ara çeviri sonuçları oluşturmak için çevrildiğini unutmayın. Bu nedenle, gerçek çeviri miktarı giriş sesinin belirteçlerinden büyüktür. Konuşmayı metne dönüştürme transkripsiyonu ve her hedef dil için metin çevirisi için ücretlendirilirsiniz.
Örneğin, bir saatlik ses dosyasından üç hedef dile metin çevirisi yapmak istediğinizi varsayalım. Metin transkripsiyonundaki ilk konuşma 10.000 karakter içeriyorsa 2,80 ABD doları ücretlendirilebilirsiniz.
Uyarı
Bu örnekteki fiyatlar yalnızca açıklayıcı amaçlıdır. En güncel fiyatlandırma bilgileri için lütfen Azure AI Konuşma Tanıma fiyatlandırmasına ve Azure AI Translator fiyatlandırmasına bakın.
2,80 ABD doları olan önceki örnek fiyat, konuşmayı metne dönüştürme transkripsiyonu ve metin çevirisi maliyetleri birleştirilerek hesaplandı. Hesaplama şu şekilde yapılmıştır:
- Konuşma çevirisi listesi fiyatı saatte 2,50 ABD dolarıdır ve en fazla 2 hedef dili kapsar. Fiyat, maliyetlerin nasıl hesaplanması için bir örnek olarak kullanılır. En güncel fiyatlandırma bilgileri için Azure AI Konuşma fiyatlandırma tablosundaki Kullandıkça>Öde Konuşma çevirisi>Standart bölümüne bakın.
- Bu örnekte üçüncü dil çevirisinin maliyeti 30 senttir. Çeviri listesi fiyatı milyon karakter başına 10 ABD dolarıdır. Ses dosyası 10.000 karakter içerdiğinden çeviri maliyeti 10 TL * 10.000 / 1.000.000 * 3 = 0,3 USD'dir. Bu denklemdeki "3" sayısı ara trafiğin ağırlık katsayısını temsil eder ve bu katsayı ilgili dillere bağlı olarak değişebilir. Fiyat, maliyetlerin nasıl hesaplanması için bir örnek olarak kullanılır. En güncel fiyatlandırma bilgileri için Bkz. Kullandıkça>Öde Standart çevirisi>Azure AI Translator fiyatlandırma tablosunda metin çevirisi.
Kullanmaya başlayın
İlk adımınız olarak konuşma çevirisi hızlı başlangıcını deneyin. Konuşma çevirisi hizmeti Konuşma SDK'sı ve Konuşma CLI'sı aracılığıyla kullanılabilir.
GitHub'da Konuşma SDK'sı metin okuma ve çeviri örnekleri bulabilirsiniz. Bu örnekler dosya veya akıştan ses okuma, sürekli ve tek seferlik tanıma ve çeviri gibi yaygın senaryoları ve özel modellerle çalışmayı kapsar.