Konuşma çevirisi nedir?

Bu makalede, Azure AI Konuşma ile çevirinin avantajları ve özellikleri hakkında bilgi ediniyorsunuz. Konuşma tanıma hizmeti, ses akışlarının gerçek zamanlı, çok dilli konuşmayı konuşmayı ve konuşmayı metne dönüştürmeyi destekler.

Konuşma SDK'sını veya Konuşma CLI'sını kullanarak uygulamalarınıza, araçlarınıza ve cihazlarınıza sağlanan ses için kaynak transkripsiyonlara ve çeviri çıkışlarına erişim verebilirsiniz. Konuşma algılandığında ara transkripsiyon ve çeviri sonuçları döndürülür ve nihai sonuçlar sentezlenmiş konuşmaya dönüştürülebilir.

Konuşma çevirisi için desteklenen dillerin listesi için bkz . Dil ve ses desteği.

Temel özellikler

Konuşma çevirisinin temel özellikleri şunlardır:

Konuşmayı metin çevirisine dönüştürme

Konuşma hizmeti tarafından sunulan standart özellik, belirtilen kaynak dilinizde bir giriş ses akışı alma ve bunu belirtilen hedef dilinizde metin olarak çevirip çıktısını alma özelliğidir.

Konuşmadan konuşmaya çeviri

Konuşma tanıma hizmeti, yukarıdaki özelliğin bir eki olarak, önceden eğitilmiş seslerden oluşan büyük veritabanımızı kullanarak çevrilmiş metni sesli okuma seçeneği de sunar ve giriş konuşmasının doğal bir çıkışını sağlar.

Çok dilli konuşma çevirisi (Önizleme)

Çok dilli konuşma çevirisi, belirtilen giriş dili olmaması, aynı oturumda dil anahtarlarının işlenmesi ve canlı akış çevirilerinin İngilizceye desteklenmesi gibi çeşitli özelliklerin kilidini açan yeni bir konuşma çevirisi teknolojisi sunar. Bu özellikler, ürünlerinize uygulanabilecek yeni bir konuşma çevirisi gücü düzeyi sağlar.

  • Belirtilmemiş giriş dili. Çok dilli konuşma çevirisi çok çeşitli dillerde ses alabilir ve beklenen giriş dilinin ne olduğunu belirtmenize gerek yoktur.
  • Dil değiştirme. Çok dilli konuşma çevirisi, aynı oturum sırasında birden çok dilin konuşulmasını ve tümünün aynı hedef dile çevrilmesini sağlar. Giriş dili değiştiğinde veya sizin tarafınızdan yapılan diğer eylemlerde oturumu yeniden başlatmanız gerekmez.
  • Transkripsiyon. Hizmet, belirtilen hedef dilde bir transkripsiyon çıkışı oluşturur. Kaynak dil transkripsiyonu henüz kullanılamıyor.

Çok dilli konuşma çevirisi için bazı kullanım örnekleri şunlardır:

  • Seyahat Yorumlayıcısı. Yurtdışına seyahat ederken, çok dilli konuşma çevirisi müşterilerin herhangi bir giriş sesini yerel dile ve yerel dilden çevirmesine olanak tanıyan bir çözüm oluşturma olanağı sunar. Bu sayede yerel halkla iletişim kurabilir ve çevrelerini daha iyi anlayabilirler.
  • İş Toplantısı. Farklı dil konuşan kişilerle yapılan bir toplantıda, çok dilli konuşma çevirisi, toplantı üyelerinin birbirleriyle doğal olarak dil engeli yokmuş gibi iletişim kurmasını sağlar.

Çok dilli konuşma çevirisi için, Konuşma hizmetinin girişten otomatik olarak algılayıp geçiş yaptığı diller şunlardır: Arapça (ar), Baskça (eu), Boşnakça (bs), Bulgarca (bg), Çince Basitleştirilmiş (zh), Geleneksel Çince (zhh), Çekçe (cs), Danca (da), Felemenkçe (nl), İngilizce (en), Estonca (et), Fince (fi), Fransızca (fr), Galiçyaca (gl), Almanca (de), Yunanca (el), Hintçe (hi), Macarca (hu), Endonezya dili (id), İtalyanca (it), Japonca (ja), Korece (ko), Letonca (lv), Litvanca (lt), Makedonca (mk), Norveç dili (nb), Lehçe (pl), Portekizce (pt), Rumence (ro), Rusça (ru)), Sırpça (sr), Slovakça (sk), Slovence (sl), İspanyolca (es), İsveççe (sv), Tayca (th), Türkçe (tr), Ukraynaca (uk), Vietnamca (vi) ve Galce (cy).

Desteklenen çıkış (hedef) dillerinin listesi için dil ve ses desteği belgelerinde Metin diline çevir tablosuna bakın.

Çok dilli konuşma çevirisi hakkında daha fazla bilgi için GitHub'da konuşma çevirisi nasıl yönlendirilir ve konuşma çevirisi örneklerine bakın.

Birden çok hedef dil çevirisi

Birden çok dilde çıktı almak istediğiniz senaryolarda Konuşma hizmeti doğrudan giriş dilini iki hedef dile çevirmenizi sağlar. Bu, tek bir API çağrısıyla iki çıkış almalarını ve bu çevirileri daha geniş bir hedef kitleyle paylaşmalarını sağlar. Daha fazla çıkış dili gerekiyorsa, çok hizmetli bir kaynak oluşturabilir veya ayrı çeviri hizmetleri kullanabilirsiniz.

İkiden fazla hedef dile çeviri yapmanız gerekiyorsa, çok hizmetli bir kaynak oluşturmanız veya ikincinin ötesinde daha fazla dil için ayrı çeviri hizmetleri kullanmanız gerekir. Konuşma çevirisi hizmetini çok hizmetli bir kaynakla çağırmayı seçerseniz, çevirinin karakter sayısına bağlı olarak çeviri ücretlerinin ikincinin ötesindeki her dil için geçerli olduğunu lütfen unutmayın.

Uygulanan çeviri ücretini hesaplamak için lütfen Azure AI Çeviri fiyatlandırmasına bakın.

Birden çok hedef dil çevirisi fiyatlandırması

Konuşma çevirisi hizmetinin gerçek zamanlı olarak çalıştığını ve ara konuşma sonuçlarının ara çeviri sonuçları oluşturmak için çevrildiğini unutmayın. Bu nedenle, gerçek çeviri miktarı giriş sesinin belirteçlerinden büyüktür. Konuşmayı metne dönüştürme transkripsiyonu ve her hedef dil için metin çevirisi için ücretlendirilirsiniz.

Örneğin, bir saatlik ses dosyasından üç hedef dile metin çevirisi yapmak istediğinizi varsayalım. Metin transkripsiyonundaki ilk konuşma 10.000 karakter içeriyorsa 2,80 ABD doları ücretlendirilebilirsiniz.

Uyarı

Bu örnekteki fiyatlar yalnızca açıklayıcı amaçlıdır. En güncel fiyatlandırma bilgileri için lütfen Azure AI Konuşma fiyatlandırmasına ve Azure AI Çeviri fiyatlandırmasına bakın.

2,80 ABD doları olan önceki örnek fiyat, konuşmayı metne dönüştürme transkripsiyonu ve metin çevirisi maliyetleri birleştirilerek hesaplandı. Hesaplama şu şekilde yapılmıştır:

  • Konuşma çevirisi listesi fiyatı saatte 2,50 ABD dolarıdır ve en fazla 2 hedef dili kapsar. Fiyat, maliyetlerin nasıl hesaplanması için bir örnek olarak kullanılır. En güncel fiyatlandırma bilgileri için Azure AI Konuşma fiyatlandırma tablosundaki Kullandıkça>Öde Konuşma çevirisi>Standart bölümüne bakın.
  • Bu örnekte üçüncü dil çevirisinin maliyeti 30 senttir. Çeviri listesi fiyatı milyon karakter başına 10 ABD dolarıdır. Ses dosyası 10.000 karakter içerdiğinden çeviri maliyeti 10 TL * 10.000 / 1.000.000 * 3 = 0,3 USD'dir. Bu denklemdeki "3" sayısı ara trafiğin ağırlık katsayısını temsil eder ve bu katsayı ilgili dillere bağlı olarak değişebilir. Fiyat, maliyetlerin nasıl hesaplanması için bir örnek olarak kullanılır. En güncel fiyatlandırma bilgileri için bkz. Kullandıkça>Öde Standart çevirisi>Azure AI Çeviri fiyatlandırma tablosunda metin çevirisi.

Kullanmaya başlayın

İlk adımınız olarak konuşma çevirisi hızlı başlangıcını deneyin. Konuşma çevirisi hizmeti Konuşma SDK'sı ve Konuşma CLI'sı aracılığıyla kullanılabilir.

GitHub'da Konuşma SDK'sı metin okuma ve çeviri örnekleri bulabilirsiniz. Bu örnekler dosya veya akıştan ses okuma, sürekli ve tek seferlik tanıma ve çeviri gibi yaygın senaryoları ve özel modellerle çalışmayı kapsar.

Sonraki adımlar