Özel Konuşma Tanıma nedir?

Özel Konuşma ile uygulamalarınız ve ürünleriniz için Microsoft konuşmayı metne dönüştürme doğruluğunu değerlendirebilir ve geliştirebilirsiniz.

Konuşmayı metne dönüştürme özelliği, Microsoft sahip olduğu verilerle eğitilen ve yaygın olarak kullanılan konuşulan dili yansıtan bir temel model olarak Evrensel Dil Modeli'ni kullanır. Temel model, çeşitli ortak etki alanlarını temsil eden diyalektler ve fonetiklerle önceden eğitilir. Konuşma tanıma isteğinde bulunurken, desteklenen her dil için en son temel model varsayılan olarak kullanılır. Temel model çoğu konuşma tanıma senaryosunda çok iyi çalışır.

Özel bir model, modeli eğitmek için metin verileri sağlayarak uygulamaya özgü etki alanına özgü sözlüğün tanınmasını geliştirmek için temel modeli geliştirmek için kullanılabilir. Başvuru transkripsiyonları ile ses verileri sağlayarak uygulamanın belirli ses koşullarına göre tanımayı geliştirmek için de kullanılabilir.

Nasıl çalışır?

Özel Konuşma ile kendi verilerinizi karşıya yükleyebilir, özel bir modeli test edip eğitebilir, modeller arasındaki doğruluğu karşılaştırabilir ve modeli özel uç noktaya dağıtabilirsiniz.

Speech Studio'nun Özel Konuşma alanını oluşturan bileşenleri vurgulayan diyagram.

Önceki diyagramda gösterilen adım dizisi hakkında daha fazla bilgi aşağıdadır:

  1. Proje oluşturun ve bir model seçin. Azure portal oluşturduğunuz Konuşma kaynağını kullanın. Ses verileriyle özel bir model eğitecekseniz, ses verilerini eğitecek ayrılmış donanıma sahip bir Konuşma kaynak bölgesi seçin. Daha fazla bilgi için bölgeler tablosundaki dipnotlara bakın.
  2. Test verilerini karşıya yükleyin. Uygulamalarınız, araçlarınız ve ürünleriniz için Microsoft konuşmayı metne dönüştürme teklifini değerlendirmek için test verilerini karşıya yükleyin.
  3. Test tanıma kalitesi. Karşıya yüklenen sesi kayıtlardan yürütmek ve test verilerinizin konuşma tanıma kalitesini incelemek için Speech Studio'yu kullanın.
  4. Modeli nicel olarak test edin. Konuşmayı metne dönüştürme modelinin doğruluğunu değerlendirin ve geliştirin. Konuşma hizmeti, ek eğitim gerekip gerekmediğini belirlemek için kullanabileceğiniz nicel bir sözcük hata oranı (WER) sağlar.
  5. Modeli eğitin. İlgili ses verileriyle birlikte yazılı transkriptler ve ilgili metinler sağlayın. Modeli eğitimden önce ve sonra test etme isteğe bağlıdır ancak önerilir.
  6. Modeli dağıtma. Test sonuçlarından memnun olduğunuzda modeli özel bir uç noktaya dağıtın. Toplu transkripsiyon dışında, Özel Konuşma modeli kullanmak için özel bir uç nokta dağıtmanız gerekir.

Sonraki adımlar