Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Özel konuşma ile uygulamalarınız ve ürünleriniz için konuşma tanımanın doğruluğunu değerlendirebilir ve geliştirebilirsiniz. Özel konuşma modeli, gerçek zamanlı konuşmayı metne dönüştürme, konuşma çevirisi ve toplu transkripsiyon için kullanılabilir.
Konuşma tanıma, Microsoft'un sahip olduğu verilerle eğitilen ve yaygın olarak kullanılan konuşulan dili yansıtan bir temel model olarak Evrensel Dil Modeli'ni kullanır. Temel model, çeşitli ortak etki alanlarını temsil eden diyalektler ve fonetiklerle önceden eğitilir. Bir konuşma tanıma isteği yaptığınızda, desteklenen her dil için en son temel model varsayılan olarak kullanılır. Temel model çoğu konuşma tanıma senaryosunda iyi çalışır.
Özel bir model, metin verileri sağlayarak uygulamaya özgü alanla ilgili sözlüğün tanınmasını artırmak için temel modeli genişletmek amacıyla kullanılabilir. Başvuru transkripsiyonları ile ses verileri sağlayarak uygulamanın belirli ses koşullarına göre tanımayı geliştirmek için de kullanılabilir.
Ayrıca, veriler bir desene uygun olduğunda, özel söylenişleri belirtmek ve özel ters metin normalleştirmesi, özel yeniden yazma ve özel küfür filtreleme ile görüntü metni biçimlendirmesini özelleştirmek için yapılandırılmış metin içeren bir model eğitebilirsiniz.
Nasıl çalışır?
Özel konuşma ile kendi verilerinizi karşıya yükleyebilir, özel bir modeli test edebilir ve eğitebilir, modeller arasındaki doğruluğu karşılaştırabilir ve modeli özel uç noktaya dağıtabilirsiniz.
Önceki diyagramda gösterilen adım dizisi hakkında daha fazla bilgi aşağıdadır:
Bir proje oluşturun ve bir model seçin. Ses verileriyle özel bir model eğitirseniz, ses verilerini eğitme için ayrılmış donanıma sahip bir bölgede bir hizmet kaynağı seçin. Daha fazla bilgi için bkz. bölgeler tablosundaki dipnotlar.
Test verilerini karşıya yükleyin. Uygulamalarınız, araçlarınız ve ürünleriniz için konuşmayı metne dönüştürme teklifini değerlendirmek için test verilerini karşıya yükleyin.
Modeli eğitin. İlgili ses verileriyle birlikte yazılı transkriptler ve ilgili metinler sağlayın. Modeli eğitimden önce ve sonra test etme isteğe bağlıdır ancak önerilir.
Not
Özel konuşma modeli kullanımı ve uç nokta barındırma için ödemeniz gerekir. Temel model 1 Ekim 2023 ve sonrasında oluşturulduysa özel konuşma modeli eğitimi için de ücretlendirilirsiniz. Temel model Ekim 2023'e kadar oluşturulduysa eğitim için ücret alınmaz. Daha fazla bilgi için, Foundry Tools fiyatlandırma içinde Azure Speech ve Konuşmadan metne 3.2 geçiş kılavuzu içindeki uyarlama için Ücret bölümüne bakın.
Test tanıma kalitesi. Speech Studio'yu kullanarak karşıya yüklenen sesi oynatın ve test verilerinizin konuşma tanıma kalitesini inceleyin.
Modeli nicel olarak test edin. Konuşmayı metin modeline dönüştürme işleminin doğruluğunu değerlendirin ve geliştirin. Konuşma hizmeti, daha fazla eğitim gerekip gerekmediğini belirlemek için kullanabileceğiniz nicel bir sözcük hata oranı (WER) sağlar.
Modeli dağıtın. Test sonuçlarından memnun olduktan sonra modeli özel bir uç noktaya dağıtın. Toplu transkripsiyon dışında, özel konuşma modeli kullanmak için özel bir uç nokta dağıtmanız gerekir.
İpucu
Batch transkripsiyon API'siyle özel konuşma kullanmak için bir barındırılan dağıtım uç noktası gerekli değildir. Özel konuşma modeli yalnızca toplu transkripsiyon için kullanılıyorsa kaynakları tasarruf edebilirsiniz. Daha fazla bilgi için bkz. Speech hizmeti fiyatlandırması.
Modelinizi seçin
Özel konuşma modellerini kullanmaya yönelik birkaç yaklaşım vardır:
- Temel model, çeşitli senaryolar için kullanıma hazır doğru konuşma tanıma sağlar. Temel modeller, doğruluğu ve kaliteyi artırmak için düzenli aralıklarla güncelleştirilir. Temel modelleri kullanıyorsanız en son varsayılan temel modelleri kullanmanızı öneririz. Gerekli özelleştirme özelliği yalnızca eski bir modelde kullanılabiliyorsa, eski bir temel model seçebilirsiniz.
- Özelleştirilmiş model, temel modeli, özelleştirilmiş alanın tüm bölgelerinde paylaşılan alana özgü terminoloji ile genişletmektedir.
- Özelleştirilmiş alan adı, her biri belirli bir kelime dağarcığına sahip birden fazla alan içerdiğinde birden fazla özelleştirilmiş model kullanılabilir.
Temel modelin yeterli olup olmadığını görmenin önerilen yollarından biri, temel modelden üretilen transkripsiyonu analiz etmek ve aynı ses için insan tarafından oluşturulan transkriptle karşılaştırmaktır. Transkriptleri karşılaştırabilir ve sözcük hata oranı (WER) puanı alabilirsiniz. WER puanı yüksekse, yanlış tanımlanmış sözcükleri tanımak için özel bir model eğitmek önerilir.
Sözcük dağarcığı etki alanı alanları arasında farklılık gösteriyorsa birden çok model önerilir. Örneğin, Olimpiyat yorumcuları, her biri kendi uzmanlık diline sahip çeşitli olayları rapor eder. Her Olimpik olay sözlüğü diğerlerinden önemli ölçüde farklı olduğundan, bir olaya özgü özel model oluşturmak, konuşma verilerini ilgili olaya göre sınırlayarak doğruluğu artırır. Sonuç olarak, modelin eşleşme yapmak için ilişkisiz verileri elemesi gerekmez. Ne olursa olsun, eğitim yine de çeşitli eğitim verileri gerektirir. Farklı aksanları, cinsiyeti, yaşı vb. olan çeşitli yorumcuların sesini ekleyin.
Model kararlılığı ve yaşam döngüsü
Özel konuşma kullanarak uç noktaya dağıtılan temel model veya özel model, siz güncelleştirmeye karar verinceye kadar düzeltilir. Yeni bir temel model yayınlandığında bile konuşma tanıma doğruluğu ve kalitesi tutarlı olmaya devam ediyor. Bu, daha yeni bir model kullanmaya karar verene kadar belirli bir modelin davranışını kilitlemenizi sağlar.
İster kendi modelinizi eğitin ister temel modelin anlık görüntüsünü kullanın, modeli sınırlı bir süre için kullanabilirsiniz. Daha fazla bilgi için bkz . Model ve uç nokta yaşam döngüsü.
Sorumlu Yapay Zeka
Yapay zeka sistemi yalnızca teknolojiyi değil, onu kullanan kişileri, etkilenen kişileri ve dağıtıldığı ortamı da içerir. Sistemlerinizde sorumlu yapay zeka kullanımı ve dağıtımı hakkında bilgi edinmek için saydamlık notlarını okuyun.
- Şeffaflık notu ve kullanım örnekleri
- Karakteristikler ve sınırlamalar
- Integration ve sorumlu kullanım
- Data, gizlilik ve güvenlik