Aracılığıyla paylaş


Azure AI Video Indexer ile Dil modelini özelleştirme

Uyarı

Azure AI Video Indexer (VI) geçtiğimiz yıl kullanımdan kaldırılma nedeniyle Azure Media Services'a (AMS) bağımlılığının kaldırılmaya başlanacağını duyurdu. Özellik ayarlamaları ve değişiklikler duyuruldu ve bir geçiş kılavuzu sağlandı.

Geçişi tamamlamak için son tarih 30 Haziran 2024'dü. VI, VI hesabınızı güncelleştirebilmeniz ve AMS VI varlık geçişini 31 Ağustos 2024'e kadar kabul edebilmeniz için güncelleştirme/geçiş son tarihini uzatmıştır.

Ancak 30 Haziran'dan sonra VI hesabınızı güncelleştirmediyseniz yeni videoları dizine ekleyemez veya geçirilmemiş videoları oynatamazsınız. Hesabınızı 30 Haziran'dan sonra güncelleştirirseniz, dizin oluşturmayı hemen sürdürebilirsiniz, ancak AMS VI geçişi aracılığıyla geçirilene kadar hesap güncelleştirmeden önce dizine alınmış videoları oynatamazsınız.

Azure AI Video Indexer, Microsoft Özel Konuşma Tanıma Hizmeti ile tümleştirme aracılığıyla otomatik konuşma tanımayı destekler. Uyarlama metnini karşıya yükleyerek Dil modelini özelleştirebilirsiniz. Bu metin, altyapının uyum sağlamak için kullanmasını istediğiniz kelime dağarcığını kullanmak istediğiniz etki alanından gelir. Modelinizi eğittikte, varsayılan söyleniş varsayılarak uyarlama metninde görünen yeni sözcükler tanınır ve Dil modeli yeni olası sözcük dizilerini öğrenir. Desteklenen langue'lerde Azure AI Video Indexer dilleri tarafından desteklenenler listesine bakın.

Örneğin, "Kubernetes" (Azure Kubernetes hizmeti bağlamında), son derece özel bir sözcük. Bu sözcük Azure AI Video Indexer'da yeni olduğundan "topluluklar" olarak kabul edilir. Modeli "Kubernetes" olarak tanıyacak şekilde eğitmelisiniz. Diğer durumlarda, sözcükler vardır, ancak Dil modeli bunların belirli bir bağlamda görünmesini beklemiyor. Örneğin, "kapsayıcı hizmeti", özel olmayan dil modelinin belirli bir sözcük kümesi olarak tanıyacağı 2 sözcüklü bir dizi değildir.

Dil modelini özelleştirmenin iki yolu vardır:

  • 1. Seçenek: Azure AI Video Indexer tarafından oluşturulan dökümü düzenleyin. Transkripti düzenleyip düzelterek, gelecekte daha iyi sonuçlar sağlamak için bir dil modeli eğitmiş olursunuz.
  • Seçenek 2: Dil modelini eğitmek için metin dosyalarını karşıya yükleyin. Karşıya yükleme dosyası, Video Indexer transkriptinde görünmesini istediğiniz sözcüklerin listesini veya cümle ve paragraflarda doğal olarak bulunan ilgili sözcükleri içerebilir. İkinci yaklaşımda daha iyi sonuçlar elde edildikçe, karşıya yükleme dosyasının içeriğinizle ilgili tümceleri veya paragrafları içermesi önerilir.

Önemli

Hedeflenen etkiyi olumsuz etkileyeceði için, karşıya yükleme dosyasýna şu anda yanlış yazılmış sözcükleri veya cümleleri (örneğin, "topluluklar" gibi) eklemeyin. Sözcükleri yalnızca görünmesini istediğiniz şekilde ekleyin (örneğin, "Kubernetes").

Özel Dil modelleri için en iyi yöntemler

Azure AI Video Indexer, sözcük birleşimlerinin olasılıklarını temel alarak öğrenir, bu nedenle en iyi şekilde öğrenmek için:

  • Konuşulacak cümlelere yeterince gerçek örnekler verin.
  • Satır başına yalnızca bir cümle koyun, daha fazlasını değil. Aksi takdirde sistem tümceler arasında olasılıkları öğrenir.
  • Bir sözcüğü diğerlerine karşı güçlendirmek için bir sözcüğü cümle olarak koymak normaldir, ancak sistem tüm cümlelerden en iyi şekilde öğrenir.
  • Yeni sözcükler veya kısaltmalar eklerken, mümkünse, sisteme mümkün olduğunca çok bağlam sağlamak için tam tümce içinde en fazla sayıda kullanım örneği verin.
  • Birkaç uyarlama seçeneği koymaya çalışın ve sizin için nasıl çalıştıklarını görün.
  • Aynı cümleyi birden çok kez tekrarlamaktan kaçının. Girişin geri kalanına karşı sapma oluşturabilir.
  • Atılacak yaygın olmayan simgeleri (~, # @ % &) dahil etmekten kaçının. Göründükleri cümleler de atılır.
  • Yüz binlerce cümle gibi çok büyük girişler koymaktan kaçının, çünkü bunu yapmak, artırmanın etkisini seyreltir.