Aracılığıyla paylaş


Özel metin sınıflandırma modelini eğitma

Eğitim, modelin etiketlenmiş verilerinizden öğrendiği işlemdir. Eğitim tamamlandıktan sonra modelinizi geliştirmeniz gerekip gerekmediğini belirlemek için modelin performansını görüntüleyebileceksiniz .

Modeli eğitmek için bir eğitim işi başlatın. Yalnızca başarıyla tamamlanan işler kullanılabilir bir model oluşturur. Eğitim işlerinin süresi yedi gün sonra dolar. Bu süreden sonra iş ayrıntılarını alamayacaksınız. Eğitim işiniz başarıyla tamamlandıysa ve bir model oluşturulduysa, iş süresinin dolmasından etkilenmez. Aynı anda yalnızca bir eğitim işi çalıştırabilirsiniz ve aynı projede diğer işleri başlatamazsınız.

Eğitim süreleri, veri kümesi boyutuna ve şemanızın karmaşıklığına bağlı olarak birkaç saate kadar birkaç belgeyle çalışırken birkaç dakika içinde herhangi bir yerde olabilir.

Önkoşullar

Modelinizi eğitmeden önce şunları yapmanız gerekir:

Daha fazla bilgi için proje geliştirme yaşam döngüsüne bakın.

Veri bölme

Eğitim sürecine başlamadan önce, projenizdeki etiketli belgeler bir eğitim kümesine ve test kümesine ayrılır. Her biri farklı bir işleve hizmet eder. Eğitim kümesi modeli eğitmek için kullanılır. Bu küme, modelin her belgeye atanan sınıfı/sınıfları öğrendiği kümedir. Test kümesi, eğitim sırasında değil yalnızca değerlendirme sırasında modele tanıtılmayan bir kör kümedir. Model başarıyla eğitildikten sonra, test kümesindeki belgelerden tahminler yapmak için kullanılır. Bu tahminlere göre modelin değerlendirme ölçümleri hesaplanır. Tüm sınıflarınızın hem eğitim hem de test kümesinde yeterince temsil edildiğinden emin olun.

Özel metin sınıflandırması, veri bölme için iki yöntemi destekler:

  • Test kümesini eğitim verilerinden otomatik olarak bölme: Sistem, etiketlenmiş verilerinizi seçtiğiniz yüzdelere göre eğitim ve test kümeleri arasında böler. Sistem, eğitim kümenizdeki tüm sınıfların bir gösterimini yapmaya çalışır. Önerilen bölme yüzdesi eğitim için %80 ve test için %20'dir.

Not

Test kümesini eğitim verilerinden otomatik olarak böl seçeneğini belirlerseniz, yalnızca eğitim kümesine atanan veriler sağlanan yüzdelere göre bölünür.

  • Eğitim ve test verilerinin el ile bölünmesini kullanın: Bu yöntem, kullanıcıların hangi etiketli belgelerin hangi kümeye ait olması gerektiğini tanımlamasına olanak tanır. Bu adım yalnızca veri etiketleme sırasında test kümenize belge eklediyseniz etkinleştirilir.

Modeli eğitme

Modelinizi Language Studio'dan eğitmeye başlamak için:

  1. Sol taraftaki menüden Eğitim işleri'ni seçin.

  2. Üstteki menüden Eğitim işi başlat'ı seçin.

  3. Yeni model eğit'i seçin ve metin kutusuna model adını yazın. Ayrıca bu seçeneği belirleyip açılan menüden üzerine yazmak istediğiniz modeli belirleyerek mevcut modelin üzerine yazabilirsiniz. Eğitilen modelin üzerine yazmak geri alınamaz, ancak yeni modeli dağıtana kadar dağıtılan modellerinizi etkilemez.

    Yeni eğitim işi oluşturma

  4. Veri bölme yöntemini seçin. Sistemin etiketlenmiş verilerinizi belirtilen yüzdelere göre eğitim ve test kümeleri arasında böleceği eğitim verilerinden test kümesini otomatik olarak bölme'yi seçebilirsiniz. Ya da eğitim ve test verilerinin el ile bölünmesini kullanabilirsiniz. Bu seçenek yalnızca veri etiketleme sırasında test kümenize belge eklediyseniz etkinleştirilir. Veri bölme hakkında daha fazla bilgi için bkz. Modeli eğitme .

  5. Eğit düğmesini seçin.

  6. Listeden eğitim işi kimliğini seçerseniz, bu iş için Eğitim ilerleme durumunu, İş durumunu ve diğer ayrıntıları denetleyebileceğiniz bir yan bölme görüntülenir.

    Not

    • Yalnızca başarıyla tamamlanan eğitim işleri model oluşturur.
    • Modeli eğitmek için gereken süre, etiketlenmiş verilerinizin boyutuna göre birkaç dakika ile birkaç saat arasında sürebilir.
    • Aynı anda yalnızca bir eğitim işi çalıştırabilirsiniz. Çalışan iş tamamlanana kadar aynı proje içinde başka bir eğitim işi başlatamazsınız.

Eğitim işini iptal etme

Language Studio'da eğitim işini iptal etmek için Eğitim işleri sayfasına gidin. İptal etmek istediğiniz eğitim işini seçin ve üstteki menüden İptal'i seçin.

Sonraki adımlar

Eğitim tamamlandıktan sonra, gerekirse modelinizi isteğe bağlı olarak geliştirmek için modelin performansını görüntüleyebileceksiniz . Modelinizi tamamladıktan sonra dağıtarak metni sınıflandırmak için kullanılabilir hale getirebilirsiniz.