Aracılığıyla paylaş


Language Studio kullanarak verilerinizi etiketleme

Veri etiketleme, geliştirme yaşam döngüsünde önemli bir adımdır. Bu adımda, belgelerinizi şemanızda tanımladığınız yeni varlıklarla etiketleyerek öğrenilen bileşenlerini doldurursunuz. Bu veriler modelinizi eğitirken bir sonraki adımda kullanılacaktır. Böylece modeliniz etiketlenmiş verilerden hangi varlıkları ayıklayabileceğinizi öğrenebilir. Verileri zaten etiketlediyseniz doğrudan projenize aktarabilirsiniz , ancak verilerinizin kabul edilen veri biçimine uygun olduğundan emin olmanız gerekir. Etiketlenmiş verileri projenize aktarma hakkında daha fazla bilgi edinmek için bkz. proje oluşturma. Verileriniz henüz etiketlenmemişse , Language Studio'da etiketleyebilirsiniz.

Önkoşullar

Verilerinizi etiketleyebilmeniz için önce şunları yapmanız gerekir:

Daha fazla bilgi için proje geliştirme yaşam döngüsüne bakın.

Veri etiketleme yönergeleri

Verilerinizi hazırladıktan, şemanızı tasarladıktan ve projenizi oluşturduktan sonra verilerinizi etiketlemeniz gerekir. Modelinizin ayıklamanız gereken varlık türleriyle hangi sözcüklerin ilişkilendirileceğini bilmesi için verilerinizi etiketlemek önemlidir. Language Studio'da verilerinizi etiketlediğinizde (veya etiketlenmiş verileri içeri aktardığınızda), bu etiketler bu projeye bağladığınız depolama kapsayıcınızdaki JSON belgesinde depolanır.

Verilerinizi etiketlerken şunları aklınızda bulundurun:

  • Önceden eğitilmiş önceden eğitilmiş varlıklar olduğundan, sistem durumu varlıkları için Metin Analizi etiket ekleyemezsiniz. Yalnızca şema tanımı sırasında tanımladığınız yeni varlık kategorilerine etiket ekleyebilirsiniz.

Önceden oluşturulmuş bir varlık için geri çağırmayı geliştirmek istiyorsanız, şemanızı tanımlarken bir liste bileşeni ekleyerek bunu genişletebilirsiniz.

  • Genel olarak, verilerin doğru etiketlenmiş olması koşuluyla daha fazla etiketlenmiş veri daha iyi sonuçlara yol açar.

  • Etiketlenmiş verilerinizin duyarlığı, tutarlılığı ve eksiksizliği, model performansını belirlemede önemli faktörlerdir.

    • Tam olarak etiketle: Her varlığı her zaman doğru türüne etiketle. Yalnızca ayıklamak istediklerinizi ekleyin, etiketlerinizde gereksiz verilerden kaçının.
    • Tutarlı bir şekilde etiketle: Aynı varlık tüm belgelerde aynı etikete sahip olmalıdır.
    • Tamamen etiketle: Varlığın tüm örneklerini tüm belgelerinizde etiketle.

    Not

    Modelinizin en iyi performansı göstereceğini garanti edecek sabit sayıda etiket yoktur. Model performansı şemanızdaki olası belirsizliğe ve etiketlenmiş verilerinizin kalitesine bağlıdır. Bununla birlikte, varlık türü başına yaklaşık 50 etiketli örneğe sahip olmasını öneririz.

Verilerinizi etiketleme

Verilerinizi etiketlemek için aşağıdaki adımları kullanın:

  1. Language Studio'da proje sayfanıza gidin.

  2. Sol taraftaki menüden Veri etiketleme'yi seçin. Depolama kapsayıcınızdaki tüm belgelerin listesini bulabilirsiniz.

    İpucu

    Etiketlenmemiş belgeleri görüntülemek için üst menüdeki filtreleri kullanabilirsiniz, böylece bunları etiketlemeye başlayabilirsiniz. Belirli bir varlık türüyle etiketlenmiş belgeleri görüntülemek için filtreleri de kullanabilirsiniz.

  3. Üst menüdeki sol taraftan tek bir belge görünümüne geçin veya etiketlemeye başlamak için belirli bir belgeyi seçin. Projenizde bulunan tüm .txt belgelerin listesini sol tarafta bulabilirsiniz. Belgelerinizde gezinmek için sayfanın alt kısmındaki Geri ve İleri düğmesini kullanabilirsiniz.

    Not

    Projeniz için birden çok dili etkinleştirdiyseniz, üstteki menüde her belgenin dilini seçmenize olanak tanıyan bir Dil açılan listesi görürsünüz. İbranice, çok dilli projelerde desteklenmez.

  4. Sağ taraftaki bölmede Varlık türü ekle düğmesini kullanarak projenize şema tanımı sırasında kaçırdığınız başka varlıklar ekleyebilirsiniz.

  5. Belgenizi etiketlemek için iki seçeneğiniz vardır:

    Seçenek Açıklama
    Fırça kullanarak etiketleme Sağ bölmede varlık türünün yanındaki fırça simgesini seçin, sonra belgedeki bu varlık türüyle açıklama eklemek istediğiniz metni vurgulayın.
    Menü kullanarak etiketleme Varlık olarak etiketlemek istediğiniz sözcüğü vurguladığınızda bir menü görüntülenir. Bu varlık için atamak istediğiniz varlık türünü seçin.

    Aşağıdaki ekran görüntüsünde fırça kullanarak etiketleme gösterilmektedir.

    Özel NER'de sunulan etiketleme seçeneklerini gösteren ekran görüntüsü.

  6. Sağ taraftaki bölmede , Etiketler özetinin altında projenizdeki tüm varlık türlerini ve her biri için etiketlenmiş örneklerin sayısını bulabilirsiniz. Önceden oluşturulmuş varlıklar başvuru için gösterilir, ancak önceden eğitildiklerinde bu önceden oluşturulmuş varlıkları etiketleyemezsiniz.

  7. Sağ taraftaki bölmenin alt bölümünde, görüntülemekte olduğunuz geçerli belgeyi eğitim kümesine veya test kümesine ekleyebilirsiniz. Varsayılan olarak tüm belgeler eğitim kümenize eklenir. Model eğitimi ve değerlendirmesi için nasıl kullanıldıkları hakkında bilgi için bkz. eğitim ve test kümeleri.

    İpucu

    Otomatik veri bölmeyi kullanmayı planlıyorsanız, tüm belgeleri eğitim kümenize atamanın varsayılan seçeneğini kullanın.

  8. Dağıtım özetinin altında, eğitim ve test kümeleri arasındaki dağıtımı görüntüleyebilirsiniz. Görüntülemek için iki seçeneğiniz vardır:

    • Belirli bir varlık türünün etiketlenmiş tüm örneklerinin sayısını görüntüleyebileceğiniz toplam örnekler.
    • Bu varlığın etiketlenmiş en az bir örneğini içeriyorsa, her belgenin sayıldığı en az bir etiketi olan belgeler.
  9. Etiketleme yaparken, değişiklikleriniz düzenli aralıklarla eşitlenir; henüz kaydedilmemişse, sayfanızın en üstünde bir uyarı bulursunuz. El ile kaydetmek istiyorsanız, sayfanın en altındaki Etiketleri kaydet düğmesini seçin.

Etiketleri kaldırma

Etiketi kaldırmak için

  1. Etiketi kaldırmak istediğiniz varlığı seçin.
  2. Görüntülenen menüyü kaydırın ve Etiketi kaldır'ı seçin.

Varlıkları silme

Önceden oluşturulmuş bir bileşene sahip olduklarından, sistem durumu önceden eğitilmiş varlıkların Metin Analizi hiçbirini silemezsiniz. Yalnızca yeni tanımlanan varlık kategorilerini silmenize izin verilir. Bir varlığı silmek için, kaldırmak istediğiniz varlığın yanındaki sil simgesini seçin. Bir varlığın silinmesi, etiketlenmiş tüm örneklerini veri kümenizden kaldırır.

Sonraki adımlar

Verilerinizi etiketledikten sonra, verilerinize göre öğrenecek bir model eğitmeyi başlatabilirsiniz.