Özel metin sınıflandırmasında kullanılan terimler ve tanımlar

Özel metin sınıflandırması kullanırken karşılaşabileceğiniz tanımlardan ve terimlerden bazıları hakkında bilgi edinmek için bu makaleyi kullanın.

Sınıf

Sınıf, metnin genel sınıflandırmasını gösteren kullanıcı tanımlı bir kategoridir. Geliştiriciler verileri eğitim için modele geçirmeden önce sınıflarıyla etiketlemektedir.

F1 puanı

F1 puanı Duyarlık ve Yakalama işlevinin bir işlevidir. Duyarlık ve yakalama arasında bir denge ararken gereklidir.

Modelleme

Model, belirli bir görevi (bu örnekte metin sınıflandırma görevleri) gerçekleştirmek için eğitilmiş bir nesnedir. Modeller, daha sonra sınıflandırma görevleri için kullanılabilmesi için öğrenmeniz gereken etiketli veriler sağlayarak eğitilir.

  • Model eğitimi , modelinize belgeleri etiketlenmiş verilerinize göre sınıflandırmayı öğretme işlemidir.
  • Model değerlendirmesi , modelinizin ne kadar iyi performans sergilediğini öğrenmek için eğitimden hemen sonra gerçekleşen işlemdir.
  • Dağıtım , modelinizi tahmin API'sinin kullanımına açmak için bir dağıtıma atama işlemidir.

Duyarlık

Modelinizin ne kadar hassas/doğru olduğunu ölçer. Doğru tanımlanmış pozitifler (gerçek pozitifler) ile tüm tanımlanan pozitifler arasındaki orandır. Duyarlık ölçümü, tahmin edilen sınıflardan kaçının doğru etiketlendiğini gösterir.

Project

Proje, verilerinize göre özel ML modellerinizi oluşturmaya yönelik bir çalışma alanıdır. Projenize yalnızca siz ve kullanılmakta olan Azure kaynağına erişimi olan diğer kişiler erişebilir. Özel metin sınıflandırma projesi oluşturmanın önkoşulu olarak, yeni bir proje oluştururken kaynağınızı veri kümenizle bir depolama hesabına bağlamanız gerekir. Projeniz kapsayıcınızda bulunan tüm .txt dosyaları otomatik olarak içerir.

Projenizde aşağıdakileri yapabilirsiniz:

  • Verilerinizi etiketleme: Modelinizi eğittiğinizde ayıklamak istediklerinizi öğrenmesi için verilerinizi etiketleme işlemi.
  • Modelinizi oluşturun ve eğitin: Modelinizin etiketlenmiş verilerinizden öğrenmeye başladığı projenizin temel adımı.
  • Model değerlendirme ayrıntılarını görüntüleme: İyileştirmeye yer olup olmadığına veya sonuçlardan memnun olup olmadığınız konusunda karar vermek için model performansınızı gözden geçirin.
  • Dağıtım: Model performansını gözden geçirdikten ve ortamınızda kullanılmaya uygun olduğundan karar verdikten sonra; sorgulayabilmek için bir dağıtıma atamanız gerekir. Modelin bir dağıtıma atanarak tahmin API'sinde kullanılması sağlanır.
  • Test modeli: Modelinizi dağıttıktan sonra, dağıtımınızı denemek ve üretimde nasıl performans göstereceğini görmek için bu işlemi Language Studio'da kullanabilirsiniz.

Proje türleri

Özel metin sınıflandırması iki proje türünü destekler

  • Tek etiketli sınıflandırma : Veri kümenizdeki her belge için tek bir sınıf atayabilirsiniz. Örneğin, bir film betiği yalnızca "Romantik" veya "Komedi" olarak sınıflandırılabilir.
  • Çoklu etiket sınıflandırması : Veri kümenizdeki her belge için birden çok sınıf atayabilirsiniz. Örneğin, bir film betiği "Komedi" veya "Romantik" ve "Komedi" olarak sınıflandırılabilir.

Geri çağırma

Modelin gerçek pozitif sınıfları tahmin etme yeteneğini ölçer. Tahmin edilen gerçek pozitifler ile gerçekte etiketlenenler arasındaki orandır. Geri çağırma ölçümü, tahmin edilen sınıflardan kaçının doğru olduğunu gösterir.

Sonraki adımlar