Özel adlandırılmış varlık tanıma tanımları ve terimleri

Makale
12/19/2023

Özel NER kullanırken karşılaşabileceğiniz tanımlardan ve terimlerden bazıları hakkında bilgi edinmek için bu makaleyi kullanın.

Varlık

Varlık, belirli bir bilgi türünü gösteren bir metin aralığıdır. Metin aralığı bir veya daha fazla sözcük içerebilir. Özel NER kapsamında varlıklar, kullanıcının metinden ayıklamak istediği bilgileri temsil eder. Geliştiriciler verileri içindeki varlıkları eğitim için modele geçirmeden önce gerekli varlıklarla etiketler. Örneğin, "Fatura numarası", "Başlangıç tarihi", "Sevkiyat numarası", "Doğum Yeri", "Kaynak şehir", "Sağlayıcı adı" veya "müşteri adresi".

Örneğin, "Ahmet, Fred'ten 25.000 ABD doları borç aldı" cümlesinde varlıklar şöyle olabilir:

Varlık adı/türü	Varlık
Ödünç AlmaCı Adı	John
Ödünç VerenIn Adı	Fred
Kredi Tutarı	25.000 USD

F1 puanı

F1 puanı Duyarlık ve Yakalama işlevinin bir işlevidir. Duyarlık ve yakalama arasında bir denge ararken bu gereklidir.

Modelleme

Model, özel varlık tanıma gibi belirli bir görevi gerçekleştirmek için eğitilen bir nesnedir. Modeller, daha sonra tanıma görevleri için kullanılabilmesi için öğrenmeniz gereken etiketli veriler sağlayarak eğitilir.

Model eğitimi , etiketlenmiş verilerinize göre modelinize ayıklanması gerekenleri öğretme işlemidir.
Model değerlendirmesi , modelinizin ne kadar iyi performans sergilediğini öğrenmek için eğitimden hemen sonra gerçekleşen işlemdir.
Dağıtım , modelinizi tahmin API'sinin kullanımına açmak için bir dağıtıma atama işlemidir.

Duyarlık

Modelinizin ne kadar hassas/doğru olduğunu ölçer. Doğru tanımlanmış pozitifler (gerçek pozitifler) ile tüm tanımlanan pozitifler arasındaki orandır. Duyarlık ölçümü, tahmin edilen sınıflardan kaçının doğru etiketlendiğini gösterir.

Project

Proje, verilerinize göre özel ML modellerinizi oluşturmaya yönelik bir çalışma alanıdır. Projenize yalnızca siz ve kullanılmakta olan Azure kaynağına erişimi olan diğer kişiler erişebilir. Özel varlık ayıklama projesi oluşturmanın önkoşulu olarak, yeni bir proje oluştururken kaynağınızı veri kümenizle bir depolama hesabına bağlamanız gerekir. Projeniz kapsayıcınızdaki tüm .txt dosyaları otomatik olarak içerir.

Projenizde aşağıdaki eylemleri gerçekleştirebilirsiniz:

Verilerinizi etiketleme: Modelinizi eğittiğinizde neleri ayıklamak istediğinizi öğrenmesi için verilerinizi etiketleme işlemi.
Modelinizi oluşturun ve eğitin: Modelinizin etiketlenmiş verilerinizden öğrenmeye başladığı projenizin temel adımı.
Model değerlendirme ayrıntılarını görüntüleme: Geliştirme için yer olup olmadığına veya sonuçlardan memnun olup olmadığınız konusunda karar vermek için model performansınızı gözden geçirin.
Dağıtım: Modelin performansını gözden geçirdikten ve ortamınızda kullanılabilmeye karar verdikten sonra, kullanmak için bir dağıtıma atamanız gerekir. Modeli bir dağıtıma atamak , tahmin API'sini kullanarak kullanılabilir hale getirir.
Modeli test etme: Modelinizi dağıtdıktan sonra üretimde nasıl performans göstereceğini görmek için dağıtımınızı Language Studio'da test edin.

Geri çağırma

Modelin gerçek pozitif sınıfları tahmin etme yeteneğini ölçer. Tahmin edilen gerçek pozitifler ile gerçekte etiketlenen değerler arasındaki orandır. Geri çağırma ölçümü, tahmin edilen sınıflardan kaçının doğru olduğunu gösterir.

Aracılığıyla paylaş