Özel adlandırılmış varlık tanıma için dil desteği
Özel adlandırılmış varlık tanıma özelliği tarafından desteklenen diller hakkında bilgi edinmek için bu makaleyi kullanın.
Çok dilli seçenek
Özel NER ile bir modeli bir dilde eğitebilir ve başka bir dildeki belgelerden varlıkları ayıklamak için kullanabilirsiniz. Bu özellik, zamandan ve çabadan tasarruf etmenizi sağladığından güçlüdür. Her dil için ayrı projeler oluşturmak yerine tek bir projede çok dilli veri kümesini işleyebilirsiniz. Veri kümenizin tamamen aynı dilde olması gerekmez, ancak proje ayarları oluştururken veya daha sonraki sürümlerde projeniz için çok dilli seçeneğini etkinleştirmeniz gerekir. Değerlendirme işlemi sırasında modelinizin belirli dillerde düşük performans sergilediğini fark ederseniz, eğitim kümenize bu dillerde daha fazla veri eklemeyi göz önünde bulundurun.
Projenizi tamamen İngilizce belgelerle eğitebilir ve şu şekilde sorgulayabilirsiniz: Fransızca, Almanca, Mandarin, Japonca, Korece ve diğerleri. Özel adlandırılmış varlık tanıma, modellerinizi eğitmek için çok dilli teknoloji kullanarak projelerinizi birden çok dile ölçeklendirmenizi kolaylaştırır.
Belirli bir dilin ve diğer dillerin çalışmadığını her tanımladığınızda, projenize bu dil için daha fazla belge ekleyebilirsiniz. Language Studio'daki veri etiketleme sayfasında, eklediğiniz belgenin dilini seçebilirsiniz. Modele bu dil için daha fazla belge eklediğinizde, söz diziminin daha fazlası tanıtılır ve daha iyi tahmin etmeyi öğrenir.
Her dil için aynı sayıda belge eklemeniz beklenmiyor. Projenizin çoğunluğunu tek bir dilde oluşturmanız ve yalnızca iyi performans göstermediğiniz dillerde birkaç belge eklemeniz gerekir. Öncelikli olarak İngilizce olan bir proje oluşturur ve bunu Fransızca, Almanca ve İspanyolca olarak test etmeye başlarsanız, Almancanın diğer iki dilin yanı sıra performans göstermediğini de gözlemleyebilirsiniz. Bu durumda, orijinal İngilizce belgelerinizin %5'ini Almanca olarak eklemeyi, yeni bir model eğitip tekrar Almanca test etmeyi düşünün. Almanca sorgular için daha iyi sonuçlar görmeniz gerekir. Ne kadar çok etiketli belge eklerseniz, sonuçların daha iyi olma olasılığı o kadar artar.
Başka bir dilde veri eklediğinizde, diğer dilleri olumsuz etkilemesini beklememelisiniz.
Dil desteği
Özel NER, aşağıdaki dillerde dosyaları destekler .txt
:
Dil | Dil kodu |
---|---|
Afrikaner | af |
Amharca | am |
Arapça | ar |
Assamca | as |
Azerice | az |
Beyaz Rusça | be |
Bulgarca | bg |
Bengali | bn |
Bretonca | br |
Boşnakça | bs |
Katalanca | ca |
Çekçe | cs |
Galce | cy |
Danca | da |
Almanca | de |
Yunanca | el |
English (US) | en-us |
Esperanto | eo |
İspanyolca | es |
Estonya Dili | et |
Baskça | eu |
Farsça | fa |
Fince | fi |
Fransızca | fr |
Batı Frizce | fy |
İrlandaca | ga |
İskoçça | gd |
Galiçya Dili | gl |
Gucerat dili | gu |
Hausa | ha |
İbranice | he |
Hintçe | hi |
Hırvatça | hr |
Macarca | hu |
Ermenice | hy |
Endonezce | id |
İtalyanca | it |
Japonca | ja |
Cava | jv |
Gürcüce | ka |
Kazakça | kk |
Khmer | km |
Kannada dili | kn |
Korece | ko |
Kürtçe (Kurmanji) | ku |
Kırgızca | ky |
Latince | la |
Lao | lo |
Litvanca | lt |
Letonca | lv |
Malgaşça | mg |
Makedonca | mk |
Malayalam dili | ml |
Moğolca | mn |
Marathi | mr |
Malayca | ms |
Birmanya | my |
Nepalce | ne |
Felemenkçe | nl |
Norveççe (Bokmal) | nb |
Odia | or |
Pencapça | pa |
Lehçe | pl |
Peştuca | ps |
Portekizce (Brezilya) | pt-br |
Portekizce (Portekiz) | pt-pt |
Rumence | ro |
Rusça | ru |
Sanskrit | sa |
Sindhi dili | sd |
Sinhala dili | si |
Slovakça | sk |
Slovence | sl |
Somali | so |
Arnavutça | sq |
Sırpça | sr |
Sundane dili | su |
İsveççe | sv |
Svahili dili | sw |
Tamil dili | ta |
Telugu dili | te |
Tayca | th |
Filipino | tl |
Türkçe | tr |
Uygurca | ug |
Ukraynaca | uk |
Urduca | ur |
Özbekçe | uz |
Vietnamca | vi |
Zosa dili | xh |
Yidiş | yi |
Basitleştirilmiş Çince | zh-hans |
Zulu dili | zu |