Özel Translator anahtar terimleri

Aşağıdaki tabloda , Özel Çeviri aracıyla çalışırken bulabileceğiniz önemli terimlerin listesi yer alır.

Word veya Tümcecik Tanım
Kaynak Dil Kaynak dil, başka bir dile ("hedef") dönüştürmek istediğiniz başlangıç dilidir.
Hedef Dil Hedef dil, makine çevirisinin kaynak dili aldıktan sonra sağlamasını istediğiniz dildir.
Tek Dilli Dosya Tek dilli dosya, farklı bir dilde başka bir dosyayla eşleştirilmemiş tek bir dile sahiptir.
Paralel Dosyalar Paralel dosya, karşılık gelen metin içeren iki dosyanın birleşimidir. Bir dosya kaynak dile sahiptir. Diğeri hedef dile sahiptir.
Tümce Hizalama Paralel veri kümesi, her iki dilde de aynı metni temsil eden cümlelere hizalanmış cümlelere sahip olmalıdır. Örneğin, bir kaynak paralel dosyada ilk cümlenin teoride hedef paralel dosyadaki ilk cümleyle eşlenmesi gerekir.
Hizalanmış Metin Dosya doğrulamanın en önemli adımlarından biri, tümceleri paralel belgelere hizalamaktır. Her şey farklı dillerde farklı şekilde ifade edilir. Ayrıca farklı diller farklı sözcük sıralarına sahiptir. Bu adım, tümceleri eğitim için kullanılabilmesi için aynı içerikle hizalama işini yapar. Düşük cümle hizalaması, dosyalardan birinde veya her ikisinde bir sorun olabileceğini gösterir.
Word Kırılıyor/ Bölünemez Word kesme, sözcükler arasındaki sınırları işaretleme işlevidir. Birçok yazma sistemi, sözcükler arasındaki sınırı belirtmek için bir boşluk kullanır. Word bölünemez, önceki adımda sözcükler arasına eklenmiş olabilecek görünür işaretçilerin kaldırılmasını ifade eder.
Sınırlayıcı Sınırlayıcılar, bir cümlenin segmentlere bölünmesinin veya cümleler arasındaki kenar boşluğunun sınırlandırılmış olmasıdır. Örneğin, İngilizce boşluklarda sözcükleri, iki nokta üst üste ve noktalı virgülle sınırlandırma yan tümceleri ve noktalı virgüller cümleleri sınırlar.
Eğitim Dosyaları Eğitim dosyası, makine çevirisi sistemine bir dilden (kaynak) hedef dile (hedef) nasıl eşleme yapılacağını öğretmek için kullanılır. Ne kadar çok veri sağlarsanız, sistem o kadar iyi performans gösterir.
Dosyaları Ayarlama Bu dosyalar genellikle eğitim kümesinden rastgele türetilir (bir ayarlama kümesi seçmezseniz). Cümleler otomatik olarak seçilir ve sistemi ayarlamak ve düzgün çalıştığından emin olmak için kullanılır. Genel amaçlı bir çeviri modeli oluşturmak ve kendi ayarlama dosyalarınızı oluşturmak istiyorsanız, bunların etki alanları arasında rastgele bir cümle kümesi olduğundan emin olun
Dosyaları Test Etme Bu dosyalar genellikle eğitim kümesinden rastgele seçilen türetilmiş dosyalardır (herhangi bir test kümesi seçmezseniz). Bu cümlelerin amacı, çeviri modelinin doğruluğunu değerlendirmektir. Sistemin bu cümleleri doğru çevirdiğinden emin olmak için bir test kümesi oluşturup çeviriciye yüklemek isteyebilirsiniz. Bunun yapılması, cümlelerin sistemin değerlendirmesinde (BLEU puanının oluşturulması) kullanılmasını sağlar.
Birleşik dosya Kaynak ve çevrilmiş cümlelerin aynı dosyada yer aldığı dosya türü. Desteklenen dosya biçimleri (TMX, XLIFF, XLF, ICI ve XLSX).
Arşiv dosyası Diğer dosyaları içeren bir dosya. Desteklenen dosya biçimleri (zip, gz, tgz).
BLEU Puanı BLEU , çeviri modelinin "duyarlığını" veya doğruluğunu değerlendirmek için endüstri standardı bir yöntemdir. Başka değerlendirme yöntemleri de olsa, Microsoft Translator doğruluğu Proje Sahiplerine bildirmek için BLEU yöntemini kullanır.