Share via


Sözlük nedir?

Sözlük, tümceciklerin veya cümlelerin listesini ve karşılık gelen çevirilerini belirten hizalanmış bir belge çiftidir. Çeviri kaynak tümceciği veya cümlenin herhangi bir örneğini sözlükte sağladığınız çeviriyi kullanarak çevirmesini istediğinizde, eğitiminizde bir sözlük kullanın. Sözlükler bazen sözlükler veya terim tabanları olarak adlandırılır. Sözlüğü, listelediğiniz tüm terimler için deneme yanılma "kopyalama ve değiştirme" olarak düşünebilirsiniz. Ayrıca Microsoft Özel Çeviri hizmeti, çeviri kalitesini artırmak için kendi genel amaçlı sözlüklerini oluşturur ve kullanır. Ancak müşteri tarafından sağlanan bir sözlük önceliklidir ve önce sözcükleri veya cümleleri aramak için aranır.

Sözlükler yalnızca arkalarında tam olarak desteklenen bir Microsoft genel sinir ağı modeli olan dil çiftlerindeki projelerde çalışır. Dillerin tam listesini görüntüleyin.

Tümcecik sözlüğü

Tümcecik sözlüğü büyük/küçük harfe duyarlıdır. Bu tam bir bulma ve değiştirme işlemidir. Modelinizi eğitirken bir tümcecik sözlüğü eklediğinizde, listelenen tüm sözcükler veya tümcecikler belirtilen şekilde çevrilir. Cümlenin geri kalanı her zamanki gibi çevrilir. Kaynak ve hedef dosyalarda aynı çevrilmemiş tümceciği sağlayarak çevrilmemesi gereken tümcecikleri belirtmek için tümcecik sözlüğü kullanabilirsiniz.

Dinamik sözlük

Dinamik sözlük özelliği, çevirileri belirli terimler veya tümcecikler için özelleştirmenizi sağlar. Benzersiz bağlamınız, diliniz veya belirli gereksinimleriniz için özel çeviriler tanımlarsınız.

Nöral tümcecik sözlüğü

Sinir tümceciği sözlüğü, dinamik sözlüğümüzü ve standart tümcecik sözlüğü özelliklerimizi genişletir. Dinamik ve tümcecik sözlükleri, belirli terimler veya tümcecikler için kendi çevirilerinizi sağlayarak çeviri çıkışını özelleştirmenizi sağlar. Sinir tümceciği sözlüğü Özel Çeviri kullanılarak etkinleştirilirken dinamik sözlük özelliği Çeviri API'siyle birlikte kullanılır. Nöral tümcecik sözlüğü, makine çevirisi modelinin hem terimi hem de bağlamı ayarlamasına izin vererek bir veya daha fazla terim çevirisi içeren cümleler için çeviri kalitesini artırır. Bu ayar daha akıcı çeviriler üretir. Aynı zamanda, yüksek vadeli çeviri doğruluğunu korur.

Tümce sözlüğü

Tümce sözlüğü büyük/küçük harfe duyarlı değildir. Cümle sözlüğü, kaynak tümce için tam bir hedef çeviri belirtmenize olanak tanır. Tümce sözlüğü eşleşmesinin gerçekleşmesi için, gönderilen tümcenin tamamı kaynak sözlük girdisi ile eşleşmelidir. Eşleşme sırasında noktalama işaretleri ile biten bir kaynak sözlük girdisi yoksayılır. Tümcenin yalnızca bir bölümü eşleşiyorsa, giriş eşleşmez. Eşleşme algılandığında, cümle sözlüğü hedef girişi döndürülür.

Yalnızca sözlük eğitimleri

Modeli yalnızca sözlük verilerini kullanarak eğitebilirsiniz. Bunu yapmak için, yalnızca eklemek istediğiniz sözlük belgesini (veya birden çok sözlük belgesini) seçin ve Model oluştur'u seçin. Bu eğitim yalnızca sözlük olduğundan, en az sayıda eğitim cümlesi gerekmez. Modeliniz genellikle standart bir eğitimden daha hızlı bir şekilde eğitimi tamamlar. Sonuçta elde edilen modeller, eklediğiniz sözlüklerin eklenmesiyle çeviri için Microsoft temel modellerini kullanır. Test raporu almazsınız.

Dekont

Özel Çeviri tümceler sözlük dosyalarını hizalamaz, bu nedenle sözlük belgelerinizde eşit sayıda kaynak ve hedef tümcecik/cümle olması ve bunların tam olarak hizalanmış olması önemlidir.

Öneriler

  • Sözlükler, eğitim verilerini kullanarak modeli eğitme yerine geçmez. Daha iyi sonuçlar elde etmek için sistemin eğitim verilerinizden öğrenmesine izin vermenizi öneririz. Bununla birlikte, cümlelerin veya bileşik isimlerin tam olarak çevrilmesi gerektiğinde, tümcecik sözlüğü kullanın.

  • Tümcecik sözlüğü tedbirli kullanılmalıdır. Tümce içindeki bir tümcecik değiştirildiğinde, bu cümlenin bağlamı kaybolur veya tümcenin geri kalanını çevirmek için sınırlıdır. Sonuç olarak, cümle içindeki tümcecik veya sözcük sağlanan sözlüğe göre çevrilirken, cümlenin genel çeviri kalitesi genellikle zarar görür.

  • Tümcecik sözlüğü, ürün adları ("Microsoft SQL Server"), düzgün adlar ("Hamburg Şehri") veya ürün özellikleri ("özet tablo") gibi bileşik adlar için iyi çalışır. Bu sözcükler genellikle kaynak veya hedef dil içinde yüksek oranda bağlamsal olduğundan fiiller veya sıfatlar için de çalışmaz. En iyi yöntem, bileşik adlar dışında herhangi bir şey için tümcecik sözlüğü girişlerinden kaçınmaktır.

  • Tümcecik sözlüğü kullanıyorsanız büyük harf kullanımı ve noktalama işaretleri önemlidir. Sözlük girdileri büyük/küçük harfe ve noktalama işaretlerine duyarlıdır. Özel Çeviri yalnızca giriş tümcesindeki sözcüklerle ve tümceciklerle eşleşir ve kaynak sözlük dosyasında belirtildiği gibi tam olarak aynı büyük harf ve noktalama işaretlerini kullanır. Ayrıca çeviriler, hedef sözlük dosyasında sağlanan büyük/küçük harf kullanımını ve noktalama işaretlerini yansıtır.

    Örnek

    • Tümcecik sözlüğü kullanan İngilizceden İspanyolcaya bir sistem eğitiyorsanız ve kaynak dosyada SQL server ve hedef dosyada Microsoft SQL Server belirtirsiniz. SQL server tümceciği içeren bir tümcenin çevirisini istediğinizde, Özel Çeviri sözlük girdisiyle ve Microsoft SQL Server içeren çeviriyle eşleşir.
    • Aynı tümceciği içeren ancak sql server, sql Server veya SQL Server gibi kaynak dosyanızdakiyle eşleşmeyen bir tümcenin çevirisini istediğinizde, sözlüğünüzden eşleşme döndürmez.
    • Çeviri, tümcecik sözlüğünüzde belirtilen hedef dilin kurallarına uyar.
  • Sinir tümceciği sözlüğü hakkında daha fazla bilgi için bkz. sinir sözlüğü kılavuzu ve önerileri.

  • Tümce sözlüğü kullanıyorsanız, tümce sonu noktalama işaretleri yoksayılır.

    Örnek

    • Kaynak sözlüğünüzde "Bu tümce noktalama işaretiyle sona eriyor!" ifadesi varsa, "Bu tümce noktalama işaretiyle biter" ifadesini içeren tüm çeviri istekleri eşleşir.
  • Sözlüğünüz benzersiz kaynak satırları içermelidir. Sözlük dosyasında bir kaynak satır (sözcük, tümcecik veya tümce) birden çok kez görünüyorsa, sistem her zaman sağlanan son girişi kullanır ve eşleşme bulunduğunda hedefi döndürür.

  • Kaynak sözlük dosyasına yalnızca sayılardan oluşan veya kısaltmalar gibi iki veya üç harfli sözcüklerden oluşan tümcecikler eklemekten kaçının.

Sonraki adımlar