Aracılığıyla paylaş


Sözcük ayırıcılarını ve sözcük köklerini

Word ayırıcılarını ve sözcük köklerini tüm tam metin dizinlenmiş veriler dil çözümlemesi gerçekleştirin.Dil çözümleme içerir (sözcük bölme) sözcük sınırlarının bulma ve fiiller (dallanma) conjugating.Word'ün ayırıcılarını ve sözcük köklerini dile olan ve farklı diller için dil çözümleme kurallarını farklıdır.Belirli bir dil için birSözcük bölücü sözcük sınırlarının dil. sözlü kurallarına göre mevcut olduğu belirlenerek tek tek sözcükleri tanımlar. Her sözcüğün (olarak da bilinen bir simge), boyutu. azaltmak için sıkıştırılmış gösterimi kullanarak tam metin dizini eklenir The stemmer generates inflectional forms of a particular word based on the rules of that language (for example, "running", "ran", and "runner" are various forms of the word "run").

Dile özgü sözcük ayırıcılar kullanarak, bu dil için daha kesin olarak ortaya çıkan koşullarını sağlar.Bir sözcük ayırıcı dil ailesi için ancak belirli sub-language yok olduğunda, ana dili kullanılır.Örneğin, Fransızca sözcük ayırıcı, Kanada Fransızca metni işlemek için kullanılır.Belirli bir dil için kullanılabilir hiçbir sözcük ayırıcısı, nötr sözcük ayırıcısı kullanılır.Nötr sözcük ayırıcı ile bağımsız bir karakter boşluk ve noktalama işaretleri gibi hatalı sözcüklerdir.

Word'ün ayırma kayıt

Bir dil için sözcük ayırıcılarını için bunlar kayıtlı olması gerekir.Dil kaynakları için kayıtlı sözcük ayırıcılarını, ilişkili; sözcük köklerini, gürültü sözcükleri (stopwords) ve eş anlamlılar dosyaları; ayrıca tüm dizin oluşturma ve sorgulama işlemleri metin için kullanılabilir.Dilleri, sözcük ayırıcılarını şu anda ile kayıtlı bir listesini görüntülemek içinSQL Serveraşağıdakini kullanınTransact-SQLdeyim:

SELECT * FROM sys.fulltext_languages

Ekler, kaldırır veya bir sözcük ayırıcı Değiştir, tüm dizin oluşturma ve sorgulama metin için desteklenen Microsoft Office 2010 Suite Windows yerel ayar ayar tanımlayıcı (LCID) listesini yenilemek gerekir.Daha fazla bilgi için bkz:Nasıl Yapılır: Kayıtlı bir sözcük ayırıcılarını ve filtreleri (Transact-SQL) listesini değiştirme.

Birden fazla lisanslı üçüncü taraf sözcük ayırıcılarını sevk ileSQL Server 2008.(Danimarkaca, Lehçe ve Türkçe) birden çok dil için ek üçüncü taraf sözcük ayırıcıları (ve sözcük köklerini) el ile yükleyebilirsiniz.Daha fazla bilgi için bkz:Nasıl Yapılır: Lisanslı bir üçüncü taraf sözcük ayırıcılarını yüklenemedi..

Tam metin dil seçenekleri

Yerelleştirilmiş sürüm içinSQL Server,SQL ServerKurulum ayarlarvarsayılan tam metin dili Dil seçeneği uygun bir eşleşme varsa, sunucunun. For a non-localized version of SQL Server, the default full-text language option is English.

Oluşturma veya değiştirme tam metin dizini, tam metin dizinlenmiş her sütun için farklı bir dil belirtebilirsiniz.Herhangi bir dil belirtilen bir sütun için varsayılan yapılandırma seçeneği değeridefault full-text language.

Daha fazla bilgi için bkz:Varsayılan seçenek tam metin dili.

Not

Sorguda LANGUAGE seçeneği belirtilmediği sürece, bir tek tam metin sorgusu işlev yan tümcesinde listelenen tüm sütunlar aynı dili kullanmanız gerekir.tam metin sorgusu koşullarına bağımsız değişkenler üzerinde gerçekleştirilen dil çözümleme sorgulanan tam metin dizinlenmiş sütun için kullanılan dili belirler ( CONTAINS ve FREETEXT ) ve ( CONTAINSTABLE ve FREETEXTTABLE ).

Full-Text, sütun dizin bir dil seçme

Tam metin dizini oluştururken, bir dil dizini oluşturulmuş her sütun için belirttiğiniz öneririz.Bir dil için bir sütun belirtilmezse, sistem varsayılan dil kullanılır.Hangi sözcük ayırıcısı ve sözcük kökü ayırıcı sütun dizinleme için kullanılan sütun dilini belirler.Ayrıca, bu dilin eş anlamlılar dosyası sütununda tam metin sorgular tarafından kullanılır.

Birkaç sütun dili için tam metin dizini oluşturma seçerken göz önünde bulundurulması gereken noktalar vardır.Nasıl metin tokenized için bu noktalar arasında ilişki ve Full-Text altyapısı tarafından daha sonra dizin.Daha fazla bilgi için bkz:Bir tam metin dizini oluşturma, bir dil seçme ile ilgili en iyi yöntemler.

sütun sözcük ayırıcısı dili görüntülemek için

SQL Server 2008'de yeni sözcük ayırıcılarını etkisi

SQL Server 200850'den fazla farklı diller, biri 23 da var için sözcük ayırıcılarını içerirSQL Server 2005.Yalnızca İngilizce, Korece, Tay dili ve Çince (tüm formlar) için sözcük ayırıcılarını aynı kalır.Diğer diller içinSQL Server 2008sözcük ayırıcılarını daha iyi dile ait kuralları vardır ve daha önceki sözcük ayırıcılarını. kesin yeni nesil tanıtır.Büyük olasılıkla, yeni sözcük ayırıcılarını sözcük ayırıcılarını'den biraz farklı davranır alındıSQL Server 2005tam metin dizinleri.Bu önemlidir, bir tam metin kataloğu, alınan birSQL Server 2005Veritabanı YükseltmeSQL Server 2008.Tam metin kataloğunda tam metin dizinleri tarafından kullanılan bir veya birkaç dilde şimdi yeni sözcük ayırıcılarını ile ilişkili olabilir.Daha fazla bilgi için bkz:tam metin araması yükseltme.

Ayırma sürümleri SQL Server 2005'te desteklenen dilleri için word

Yalnızca İngilizce, Korece, Tay dili ve Çince (tüm formlar) için sözcük ayırıcılarını aynı kalır.Aşağıdaki tablo, varolan sözcük ayırıcılarını listelerSQL Server 2005olup olmadığını, güncelleştirilmiş olarak gösterirSQL Server 2008.Tüm tam listesi içinSQL Server 2008sözcük ayırıcılarını, bkz:sys.fulltext_languages (Transact-SQL).

Not

Çoğu dil için sözcük ayırıcılarını varsayılan olarak kaydedilir.Ancak, çok sayıda lisanslı üçüncü taraf sözcük ayırıcılarını varsayılan olarak devre dışıdır.Bu sözcük ayırıcılarını kaydettirmek bu dilleri ve hakkında bilgi için bkz:Nasıl Yapılır: Lisanslı bir üçüncü taraf sözcük ayırıcılarını yüklenemedi..

Dil

LCID

Word'ün ayırıcıları

Brezilya dili

1046

Yeni

Çince (Hong Kong SAR, PRC)

3076

Aynı

Çince (Macau ÖİB)

5124

Aynı

Çince (Singapur)

4100

Aynı

Danca (varsayılan olarak devre dışı)

1030

Aynı

Felemenkçe

1043

Yeni

İngilizce

1033

Aynı

İngilizce (İngiltere)

2057

Aynı

Fransızca

1036

Yeni

Almanca

1031

Yeni

İtalyanca

1040

Yeni

Japanese

1041

Yeni

Kore Dili

1042

Aynı

Bağımsız

0

Yeni

Lehçe (varsayılan olarak devre dışı)

1045

Aynı

Portekizce

2070

Yeni

Rusça

1049

Yeni

Basitleştirilmiş Çince

2052

Aynı

İspanyolca

3082

Yeni

İsveççe

1053

Yeni

Thai

1054

Aynı

Geleneksel Çince

1028

Aynı

Türkçe (varsayılan olarak devre dışı)

1055

Aynı

Desteklenen diller, tam listesi için bkz:sys.fulltext_languages (Transact-SQL).

Word satır sonu çubuğu saat aşımı hataları

Bir sözcük sonu saat aşımı hatası, çeşitli durumlarda ortaya çıkabilir.Bu gibi durumlarda ve her durumda, yanıt hakkında bilgi için bkz:MSSQLSERVER_30053.

Sözcük ayırıcılarını hakkında bilgi edinme

Bir Word ayırma, sözlük ve Stoplist birleşik belirteçlere ayırma sonuçlarını görüntüleme

Kayıtlı sözcük ayırıcılarını hakkında bilgi

Değişiklik Geçmişi

Güncelleştirilmiş içerik

Updated "Word ayırma kayıt" bölümündeki.