Aracılığıyla paylaş


Tam metin dilbilimsel bileşenleri yapılandırma

Içinde başlangıç SQL Server 2008, ingilizce, ispanyolca, Çince, Japonca, Arapça, Bengal dili ve Hintçe gibi yaklaşık 50 farklı dillerde tam metin aramayı destekler. Tam metin desteklenen dillerin tam listesi için bkz: sys.fulltext_languages (Transact-SQL). Her sütun, tam metin dizininde yer alan equates tam metin araması tarafından desteklenen bir dil için Microsoft Windows yerel ayar tanıtıcısını (LCID) ile ilişkilidir.Örneğin, A.B.D. ingilizce'ye LCID 1033'tür equates ve ingiltere ingilizce'ye LCID 2057 equates.Her biri için tam metin dilini, desteklenen SQL Server Dizin oluşturma ve bu dilde depolanan tam metin verileri sorgulanıyor destekleyen dilbilimsel bileşenlerini sağlar.

Dile özel bileşenler, bir sözcük ayırıcısı ve bir sözcük kökü ayırıcı içerir.Bir sözcük ayırıcısı sözcük sınırlar, belirli bir dil () bir sözlü kurallarına göre bulur.sözcük bölme).Her sözcük ayırıcısı fiilleri için aynı dili conjugates bir sözcük kökü ayırıcı ile ilişkilidir.Daha fazla bilgi için bkz:Sözcük ayırıcılarını ve sözcük köklerini.

Ayrıca, başlangıç SQL Server 2008, bir temel kümesi stopwords (etkisiz sözcükler olarak da bilinir) içeren bir sistem stoplist sağlanır. C stopword arama yardımcı olmaz ve tam metin sorguları tarafından yok sayılır bir sözcüktür.Örneğin, ingilizce yerel ayar ayar ayarları için "bir", "ve", "değil" ve "veya" gibi sözcükler stopwords kabul edilir.Genellikle, bir veya daha fazla eş anlamlılar dosyaları ve stoplists yapılandırmanız gerekir.Daha fazla bilgi için bkz:Stopwords ve Stoplists.

SQL Server Ayrıca, bir eş anlamlılar dosyası her tam metin dilin yanı sıra, bir genel eş anlamlılar dosyası yükler.Yüklü bir eş anlamlılar dosyaları aslında boştur ancak iş senaryosu veya belirli bir dil için eş anlamlı tanımlamak üzere düzenleyebilirsiniz.Tam metin verilerinizi uyarlanmış bir sözlük geliştirme tarafından etkin verilerin tam metin sorguları kapsamını genişletebilirsiniz.Daha fazla bilgi için bkz:Eş anlamlılar sözlüğü yapılandırma.

Bir belge içinde dizin oluşturma bir varbinary, varbinary(max), image, veya xml veri türü sütun fazladan işlem gerçekleştirmek için bir süzgeç gerektirir. Süzgeç belge türüne (.doc, .pdf, .xls, .xml ve benzeri) olmalıdır.Daha fazla bilgi için bkz:tam metin araması süzgeçleri.

Not

Word ayırıcılarını (ve sözcük köklerini) ve süzgeç süzgeç daemon ana bilgisayar işleminde (fdhost.exe) çalıştırın.Bu işlem hakkında daha fazla bilgi için bkz: tam metin araması mimarisi.