Füllwörter
Um zu verhindern, dass ein Volltextindex unnötig aufgebläht wird, verfügt Microsoft SQL Server über einen Mechanismus, der häufig vorkommende, für die Suche nutzlose Wörter ignoriert. Diese Wörter werden als Füllwörter bezeichnet (häufige Wörter, die ignoriert werden). Füllwörter sind in den gebietsschemaspezifischen Füllwortdateien aufgelistet. Beispielsweise sind im englischen Gebietsschema Wörter wie "a", "and", "is" und "the" in der Füllwortdatei für Englisch enthalten. Diese Wörter werden im Volltextindex ausgelassen, da sie erfahrungsgemäß keinen Beitrag zur Suche leisten. Die Position der Füllwörter wird jedoch im Volltextindex berücksichtigt. Als Beispiel sei der Ausdruck "Instructions are applicable to these Adventure Works Cycles models" angeführt. In der folgenden Tabelle sind die Positionen der Wörter im Ausdruck angegeben:
Wort oder Token | Position |
---|---|
Instructions |
1 |
are |
2 |
applicable |
3 |
to |
4 |
these |
5 |
Adventure |
6 |
Works |
7 |
Cycles |
8 |
models |
9 |
Die Füllwörter "are", "to" und "these" an den Positionen 2, 4 und 5 werden im Volltextindex ausgelassen. Die Positionsinformationen bleiben jedoch erhalten, sodass die Positionen der anderen Wörter im Ausdruck unverändert bleiben.
Die Füllwortdateien befinden sich im Verzeichnis $SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\. Dieses Verzeichnis wird erstellt, und die Füllwortdateien werden installiert, wenn Sie SQL Server mit der Volltextsuche einrichten. Füllwortdateien können bearbeitet werden. Beispielsweise könnten Systemadministratoren in Hightechunternehmen das Wort "Computer" in ihre Füllwortliste aufnehmen.
Wichtig: |
---|
Wenn Sie eine Füllwortdatei bearbeiten, müssen Sie die Volltextkataloge neu auffüllen, damit die Änderungen in Kraft treten. |
Die folgende Tabelle zeigt die Füllwortdateien mit den zugehörigen Sprachen.
Füllwortdatei | Sprache |
---|---|
Noisechs |
Chinesisch (vereinfacht) |
Noisecht |
Chinesisch (traditionell) |
Noisedan |
Dänisch |
Noisedeu |
Deutsch |
Noiseeng |
Englisch (Großbritannien) |
Noiseenu |
Englisch (USA) |
Noiseesn |
Spanisch |
Noisefra |
Französisch |
Noiseita |
Italienisch |
Noisejpn |
Japanisch |
Noisekor |
Koreanisch |
Noiseneu |
Sprachneutral |
Noisenld |
Niederländisch |
Noiseplk |
Polnisch |
Noiseptb |
Portugiesisch (Brasilien) |
Noisepts |
Portugiesisch (Portugal) |
Noiserus |
Russisch |
Noisesve |
Schwedisch |
Noisetha |
Thai |
Noisetrk |
Türkisch |
Siehe auch
Konzepte
Grundlegendes zur Volltextsuche