Mots non significatifs
Pour éviter l'encombrement de l'index de texte intégral, Microsoft SQL Server dispose d'un mécanisme qui ignore la répétition des mots courants inutiles pour la recherche. Ces mots sont appelés mots non significatifs ou mots exclus. Les mots non significatifs sont répertoriés dans des fichiers de mots non significatifs selon les paramètres régionaux. Par exemple, en français, les mots tels que « un », « et », « est » ou « le » sont répertoriés dans le fichier des mots non significatifs français ; ils sont écartés de l'index de texte intégral, car ils sont à l'évidence inutiles dans le cadre d'une recherche. En revanche, l'index de texte intégral prend en compte la position des mots non significatifs. Prenons l'exemple de l'expression suivante : « Instructions are applicable to these Adventure Works Cycles models ». Le tableau suivant décrit la position des mots dans l'expression :
Mot ou jeton | Position |
---|---|
Instructions |
1 |
are |
2 |
applicable |
3 |
to |
4 |
these |
5 |
Adventure |
6 |
Works |
7 |
Cycles |
8 |
models |
9 |
Les mots non significatifs « are », « to » et « these » situés aux positions 2, 4 et 5 sont écartés de l'index de texte intégral. Cependant, les informations relatives à leur position sont conservées, sans affecter la position des autres mots de l'expression.
Les fichiers de mots non significatifs sont situés dans le répertoire $Chemin_Installation_SQL_Server\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\. Une fois le répertoire créé, les fichiers de mots non significatifs sont installés lorsque vous configurez SQL Server pour la prise en charge de la recherche de texte intégral. Il est possible de modifier les fichiers de mots non significatifs ; par conséquent, les administrateurs système de sociétés informatiques peuvent par exemple ajouter le mot « ordinateur » à leur liste de mots non significatifs.
Important : |
---|
Si vous modifiez un fichier de mots non significatifs, vous devez remplir de nouveau les catalogues de texte intégral afin que les modifications soient prises en compte. |
Le tableau suivant répertorie les fichiers de mots vides et leurs langues respectives.
Fichier de mots vides | Langue |
---|---|
Noisechs |
Chinois simplifié |
Noisecht |
Chinois traditionnel |
Noisedan |
Danois |
Noisedeu |
Allemand |
Noiseeng |
Anglais UK |
Noiseenu |
Anglais US |
Noiseesn |
Espagnol |
Noisefra |
Français |
Noiseita |
Italien |
Noisejpn |
Japonais |
Noisekor |
Coréen |
Noiseneu |
Langue neutre |
Noisenld |
Néerlandais |
Noiseplk |
Polonais |
Noiseptb |
Portugais (Brésil) |
Noisepts |
Portugais (Portugal) |
Noiserus |
Russe |
Noisesve |
Suédois |
Noisetha |
Thaï |
Noisetrk |
Turc |
Voir aussi
Concepts
Principes de base de la recherche de texte intégral