Aspectos básicos de la búsqueda de texto
En este tema se describen brevemente los componentes, procesos y términos asociados a la búsqueda de texto. La búsqueda de texto comparte muchos términos con Microsoft SQL Server, pero hay algunos términos, como "rastreo" y "testigo", que son exclusivos de la búsqueda de texto.
Terminología de la búsqueda de texto
A continuación se ofrece una lista de términos y componentes que debe conocer el usuario que utilice la búsqueda de texto.
Índice de texto
Almacena información acerca de palabras relevantes y su ubicación en una determinada columna. Esta información se utiliza para realizar rápidamente consultas de texto que busquen filas con palabras o combinaciones de palabras concretas. Para obtener más información, vea Índices de texto.
Catálogo de texto
Un catálogo de texto contiene cero o más índices de texto. Los catálogos de texto deben encontrarse en una unidad de disco local asociada a la instancia de SQL Server. Cada catálogo puede satisfacer las necesidades de indización de una o más tablas de una base de datos. Los catálogos de texto no pueden almacenarse en unidades extraíbles, disquetes ni unidades de red, excepto en el caso de que se adjunte una base de datos de sólo lectura que contenga un catálogo de texto.
Separador de palabras
En un idioma concreto, un separador de palabras acorta el texto en función de las reglas léxicas de dicho idioma. Para obtener más información, vea Separadores de palabras y lematizadores.
Testigo
Palabra o cadena de caracteres identificada por el separador de palabras.
Lematizador
En un idioma concreto, un lematizador genera formas con inflexión de una determinada palabra en función de las reglas de dicho idioma. Los lematizadores son específicos del idioma. Para obtener más información, vea Separadores de palabras y lematizadores.
Filtro
En un tipo de archivo especificado, por ejemplo .doc, los filtros extraen el texto de un archivo almacenado en una columna varbinary(max) o image. Para obtener más información, vea Filtros de búsqueda de texto.
Llenado o rastreo
Proceso de creación y mantenimiento de un índice de texto. Para obtener más información, vea Estructura de índices de texto.
Palabras irrelevantes
Palabras frecuentes que no ayudan en la búsqueda. Por ejemplo, en la configuración regional en inglés, las palabras como "a", "and", "is" y "the" se consideran palabras irrelevantes. Estas palabras se omiten para evitar inundar de palabras el índice de texto. Para obtener más información, vea Palabras irrelevantes.
[!NOTA] El entorno de clúster de conmutación por error de Microsoft Windows es totalmente compatible con la indización de texto.
Vea también
Conceptos
Introducción a la búsqueda de texto
Otros recursos
CREATE FULLTEXT INDEX (Transact-SQL)