Compartir a través de


Aspectos básicos de la búsqueda de texto

En este tema se describen brevemente los componentes, procesos y términos asociados a la búsqueda de texto. La búsqueda de texto comparte muchos términos con Microsoft SQL Server, pero hay algunos términos, como "rastreo" y "testigo", que son exclusivos de la búsqueda de texto.

Terminología de la búsqueda de texto

A continuación se ofrece una lista de términos y componentes que debe conocer el usuario que utilice la búsqueda de texto.

Índice de texto

Almacena información acerca de palabras relevantes y su ubicación en una determinada columna. Esta información se utiliza para realizar rápidamente consultas de texto que busquen filas con palabras o combinaciones de palabras concretas. Para obtener más información, vea Índices de texto.

Catálogo de texto

Un catálogo de texto contiene cero o más índices de texto. Los catálogos de texto deben encontrarse en una unidad de disco local asociada a la instancia de SQL Server. Cada catálogo puede satisfacer las necesidades de indización de una o más tablas de una base de datos. Los catálogos de texto no pueden almacenarse en unidades extraíbles, disquetes ni unidades de red, excepto en el caso de que se adjunte una base de datos de sólo lectura que contenga un catálogo de texto.

Separador de palabras

En un idioma concreto, un separador de palabras acorta el texto en función de las reglas léxicas de dicho idioma. Para obtener más información, vea Separadores de palabras y lematizadores.

Testigo

Palabra o cadena de caracteres identificada por el separador de palabras.

Lematizador

En un idioma concreto, un lematizador genera formas con inflexión de una determinada palabra en función de las reglas de dicho idioma. Los lematizadores son específicos del idioma. Para obtener más información, vea Separadores de palabras y lematizadores.

Filtro

En un tipo de archivo especificado, por ejemplo .doc, los filtros extraen el texto de un archivo almacenado en una columna varbinary(max) o image. Para obtener más información, vea Filtros de búsqueda de texto.

Llenado o rastreo

Proceso de creación y mantenimiento de un índice de texto. Para obtener más información, vea Estructura de índices de texto.

Palabras irrelevantes

Palabras frecuentes que no ayudan en la búsqueda. Por ejemplo, en la configuración regional en inglés, las palabras como "a", "and", "is" y "the" se consideran palabras irrelevantes. Estas palabras se omiten para evitar inundar de palabras el índice de texto. Para obtener más información, vea Palabras irrelevantes.

[!NOTA] El entorno de clúster de conmutación por error de Microsoft Windows es totalmente compatible con la indización de texto.

Vea también

Conceptos

Introducción a la búsqueda de texto

Otros recursos

CREATE FULLTEXT INDEX (Transact-SQL)

Ayuda e información

Obtener ayuda sobre SQL Server 2005