Consultar con búsqueda de texto completo
Se aplica a: SQL Server Azure SQL Database Azure SQL Managed Instance
Escriba consultas de texto completo mediante los predicados CONTAINS y FREETEXT y las funciones de conjunto de filas CONTAINSTABLE y FREETEXTTABLE con la instrucción SELECT. En este artículo se proporcionan ejemplos de cada predicado y función, para que le resulte más fácil elegir cuál le conviene más.
- Para hacer coincidir palabras y frases, use CONTAINS y CONTAINSTABLE.
- Para hacer coincidir el significado, aunque no con la redacción exacta, use FREETEXT y FREETEXTTABLE .
Ejemplos de cada predicado y función
En los siguientes ejemplos, se usa la base de datos de ejemplo AdventureWorks. Para obtener la versión final de AdventureWorks, vea AdventureWorks Databases and Scripts for SQL Server 2016 CTP3 (Bases de datos y scripts de AdventureWorks para SQL Server 2016 CTP3). Para ejecutar las consultas de ejemplo, también tendrá que configurar la búsqueda de texto completo. Para obtener más información, vea Introducción a la búsqueda de texto completo.
Ejemplo: CONTAINS
En este ejemplo, se buscan todos los productos con un precio de $80.99
que contengan la palabra "Mountain"
:
USE AdventureWorks2022
GO
SELECT Name, ListPrice
FROM Production.Product
WHERE ListPrice = 80.99
AND CONTAINS(Name, 'Mountain')
GO
Ejemplo: FREETEXT
En el siguiente ejemplo, se buscan todos los documentos que contengan palabras relacionadas con vital safety components
:
USE AdventureWorks2022
GO
SELECT Title
FROM Production.Document
WHERE FREETEXT (Document, 'vital safety components')
GO
Ejemplo: CONTAINSTABLE
En el ejemplo siguiente se devuelve el identificador de descripción y la descripción de todos los productos para los que la columna Description contiene la palabra "aluminum" cerca de la palabra "light" o la palabra "lightweight". Solo se devuelven las filas con un rango de 2 o superior.
USE AdventureWorks2022
GO
SELECT FT_TBL.ProductDescriptionID,
FT_TBL.Description,
KEY_TBL.RANK
FROM Production.ProductDescription AS FT_TBL INNER JOIN
CONTAINSTABLE (Production.ProductDescription,
Description,
'(light NEAR aluminum) OR
(lightweight NEAR aluminum)'
) AS KEY_TBL
ON FT_TBL.ProductDescriptionID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK > 2
ORDER BY KEY_TBL.RANK DESC;
GO
Ejemplo: FREETEXTTABLE
En el ejemplo siguiente se amplía una consulta FREETEXTTABLE para que devuelva primero las filas con clasificación superior y agregue la clasificación de cada fila a la lista de selección. Para escribir una consulta similar, debe saber que ProductDescriptionID es la columna de clave única de la tabla ProductDescription .
USE AdventureWorks2022
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Production.ProductDescription AS FT_TBL
INNER JOIN
FREETEXTTABLE(Production.ProductDescription, Description,
'perfect all-around bike') AS KEY_TBL
ON FT_TBL.ProductDescriptionID = KEY_TBL.[KEY]
ORDER BY KEY_TBL.RANK DESC
GO
A continuación se incluye una ampliación de la misma consulta en la que solo se devuelven las filas con un rango de 10 o superior:
USE AdventureWorks2022
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Production.ProductDescription AS FT_TBL
INNER JOIN
FREETEXTTABLE(Production.ProductDescription, Description,
'perfect all-around bike') AS KEY_TBL
ON FT_TBL.ProductDescriptionID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK >= 10
ORDER BY KEY_TBL.RANK DESC
GO
Coincidencia con palabras o con el significado
CONTAINS
/CONTAINSTABLE
y FREETEXT
/FREETEXTTABLE
resultan de utilidad para diferentes tipos de coincidencias. En la siguiente tabla, le proporcionamos datos para elegir el predicado o la función más indicados para la consulta:
CONTAINS/CONTAINSTABLE
- Coincidencia de palabras y frases individuales con coincidencias precisas o aproximadas (menos precisas).
- También puede hacer lo siguiente:
- Especificar la proximidad de las palabras que se encuentran a cierta distancia la una de la otra.
- Devolver coincidencias ponderadas.
- Combinar condiciones de búsqueda con operadores lógicos. Para más información, vea la sección Uso de operadores booleanos (AND, OR y NOT) más adelante en este artículo.
FREETEXT/FREETEXTTABLE
- Coincidencia de significado en lugar coincidencias literales con las palabras, frases u oraciones especificadas (la cadena freetext).
- Se generarán coincidencias si se encuentra algún término o las formas de algún término en el índice de texto completo de una columna especificada.
Comparación de predicados y funciones
Los predicados CONTAINS
/FREETEXT
y las funciones de conjunto de filas CONTAINSTABLE
/FREETEXTTABLE
tienen una sintaxis y opciones diferentes. En la siguiente tabla, le proporcionamos datos para elegir el predicado o la función más indicados para la consulta:
Predicados CONTAINS y FREETEXT
Uso Use los predicados de texto completo CONTAINS y FREETEXT en la cláusula WHERE o HAVING de una instrucción SELECT.
Resultados. Los predicados CONTAINS y FREETEXT devuelven un valor TRUE o FALSE que indica si una determinada fila coincide con la consulta de texto completo. Las filas que coinciden se devuelven en el conjunto de resultados.
Más opciones. Puede combinar los predicados con cualquiera de los otros predicados de Transact-SQL, como LIKE y BETWEEN.
Puede especificar una única columna, una lista de columnas o todas las columnas de la tabla que se vayan a buscar.
Opcionalmente, también puede especificar el lenguaje cuyos recursos se usan en la consulta de texto completo para la lematización y la separación de palabras, las consultas del diccionario de sinónimos y la eliminación de palabras irrelevantes.
Se puede usar un nombre de cuatro elementos en el predicado CONTAINS o FREETEXT para consultar columnas indexadas de texto completo de las tablas de destino en un servidor vinculado. Para preparar un servidor remoto para recibir consultas de texto completo, es necesario crear un índice de texto completo en las tablas y columnas de destino en el servidor remoto y, posteriormente, agregar el servidor remoto como un servidor vinculado.
Más información Para obtener más información sobre la sintaxis y los argumentos de estos predicados, vea CONTAINS y FREETEXT.
Funciones con valores de conjuntos de filas CONTAINSTABLE y FREETEXTTABLE
Uso Use las funciones de texto completo CONTAINSTABLE y FREETEXTTABLE a modo de nombre de nombre de tabla normal en la cláusula FROM de una instrucción SELECT.
Tiene que especificar la tabla base para la búsqueda al usar cualquiera de estas funciones. Al igual que en los predicados, puede especificar una única columna, una lista de columnas o todas las columnas de la tabla en la que se va a buscar y, de forma opcional, el lenguaje cuyos recursos se usan en la consulta de texto completo.
Normalmente, debe combinar los resultados de CONTAINSTABLE o FREETEXTTABLE con la tabla base. Para combinar las tablas, necesita conocer el nombre de la columna de clave única. Esta columna, que existe en todas las tablas habilitadas para texto completo, se usa para aplicar las filas únicas de la tabla (columna de clave**única). Para obtener más información sobre la columna de clave, vea Create and Manage Full-Text Indexes (Crear y administrar índices de texto completo).
Resultados. Estas funciones devuelven una tabla con ninguna, una o varias filas que coinciden con la consulta de texto completo. La tabla devuelta solo contiene las filas de la tabla base que coinciden con los criterios de selección especificados en la condición de búsqueda de texto completo de la función.
Las consultas que usan una de estas funciones también devuelven un valor de clasificación por relevancia (RANK) y una clave de texto completo (KEY) para cada fila devuelta, tal y como se muestra a continuación:
- Columna KEY La columna KEY devuelve valores únicos de las filas devueltas. La columna KEY se puede utilizar para especificar los criterios de selección.
- Columna RANK La columna RANK contiene un valor de clasificación para cada fila que indica el grado de coincidencia de la fila con los criterios de selección. Cuanto mayor sea el valor de clasificación del texto o documento de una fila, mayor importancia tendrá la fila en la consulta de texto completo especificada. Puede haber filas distintas con la misma clasificación. Puede limitar el número de coincidencias que se van a devolver con el parámetro opcional top_n_by_rank . Para obtener más información, vea Limitar los resultados de la búsqueda con RANK.
Más información Para obtener más información sobre la sintaxis y los argumentos de estos predicados, vea CONTAINSTABLE y FREETEXTTABLE.
Determinados tipos de búsquedas
Búsqueda de una palabra o frase específica (término simple)
Puede usar CONTAINS, CONTAINSTABLE, FREETEXT o FREETEXTTABLE para buscar una palabra o frase específica en una tabla. Por ejemplo, si quiere buscar en la tabla ProductReview de la base de datos AdventureWorks2022
todos los comentarios sobre un producto que contengan la frase "learning curve", puede usar el predicado CONTAINS del siguiente modo:
USE AdventureWorks2022
GO
SELECT Comments
FROM Production.ProductReview
WHERE CONTAINS(Comments, '"learning curve"')
GO
La condición de búsqueda, en este caso "learning curve", puede ser compleja y estar formada por uno o varios términos.
Más información sobre las búsquedas de términos simples
En la búsqueda de texto completo, una palabra (o token) es una cadena cuyos límites se identifican mediante los separadores de palabras adecuados, siguiendo las normas lingüísticas del idioma especificado. Una frase válida está formada por varias palabras con o sin signos de puntuación entre ellas.
Por ejemplo, "croissant" es una palabra y "café au lait" es una frase. Las palabras y frases como estas se denominan términos simples.
CONTAINS y CONTAINSTABLE buscan una coincidencia exacta para la frase. FREETEXT y FREETEXTTABLE dividen la frase en palabras independientes.
Búsqueda de una palabra con prefijo (término de prefijo)
Puede usar CONTAINS o CONTAINSTABLE para buscar palabras o frases con un prefijo especificado. Se devuelven todas las entradas de la columna que contenga el texto que comience por el prefijo especificado. Por ejemplo, para buscar todas las filas que contengan el prefijo top
-, como en top``ple
, top``ping
y top
. La consulta sería parecida al ejemplo siguiente:
USE AdventureWorks2022
GO
SELECT Description, ProductDescriptionID
FROM Production.ProductDescription
WHERE CONTAINS (Description, '"top*"' )
GO
Se devuelve todo el texto que coincida con el texto especificado antes del asterisco (*). Si no se delimitan el texto completo y el asterisco con comillas dobles, como en CONTAINS (DESCRIPTION, 'top*')
, en la búsqueda de texto completo no se considerará que el asterisco es un comodín.
Cuando el término prefijo es una frase, cada token de los que componen la frase se considera como un término prefijo separado. Se devuelven todas las filas que contienen palabras que empiezan con los términos prefijos. Por ejemplo, el término de prefijo "light bread*" buscará filas que contengan el texto "light breaded", "lightly breaded" o "light bread", pero no devolverá "lightly toasted bread".
Más información sobre las búsquedas de prefijo
Un término de prefijo hace referencia a una cadena que se anexa al principio de una palabra para generar una palabra derivada o una forma con inflexión.
Con un solo término de prefijo, cualquier palabra inicial con el término especificado formará parte del conjunto de resultados. Por ejemplo, el término "auto*" coincide con "automatic", "automobile", etc.
En una frase, cada palabra de la misma se considera un término de prefijo. Por ejemplo, el término "auto tran*" coincide con "transmisión automática" y "transductor de automóviles", pero no coincide con "transmisión automática del motor".
Las búsquedas de prefijos son compatibles con CONTAINS y CONTAINSTABLE.
Búsqueda de las formas con inflexión de una palabra específica (término de generación)
Puede usar CONTAINS, CONTAINSTABLE, FREETEXTo FREETEXTTABLE para buscar todos los tiempos y conjugaciones de un verbo o las formas tanto singular como plural de un nombre (búsqueda con inflexión). O bien, los sinónimos de una palabra especificada (búsqueda de diccionario de sinónimos).
En el siguiente ejemplo, se busca cualquier forma de "foot" ("foot", "feet", etc.) en la columna Comments
de la tabla ProductReview
de la base de datos AdventureWorks
:
USE AdventureWorks2022
GO
SELECT Comments, ReviewerName
FROM Production.ProductReview
WHERE CONTAINS (Comments, 'FORMSOF(INFLECTIONAL, "foot")')
GO
La búsqueda de texto completo usa lematizadores, que permiten buscar los distintos tiempos y conjugaciones de un verbo o las formas tanto singular como plural de un nombre. Para obtener más información sobre los lematizadores, vea Configurar y administrar separadores de palabras y lematizadores para la búsqueda.
Más información sobre la generación de términos de búsqueda
Las formas con inflexión son los distintos tiempos y conjugaciones de un verbo o las formas singular y plural de un nombre.
Por ejemplo, busque la forma inflectional de la palabra "drive". Si varias filas de la tabla incluyen las palabras "drive", "drives", "drove", "driving" y "driven", todo estaría en el conjunto de resultados porque cada uno de ellos se puede generar inflexiblemente a partir de la unidad de palabras.
FREETEXT y FREETEXTTABLE buscan términos con inflexión de todas las palabras especificadas de forma predeterminada. CONTAINS y CONTAINSTABLE admiten un argumento INFLECTIONAL
opcional.
Búsqueda de sinónimos de una palabra específica
Un diccionario de sinónimos define los sinónimos especificados por el usuario para los términos. Para obtener más información sobre los archivos de diccionario de sinónimos, vea Configurar y administrar archivos de sinónimos para búsquedas de texto completo.
Por ejemplo, si una entrada, "{car, automobile, truck, van}", se agrega a un diccionario de sinónimos, puede buscar la forma de diccionario de sinónimos de la palabra "coche". Todas las filas de la tabla consultadas que incluyen las palabras "automobile", "truck", "van" o "car", aparecen en el conjunto de resultados porque cada una de estas palabras pertenece al conjunto de expansión de sinónimos que contiene la palabra "car".
FREETEXT y FREETEXTTABLE usan el diccionario de sinónimos de forma predeterminada. CONTAINS y CONTAINSTABLE admiten un argumento THESAURUS
opcional.
Búsqueda de una palabra cerca de otra palabra
Un término de proximidad indica palabras o frases que están próximas entre sí. También puede especificar el número máximo de términos de no búsqueda que separan el primero y el último término de búsqueda. Además, puede buscar palabras o frases en cualquier orden o en el orden en el que las especifique.
Por ejemplo, quizá desee buscar las filas en las que la palabra "ice" esté relacionada con la palabra "hockey" o en las que la frase "ice skating" esté relacionadas con la frase "ice hockey".
Para obtener más información sobre las búsquedas por proximidad, vea Buscar palabras cerca de otra palabra con NEAR.
Búsqueda de palabras o frases mediante valores ponderados (término ponderado)
Puede usar CONTAINSTABLE para buscar palabras o frases, y especificar un valor de ponderación. La ponderación, medida como número comprendido entre 0,0 y 1,0, indica la importancia de cada palabra y frase en un conjunto de palabras y frases. Una ponderación de 0,0 es la más baja y una ponderación de 1,0, la más alta.
En el ejemplo siguiente se muestra una consulta que busca todas las direcciones del cliente, usando pesos, en los que cualquier texto que comience con la cadena "Bay" tenga "Street" o "View". Los resultados proporcionan una clasificación más alta a esas filas que contienen más de las palabras especificadas.
USE AdventureWorks2022
GO
SELECT AddressLine1, KEY_TBL.RANK
FROM Person.Address AS Address INNER JOIN
CONTAINSTABLE(Person.Address, AddressLine1, 'ISABOUT ("Bay*",
Street WEIGHT(0.9),
View WEIGHT(0.1)
) ' ) AS KEY_TBL
ON Address.AddressID = KEY_TBL.[KEY]
ORDER BY KEY_TBL.RANK DESC
GO
Se puede usar un término ponderado junto con cualquier término simple, de prefijo, de generación o de proximidad.
Más información sobre las búsquedas de términos ponderadas
En una búsqueda de términos ponderada, un valor ponderado indica el grado de importancia de cada palabra y frase dentro de un conjunto de palabras y frases. El valor 0,0 es el peso más pequeño disponible, y el valor 1,0 es el peso más grande.
Por ejemplo, en una consulta en la que se buscan varios términos, puede asignar a cada palabra de búsqueda un valor ponderado que indique su importancia en relación con otras palabras en la condición de búsqueda. Los resultados para este tipo de consulta devuelven las filas más relevantes primero, según la ponderación relativa que ha asignado a las palabras de búsqueda. Los conjuntos de resultados contienen documentos o filas con cualquiera de los términos especificados (o el contenido entre ellos); sin embargo, algunos resultados se consideran más importantes que otros debido a la variación en los valores ponderados asociados a los diferentes términos buscados.
CONTAINSTABLE admite búsquedas de términos ponderadas.
Uso de operadores booleanos (AND, OR y NOT)
El predicado CONTAINS y la función CONTAINSTABLE usan las mismas condiciones de búsqueda. Ambos admiten que se combinen varios términos de búsqueda con los operadores booleanos AND, OR y NOT para realizar operaciones lógicas. Puede usar AND, por ejemplo, para buscar filas que contengan "latte" y "bagel de estilo New York". Puede usar AND NOT, por ejemplo, para buscar las filas que contienen "bagel", pero no contienen "queso crema".
Por el contrario, FREETEXT y FREETEXTTABLE tratan los términos booleanos como las palabras que se van a buscar.
Para obtener información sobre cómo combinar CONTAINS con otros predicados que usan los operadores lógicos AND, OR y NOT, consulte Condición de búsqueda (Transact-SQL).
Ejemplo
En el ejemplo siguiente se usa el predicado CONTAINS para buscar descripciones en las que el identificador de descripción no es igual a 5 y la descripción contiene la palabra "Aluminio" y la palabra "husillo". La condición de búsqueda usa el operador booleano AND. En el siguiente ejemplo, se usa la tabla ProductDescription de la base de datos AdventureWorks2022
.
USE AdventureWorks2022
GO
SELECT Description
FROM Production.ProductDescription
WHERE ProductDescriptionID <> 5 AND
CONTAINS(Description, 'aluminum AND spindle')
GO
Caso, palabras irrelevantes, idioma y diccionario de sinónimos
Al escribir consultas de texto completo, también puede especificar las siguientes opciones:
Distinción de mayúsculas y minúsculas. Las consultas de búsqueda de texto completo no distinguen mayúsculas de minúsculas. Sin embargo, en japonés, hay muchas ortografías fonéticas en las que el concepto de normalización ortográfica implica no distinguir las mayúsculas de las minúsculas (por ejemplo, las letras kana no tienen mayúsculas y minúsculas). Este tipo de normalización ortográfica no se admite.
Palabras irrelevantes. Al definir una consulta de texto completo, el motor de texto completo descarta las palabras irrelevantes de los criterios de búsqueda. Las palabras irrelevantes son aquellas como "a", "and", "is" o "the", que suelen aparecer con frecuencia pero que normalmente no ayudan en la búsqueda de un texto determinado. Las palabras irrelevantes se muestran en una lista de palabras irrelevantes. Cada índice de texto completo está asociado a una lista de palabras irrelevantes concreta, que determina qué palabras irrelevantes se omiten de la consulta o del índice en el momento de la indización. Para obtener más información, vea Configurar y administrar palabras irrelevantes y listas de palabras irrelevantes para la búsqueda de texto completo.
El idioma, con la opción LANGUAGE. Muchos términos de consulta dependen en gran medida del comportamiento del separador de palabras. Para asegurarse de que usa el archivo del separador de palabras (y lematizador) y del diccionario de sinónimos correcto, se recomienda especificar la opción LANGUAGE. Para obtener más información, vea Elegir un idioma al crear un índice de texto completo.
Diccionario de sinónimos. Las consultas FREETEXT y FREETEXTTABLE usan de forma predeterminada el diccionario de sinónimos. CONTAINS y CONTAINSTABLE admiten un argumento THESAURUS opcional. Para obtener más información, vea Configurar y administrar archivos de sinónimos para búsquedas de texto completo.
Comprobación de los resultados de la tokenización
Después de aplicar una combinación determinada de separador de palabras, diccionario de sinónimos y lista de palabras irrelevantes a una consulta, puede ver los resultados de la tokenización de la búsqueda de texto completo mediante la vista de administración dinámica sys.dm_fts_parser. Para obtener más información, consulte sys.dm_fts_parser (Transact-SQL).
Consulte también
CONTAINS (Transact-SQL)
CONTAINSTABLE (Transact-SQL)
FREETEXT (Transact-SQL)
FREETEXTTABLE (Transact-SQL)
Crear consultas de búsqueda de texto completo (Visual Database Tools)
Mejorar el rendimiento de las consultas de texto completo