Sintaxis de $filter de OData en Azure AI Search

En Azure AI Search, el parámetro $filter especifica criterios de inclusión o exclusión para devolver coincidencias en los resultados de búsqueda. En este artículo se describe la sintaxis de OData de $filter y se proporcionan ejemplos.

La construcción y las constantes de las rutas de acceso de campo se describen en Introducción a $filter, $orderby y $select del lenguaje OData en Azure AI Search. Para obtener más información sobre los escenarios de los filtros, consulte el artículo Filtros de Azure AI Search.

Sintaxis

En el lenguaje OData, un filtro es una expresión booleana, que a su vez puede ser uno de los distintos tipos de expresión, como se muestra en la siguiente EBNF (forma de Backus-Naur extendida):

boolean_expression ::=
    collection_filter_expression
    | logical_expression
    | comparison_expression
    | boolean_literal
    | boolean_function_call
    | '(' boolean_expression ')'
    | variable

/* This can be a range variable in the case of a lambda, or a field path. */
variable ::= identifier | field_path

También está disponible un diagrama de sintaxis interactivo:

Nota:

Consulte Referencia de sintaxis de expresiones OData para Azure AI Search para obtener la EBNF completa.

Los tipos de expresiones booleanas incluyen los siguientes:

  • Expresiones de filtro de colección con any o all. Aplican criterios de filtro a campos de colección. Para obtener más información, vea Operadores de colección de OData en Azure AI Search.
  • Expresiones lógicas que combinan otras expresiones booleanas mediante los operadores and, or y not. Para obtener más información, vea Operadores lógicos de OData en Azure AI Search.
  • Expresiones de comparación, que comparan campos o variables de rango con valores constantes mediante los operadores eq, ne, gt, lt, ge y le. Para obtener más información, vea Operadores de comparación de OData en Azure AI Search. Las expresiones de comparación también se usan para comparar distancias entre coordenadas geoespaciales mediante la función geo.distance. Para obtener más información, vea Funciones geoespaciales de OData en Azure AI Search.
  • Los literales booleanos true y false. En ocasiones, estas constantes pueden ser útiles al generar filtros mediante programación, pero en la práctica no se suelen usar en otros casos.
  • Llamadas a funciones booleanas, incluidas las siguientes:
  • Rutas de acceso de campo o variables de rango de tipo Edm.Boolean. Por ejemplo, si el índice tiene un campo booleano denominado IsEnabled y quiere devolver todos los documentos en los que este campo es true, la expresión de filtro puede ser simplemente el nombre IsEnabled.
  • Expresiones booleanas entre paréntesis. El uso de paréntesis puede ayudar a determinar de forma explícita el orden de las operaciones en un filtro. Para más información sobre la prioridad predeterminada de los operadores de OData, vea la sección siguiente.

Precedencia de operadores en filtros

Si escribe una expresión de filtro sin paréntesis alrededor de sus subexpresiones, Azure AI Search la evaluará según un conjunto de reglas de precedencia de operadores. Estas reglas se basan en qué operadores se usan para combinar las subexpresiones. En la tabla siguiente se enumeran los grupos de operadores en orden de mayor a menor prioridad:

Group (Grupo) Operadores
Operadores lógicos not
Operadores de comparación eq, ne, gt, lt, ge, le
Operadores lógicos and
Operadores lógicos or

Un operador situado en una posición superior en la tabla anterior se "enlazará más estrechamente" a sus operandos que otros operadores. Por ejemplo, and tiene mayor prioridad que or, y los operadores de comparación tienen una prioridad más alta que cualquiera de ellos, por lo que las dos expresiones siguientes son equivalentes:

    Rating gt 0 and Rating lt 3 or Rating gt 7 and Rating lt 10
    ((Rating gt 0) and (Rating lt 3)) or ((Rating gt 7) and (Rating lt 10))

El operador not tiene la prioridad más alta de todos, incluso superior a la de los operadores de comparación. Por ese motivo, si se intenta escribir un filtro similar al siguiente:

    not Rating gt 5

Obtendrá este mensaje de error:

    Invalid expression: A unary operator with an incompatible type was detected. Found operand type 'Edm.Int32' for operator kind 'Not'.

Este error se produce porque el operador solo está asociado con el campo Rating, que es de tipo Edm.Int32, y no con la expresión de comparación completa. La solución consiste en colocar el operando de not entre paréntesis:

    not (Rating gt 5)

Limitaciones del tamaño del filtro

Hay límites de tamaño y complejidad para las expresiones de filtro que puede enviar a Azure AI Search. A grandes rasgos, los límites se basan en el número de cláusulas en su expresión de filtro. Como regla general, si tiene cientos de cláusulas, corre el riesgo de superar el límite. Es recomendable diseñar la aplicación de manera que no genere filtros de tamaño sin enlazar.

Sugerencia

El uso de la función search.in en lugar de disyunciones largas de comparaciones de igualdad puede ayudar a evitar el límite de la cláusula de filtro, ya que una llamada de función se considera una sola cláusula.

Ejemplos

Buscar todos los hoteles con al menos una habitación con una tarifa base inferior a 200 USD que tengan una valoración de 4 o superior:

    $filter=Rooms/any(room: room/BaseRate lt 200.0) and Rating ge 4

Buscar todos los hoteles que no sean "Sea View Motel" que se hayan reformado desde 2010:

    $filter=HotelName ne 'Sea View Motel' and LastRenovationDate ge 2010-01-01T00:00:00Z

Buscar todos los hoteles que se hayan reformado en 2010 o después. El literal de fecha y hora incluye información de zona horaria para la Hora estándar del Pacífico:

    $filter=LastRenovationDate ge 2010-01-01T00:00:00-08:00

Buscar todos los hoteles que tengan aparcamiento y no permitan fumar en ninguna habitación:

    $filter=ParkingIncluded and Rooms/all(room: not room/SmokingAllowed)

O

    $filter=ParkingIncluded eq true and Rooms/all(room: room/SmokingAllowed eq false)

Buscar todos los hoteles que sean de lujo o que incluyan estacionamiento y tengan una valoración de cinco:

    $filter=(Category eq 'Luxury' or ParkingIncluded eq true) and Rating eq 5

Buscar todos los hoteles con la etiqueta "wifi" en al menos una habitación (donde cada habitación tiene etiquetas almacenadas en un campo Collection(Edm.String)):

    $filter=Rooms/any(room: room/Tags/any(tag: tag eq 'wifi'))

Buscar todos los hoteles con cualquier número de habitaciones:

    $filter=Rooms/any()

Buscar todos los hoteles que no tengan habitaciones:

    $filter=not Rooms/any()

Buscar todos los hoteles a una distancia no superior a diez kilómetros de un punto de referencia determinado (donde Location es un campo de tipo Edm.GeographyPoint):

    $filter=geo.distance(Location, geography'POINT(-122.131577 47.678581)') le 10

Buscar todos los hoteles dentro de una ventanilla dada descrita como un polígono (donde Location es un campo de tipo Edm.GeographyPoint). El polígono debe estar cerrado, lo que significa que el primer y último conjunto de puntos deben ser los mismos. Además, los puntos se deben enumerar en sentido contrario a las agujas del reloj.

    $filter=geo.intersects(Location, geography'POLYGON((-122.031577 47.578581, -122.031577 47.678581, -122.131577 47.678581, -122.031577 47.578581))')

Buscar todos los hoteles donde el campo "Descripción" sea NULL. El campo será NULL si no se ha establecido nunca, o bien si se ha establecido en NULL de forma explícita:

    $filter=Description eq null

Buscar todos los hoteles cuyo nombre sea "Sea View motel" o "Budget hotel". Estas frases contienen espacios, y un espacio es un delimitador predeterminado. Puede especificar un delimitador alternativo entre comillas simples como tercer parámetro de cadena:

    $filter=search.in(HotelName, 'Sea View motel,Budget hotel', ',')

Buscar todos los hoteles cuyo nombre sea "Sea View motel" o "Budget hotel" separados por "|"):

    $filter=search.in(HotelName, 'Sea View motel|Budget hotel', '|')

Buscar todos los hoteles en los que todas las habitaciones tengan la etiqueta "wifi" o "tub":

    $filter=Rooms/any(room: room/Tags/any(tag: search.in(tag, 'wifi, tub')))

Buscar una coincidencia en las frases de una colección, como "heated towel racks" o "hairdryer included" en las etiquetas.

    $filter=Rooms/any(room: room/Tags/any(tag: search.in(tag, 'heated towel racks,hairdryer included', ','))

Buscar documentos con la palabra "waterfront". Esta consulta de filtro es idéntica a una solicitud de búsqueda con search=waterfront.

    $filter=search.ismatchscoring('waterfront')

Buscar documentos con la palabra "hostel" y una valoración superior o igual a cuatro, o documentos con la palabra "motel" y una valoración igual a cinco. Esta solicitud no se podría expresar sin la función search.ismatchscoring ya que combina la búsqueda de texto completo con las operaciones de filtro mediante or.

    $filter=search.ismatchscoring('hostel') and rating ge 4 or search.ismatchscoring('motel') and rating eq 5

Buscar documentos sin la palabra "luxury".

    $filter=not search.ismatch('luxury')

Buscar documentos con la frase "ocean view" o con una valoración igual a cinco. La consulta search.ismatchscoring se ejecutará solo en los campos HotelName y Description. También se devolverán los documentos que cumplan la segunda cláusula de la disyunción (hoteles con Rating igual a 5). Esos documentos se devolverán con una puntuación igual a cero para dejar claro que no han coincidido con ninguno de los elementos puntuados de la expresión.

    $filter=search.ismatchscoring('"ocean view"', 'Description,HotelName') or Rating eq 5

Buscar hoteles donde los términos "hotel" y "airport" no estén separados en la descripción por más de cinco palabras y donde todas las habitaciones sean para no fumadores. Esta consulta utiliza el lenguaje de consulta completo de Lucene.

    $filter=search.ismatch('"hotel airport"~5', 'Description', 'full', 'any') and not Rooms/any(room: room/SmokingAllowed)

Busque documentos que tengan una palabra que comience por las letras "lux" en el campo Descripción. En esta consulta se usa la búsqueda de prefijo en combinación con search.ismatch.

    $filter=search.ismatch('lux*', 'Description')

Pasos siguientes