¿Qué es la clasificación semántica?

Completado

La clasificación semántica es una funcionalidad de Búsqueda de Azure AI que pretende mejorar la clasificación de los resultados de búsqueda. La clasificación semántica mejora la clasificación de los resultados de búsqueda mediante reconocimiento del lenguaje para que coincida con más precisión con el contexto de la consulta original.

Función de categoría BM25

Búsqueda de Azure AI usa la función de categoría BM25 de forma predeterminada. La función de categoría BM25 clasifica los resultados de búsqueda en función de la frecuencia con la que aparece el término de búsqueda dentro de un documento. La función de categoría BM25 a menudo logrará excelentes resultados de clasificación, ya que un documento que con frecuencia incluye un término de búsqueda suele ser el más relevante, pero esto no siempre es el caso. La clasificación BM25 no coloca ninguna relevancia en la semántica de la consulta y la clasificación a veces se puede mejorar agregando reconocimiento del lenguaje.

Clasificación semántica

La clasificación semántica tiene dos funciones; mejora la clasificación de los resultados de la consulta con el reconocimiento del lenguaje y mejora la respuesta a la consulta proporcionando subtítulos y respuestas en los resultados.

La clasificación semántica usa la clasificación BM25 y calcula una nueva puntuación de relevancia con la clasificación BM25 original combinada con modelos de reconocimiento del lenguaje para extraer el contexto y el significado de la consulta.

Subtítulos y respuestas semánticas

Los subtítulos y las respuestas semánticas proporcionan resultados adicionales junto con los resultados de búsqueda clasificados que puede mostrar para mejorar la comprensión de los resultados para los usuarios.

Los subtítulos semánticos extraen oraciones de resumen del documento textual y resaltan el texto más relevante de las oraciones de resumen.

Las respuestas semánticas son una característica adicional opcional de la clasificación semántica que proporciona respuestas a preguntas. Si la consulta de búsqueda parece ser una pregunta y los resultados de contienen texto que parece ser una respuesta relevante, se devuelve la respuesta semántica.

Funcionamiento de la clasificación semántica

La clasificación semántica toma los 50 mejores resultados de los resultados de la clasificación BM25. Los resultados se dividen en varios campos definidos por una configuración semántica. Los campos se convierten en cadenas de texto y se recortan en 256 tokens únicos. Un token es aproximadamente equivalente a una palabra del documento.

Una vez preparadas las cadenas, se pasan a modelos de comprensión de lectura automática para encontrar las frases y oraciones que mejor coincidan con la consulta. Los resultados de esta frase de resumen son un subtítulo semántico y, de manera opcional, una respuesta semántica.

Los subtítulos semánticos ahora se clasifican en función de la relevancia semántica. A continuación, los resultados se devuelven en orden descendente de relevancia.

Funcionalidades de clasificación semántica

Consulte el siguiente vídeo para obtener información general sobre las funcionalidades de Búsqueda de Azure AI:

Ventajas de la clasificación semántica

La clasificación semántica tiene dos ventajas clave sobre los resultados de búsqueda tradicionales:

  • La clasificación semántica puede clasificar los resultados para que coincidan con la semántica de la consulta original. Esto puede hacer que sea más probable que aparezcan los documentos más útiles en la parte superior de los resultados de búsqueda.
  • La clasificación semántica puede encontrar cadenas dentro de los resultados para mostrarlas como un subtítulo en la página de resultados de búsqueda y proporcionar una respuesta a una pregunta.

Limitaciones de clasificación semántica

La clasificación semántica se aplica a los resultados devueltos por la función de categoría BM25. Aunque la clasificación semántica puede volver a clasificar los resultados proporcionados por la función de categoría BM25, no proporcionará ningún documento adicional que no haya sido devuelto por la función de categoría BM25.

La clasificación semántica usa los 50 resultados principales de la función de categoría BM25. Si se devuelven más, solo se tienen en cuenta los 50 primeros.

Precios de clasificación semántica

Puede realizar hasta 1000 consultas de clasificación semántica al mes de forma gratuita.

Si desea realizar más de 1000 consultas, debe elegir los precios estándar. El costo de los precios estándar se basa en el volumen, el tipo y la región de búsquedas.

Para más información sobre los precios de clasificación semántica, consulte Precios de Búsqueda de Azure AI