Identificación de elementos de una solución de búsqueda

Completado

Infographic of indexing process.

Una solución de Búsqueda de Azure AI típica comienza con un origen de datos que contiene los artefactos de datos que se quieran buscar. Podría ser una jerarquía de carpetas y archivos en Azure Storage o texto en una base de datos de Azure SQL Database o Azure Cosmos DB, entre otras. El formato de datos que admite Búsqueda de Azure AI es JSON. Independientemente de dónde se originen los datos, si puede proporcionarlos como un documento JSON, el motor de búsqueda podrá indexarlos.

Si los datos residen en el origen de datos admitido, puede usar un indexador para automatizar la ingesta de datos, incluida la serialización JSON de los datos de origen en formatos nativos. Un indexador se conecta a un origen de datos, serializa los datos y pasa al motor de búsqueda para la indexación. La mayoría de los indexadores admiten la detección de cambios, lo que hace que la actualización de datos sea un ejercicio más sencillo.

Además de automatizar la ingesta de datos, los indexadores también admiten el enriquecimiento con IA. Puede asociar un conjunto de aptitudes que aplique una secuencia de aptitudes de inteligencia artificial para enriquecer los datos, lo que hace que sea más fácil de buscar. Un conjunto completo de aptitudes integradas basadas en las API de los servicios de Azure AI, puede ayudarlo a derivar nuevos campos; por ejemplo, reconociendo entidades en el texto, traduciendo texto, evaluando opiniones o prediciendo descripciones adecuadas para imágenes. Opcionalmente, el contenido enriquecido se puede enviar a un almacén de conocimiento, que almacena la salida de una canalización de enriquecimiento con IA en tablas y blobs de Azure Storage para el análisis independiente o el procesamiento de bajada.

Tanto si escribe código de aplicación que inserta datos en un índice o usa un indexador que automatiza la ingesta de datos y agrega enriquecimiento con IA, los campos que contienen el contenido se conservan en un índice, que las aplicaciones cliente pueden buscar. Los campos se usan para buscar, filtrar y ordenar a fin de generar un conjunto de resultados que la aplicación cliente puede mostrar o usar.