Inicio rápido: Creación de un índice de Azure Cognitive Search en Azure Portal

En este inicio rápido, creará su primer índice de búsqueda mediante el asistente para importar datos y un origen de datos de ejemplo integrado que consta de datos de hoteles ficticios. El asistente le guía en la creación de un índice de búsqueda (hotels-sample-index) para que pueda escribir consultas interesantes en cuestión de minutos.

Aunque no usará las opciones de este inicio rápido, el asistente incluye una página de enriquecimiento con IA que permite extraer texto y la estructura de archivos de imagen y texto no estructurado. Para ver un tutorial similar que incluye el enriquecimiento con IA, consulte Inicio rápido: creación de un conjunto de aptitudes cognitivas.

Requisitos previos

Búsqueda de espacio

Muchos clientes comienzan con el servicio gratis. El nivel Gratis está limitado a tres índices, tres orígenes de datos y tres indexadores. Asegúrese de que tiene espacio para elementos adicionales antes de empezar. Este inicio rápido crea uno de cada objeto.

Consulte la página de información general del servicio para conocer el número de índices, indexadores y orígenes de datos que ya tiene.

Captura de pantalla de listas de índices, indexadores y orígenes de datos en el panel del servicio.

Creación y carga de un índice

Las consultas de búsqueda recorren en iteración un índice que contiene los datos de búsqueda, los metadatos y otras construcciones que optimizan determinados comportamientos de la búsqueda.

En este inicio rápido, se creará y cargará el índice que utiliza un conjunto de datos de ejemplo integrado que se puede rastrear con un indexador mediante elAsistente para la importación de datos. El conjunto de datos hotels-sample está hospedado en Microsoft en Azure Cosmos DB y se accede a él mediante una conexión interna. No necesita su propia cuenta de Cosmos DB ni los archivos de origen para acceder a los datos.

Un indexador es un rastreador específico del origen que puede leer los metadatos y el contenido de los orígenes de datos de Azure admitidos. Normalmente, los indexadores se crean mediante programación, pero, en el portal, puede acceder a ellos a través del Asistente para la importación de datos.

Paso 1: Inicio del Asistente para la importación de datos y creación de un origen de datos

  1. Inicie sesión en Azure Portal con su cuenta de Azure.

  2. Busque su servicio de búsqueda y, en la página de información general, seleccione Importar datos en la barra de comandos para crear y rellenar un índice de búsqueda.

    Captura de pantalla del comando Importar datos en la barra de comandos.

  3. En el asistente, seleccione Conectar a los datos>Ejemplos>hotels-sample. Este origen de datos está integrado. Si creó su propio origen de datos, deberá especificar un nombre, el tipo y la información de conexión. Una vez creado, se convierte en un "origen de datos existente" que se puede reutilizar en otras operaciones de importación.

    Captura de pantalla de la página seleccionar conjunto de datos de ejemplo en el asistente.

  4. Continúe en la siguiente página.

Paso 2: omitir la página "Enriquecer contenido"

El asistente admite la creación de una canalización de enriquecimiento con inteligencia artificial para incorporar los algoritmos de inteligencia artificial de Cognitive Services a la indexación.

Omitiremos este paso por ahora y pasaremos directamente a Personalización del índice de destino.

Captura de pantalla del botón Omitir aptitud cognitiva en el asistente.

Sugerencia

Puede recorrer un ejemplo de indización con IA en una guía de inicio rápido o tutorial.

Paso 3: Configuración del índice

Para el índice hotels-sample integrado, el esquema de índice predeterminado ya está definido. Excepto por algunos ejemplos de filtros avanzados, las consultas de la documentación y los ejemplos que tienen como destino el índice hotels-sample se ejecutarán en esta definición de índice:

Captura de pantalla de la definición de índice de hoteles generada en el asistente.

Normalmente, la creación del índice en un ejercicio basado en código se completa antes de cargar datos. El asistente para importar datos condensa estos pasos mediante la generación de un índice básico para cualquier origen de datos que pueda rastrear. Como mínimo, un índice necesita un nombre y una colección de campos. Uno de los cuales debe estar marcado como la clave de documento para identificar de forma única cada documento. Además, puede especificar analizadores de lenguaje o proveedores de sugerencias si quiere que las consultas se sugieran o completen automáticamente.

Los campos tienen tipos de datos y atributos. Las casillas de la parte superior son atributos que controlan la forma de usar el campo.

  • Key es el identificador único del documento. Siempre es una cadena y es necesario. Solo un campo puede ser la clave.
  • Recuperable significa que el contenido del campo se muestra en la lista de resultados de la búsqueda. Puede desactivar esta casilla para marcar los campos individuales como fuera de los resultados de búsqueda, por ejemplo, para los campos que se usan solo en expresiones de filtro.
  • Filterable, Sortable y Facetable determinan si se usan campos en un filtro, una ordenación o una estructura de navegación de facetas.
  • Searchable significa que se incluye un campo en la búsqueda de texto completo. Las cadenas permiten realizar búsquedas. Los campos numéricos y los booleanos a menudo se marcan como no utilizables en búsquedas.

Los requisitos de almacenamiento pueden variar como resultado de la selección de atributos. Por ejemplo, Se puede filtrar necesita más almacenamiento, pero Recuperable no.

De forma predeterminada, el asistente busca en el origen de datos identificadores únicos como base para el campo de clave. Las cadenas tienen los atributos Recuperable y Permite búsquedas. Los enteros tienen los atributos Recuperable, Filterable, Ordenable y Clasificable.

  1. Acepte los valores predeterminados.

    Si vuelve a ejecutar el asistente con un origen de datos de hotels existente, el índice no se configurará con los atributos predeterminados. En las siguientes importaciones tendrá que seleccionar los atributos manualmente.

  2. Continúe en la siguiente página.

Paso 4: Configuración del indexador

Aún en el Asistente para la importación de datos, seleccione Indexador>Nombre y escriba un nombre para el indexador.

Este objeto define un proceso ejecutable. Podría colocarlo en una programación periódica; pero, por ahora, use la opción predeterminada para ejecutar el indexador una vez, inmediatamente.

Seleccione Enviar para crear y ejecutar simultáneamente el indexador.

Captura de pantalla de la definición del indizador de hoteles en el asistente.

Supervisión de progreso

El asistente debe llevarle a la lista de indexadores, donde puede supervisar el progreso. En cuanto a la navegación automática, vaya a la página de información general y seleccione la pestaña Indizadores.

El portal puede tardar unos minutos en actualizar la página, pero debería ver el indexador recién creado en la lista, con el estado "en curso" o correcto, junto con el número de documentos indexados.

Captura de pantalla del mensaje de progreso del indexador en el asistente.

Comprobar los resultados

La página de información general del servicio proporciona vínculos a los recursos creados en el servicio de Azure Cognitive Search. Para ver el índice que acaba de crear, seleccione Índices en la lista de vínculos.

Espere a que se actualice la página del portal. Después de unos minutos, debería ver el índice con un recuento de documentos y un tamaño de almacenamiento.

Captura de pantalla de la lista Índices en el panel de servicio.

En esta lista, puede seleccionar el índice de hotels-sample que acaba de crear y ver el esquema de índice y, opcionalmente, agregar nuevos campos.

La pestaña Campos muestra el esquema de índice. Si está escribiendo consultas y necesita comprobar si un campo se puede filtrar u ordenar, en esta pestaña se muestran los atributos.

Desplácese hasta la parte inferior de la lista para especificar un nuevo campo. Aunque siempre se puede crear un campo, en la mayoría de los casos no se pueden cambiar los campos existentes. Los campos existentes tienen una representación física en el servicio de búsqueda y, por tanto, no se pueden modificar, ni siquiera en el código. Para cambiar radicalmente un campo, cree otro índice y elimine el original.

Captura de pantalla de la definición de índice de ejemplo en Azure Portal.

Otras construcciones, como los perfiles de puntuación y las opciones de CORS, pueden agregarse en cualquier momento.

Para saber claramente qué puede y qué no puede modificar durante el diseño del índice, dedique un minuto para ver las opciones de definición de índice. Las opciones atenuadas son un indicador de que un valor no se puede modificar o eliminar.

Realización de consultas con el Explorador de búsqueda

Ahora tiene un índice de búsqueda que se puede consultar mediante el Explorador de búsqueda.

El Explorador de búsqueda envía llamadas REST que se ajustan a Search Documents API. La herramienta admite la sintaxis de consulta simplificada y el analizador de consultas completo de Lucene.

  1. Seleccione el Explorador de búsqueda en la barra de comandos.

    Captura de pantalla del comando Explorador de búsqueda en la barra de comandos.

  2. En la lista desplegable Índice, elija "hotels-sample-index".

    Captura de pantalla de las listas de selección de índice y API en el Explorador de búsqueda.

  3. En la barra de búsqueda, pegue una cadena de consulta de los ejemplos siguientes y seleccione Buscar.

    Captura de pantalla del campo de texto de la cadena de consulta y el botón de búsqueda en el Explorador de búsqueda.

Ejecución de más consultas de ejemplo

Todas las consultas de esta sección están diseñadas para el Explorador de búsqueda y el índice de ejemplo de Hoteles. Los resultados se devuelven como documentos JSON detallados. Todos los campos marcados como "recuperables" en el índice pueden aparecer en los resultados. Para más información sobre las consultas, consulte Consultas de Azure Cognitive Search.

Consultar Descripción
search=spa Consulta de texto completo simple con N resultados superiores. El parámetro search= se usa para la búsqueda con una palabra clave; en este caso, se devuelven los datos de los hoteles que contienen spa en cualquier campo que permite en el documento.
search=beach &$filter=Rating gt 4 Consulta filtrada. En este caso, las clasificaciones mayores de 4.
search=spa &$select=HotelName,Description,Tags &$count=true &$top=10 Consulta con parámetros. El símbolo & se usa para anexar parámetros de búsqueda, que pueden especificarse en cualquier orden.
El parámetro $select devuelve un subconjunto de campos para obtener unos resultados de búsqueda más concisos.
El parámetro $count=true devuelve el recuento total de todos los documentos que coinciden con la consulta.
El parámetro $top=10devuelve los 10 documentos mejor clasificados del total. De forma predeterminada, Azure Cognitive Search devuelve las 50 mayores coincidencias. Puede aumentar o disminuir la cantidad mediante este parámetro.
search=* &facet=Category &$top=2 Consulta de faceta, que se usa para devolver un recuento agregado de los documentos que coincidan con el valor de faceta que proporcione. En una búsqueda vacía o no calificada, se representan todos los documentos. En el índice de hoteles, el campo Categoría se marca como "clasificable".
search=spa &facet=Rating Faceta en valores numéricos. Esta consulta es una faceta para la clasificación, en una búsqueda de texto de "spa". El término "Clasificación" se puede especificar como una faceta porque el campo está marcado como recuperable, filtrable y aplicable a facetas en el índice, y sus valores numéricos (de 1 a 5) son adecuados para agrupar los resultados por cada valor.
search=beach &highlight=Description &$select=HotelName, Description, Category, Tags Resaltado de referencias. El término "beach" se resaltará cuando aparezca en el campo "Descripción".
search=seatle seguido de
search=seatle~ &queryType=full
Búsqueda aproximada. De forma predeterminada, los términos de consulta mal escritos, como seatle para "Seattle", no devuelven coincidencias en una búsqueda normal. El primer ejemplo no devuelve ningún resultado. Al agregar queryType=full, se invoca el analizador de consultas de Lucene completo, que admite el operando ~ para la búsqueda aproximada.
$filter=geo.distance(Location, geography'POINT(-122.12 47.67)') le 5 &search=* &$select=HotelName, Address/City, Address/StateProvince &$count=true Búsqueda geoespacial. La consulta de ejemplo filtra todos los resultados para los datos posicionales, donde los resultados están a menos de 5 kilómetros de un punto determinado, según lo especificado por las coordenadas de latitud y longitud (en este ejemplo se usa Redmond, Washington, como punto de origen).

Puntos clave

En este inicio rápido se ha proporcionado una introducción rápida al uso de Azure Cognitive Search con Azure Portal.

Ha aprendido cómo crear un índice de búsqueda mediante el asistente para importar datos. Ha creado su primer indizador y ha aprendido el flujo de trabajo básico para el diseño de índices. Consulte Asistente para la importación de datos en Azure Cognitive Search para más información sobre las ventajas y limitaciones del asistente.

Mediante el Explorador de búsqueda de Azure Portal, ha aprendido la sintaxis de consulta básica mediante ejemplos prácticos de las funcionalidades clave, como los filtros, el resaltado de referencias, la búsqueda aproximada y la búsqueda geoespacial.

Limpieza de recursos

Cuando trabaje con su propia suscripción, es una buena idea al final de un proyecto identificar si todavía se necesitan los recursos que ha creado. Los recursos que se dejan en ejecución pueden costarle mucho dinero. Puede eliminar los recursos de forma individual o eliminar el grupo de recursos para eliminar todo el conjunto de recursos.

Puede encontrar y administrar recursos en el portal, mediante el vínculo Todos los recursos o Grupos de recursos en el panel de navegación izquierdo.

Si está usando un servicio gratuito, recuerde que está limitado a tres índices, indexadores y orígenes de datos. Puede eliminar elementos individuales en el portal para mantenerse por debajo del límite.

Pasos siguientes

Use un asistente del portal para generar una aplicación web lista para usar que se ejecute en un explorador. Puede probar este asistente en el pequeño índice que acaba de crear, o bien usar uno de los conjuntos de datos de ejemplo integrados, ya que la búsqueda mejorará.