Share via


2 - Creación y carga de índices de búsqueda con JavaScript

Siga estos pasos para crear el sitio web habilitado para la búsqueda:

Creación de un recurso de Azure AI Search

Cree un nuevo recurso de búsqueda desde la línea de comandos mediante la CLI de Azure o Azure PowerShell. Puede recuperar una clave de consulta que se usa para el acceso de lectura al índice y obtendrá la clave de administrador integrada que se usa para agregar objetos.

Debe tener la CLI de Azure o Azure PowerShell instalado en el dispositivo. Si no es un administrador local en el dispositivo, elija Azure PowerShell y use el parámetro Scope para ejecutar como el usuario actual.

Nota:

Esta tarea no requiere las extensiones de Visual Studio Code para la CLI de Azure y Azure PowerShell. Visual Studio Code reconoce las herramientas de línea de comandos sin las extensiones.

  1. En Visual Studio Code, en Terminal, seleccione Nuevo terminal.

  2. Conexión a Azure:

    az login
    
  3. Antes de crear un nuevo servicio de búsqueda, enumere los servicios existentes para la suscripción:

    az resource list --resource-type Microsoft.Search/searchServices --output table
    

    Si tiene un servicio que desea usar, anote el nombre y, a continuación, vaya directamente a la sección siguiente.

  4. Cree un nuevo servicio de búsqueda. Use el siguiente comando como plantilla, sustituyendo los valores válidos para el grupo de recursos, el nombre del servicio, el nivel, la región, las particiones y las réplicas. La siguiente instrucción usa el grupo de recursos "cognitive-search-demo-rg" creado en un paso anterior y especifica el nivel "gratis". Si la suscripción de Azure ya tiene un servicio de búsqueda gratuito, especifique un nivel facturable, como "básico" en su lugar.

    az search service create --name my-cog-search-demo-svc --resource-group cognitive-search-demo-rg --sku free --partition-count 1 --replica-count 1
    
  5. Obtenga una clave de consulta que conceda acceso de lectura a un servicio de búsqueda. Un servicio de búsqueda se aprovisiona con dos claves de administrador y una clave de consulta. Sustituya los nombres válidos para el grupo de recursos y el servicio de búsqueda. Copie la clave de consulta en el Bloc de notas para poder pegarla en el código de cliente en un paso posterior:

    az search query-key list --resource-group cognitive-search-demo-rg --service-name my-cog-search-demo-svc
    
  6. Obtenga una clave de API de administración del servicio de búsqueda. Una clave de API de administrador proporciona acceso de escritura al servicio de búsqueda. Copie una de las claves de administrador en el Bloc de notas para que pueda usarla en el paso de importación masiva que crea y carga un índice:

    az search admin-key show --resource-group cognitive-search-demo-rg --service-name my-cog-search-demo-svc
    

El script de ESM utiliza el SDK de Azure para Azure AI Search:

  1. En Visual Studio Code, abra el archivo bulk_insert_books.js del subdirectorio, search-website-functions-v4/bulk-insert, y reemplace las siguientes variables por sus propios valores para autenticarse con el SDK de Azure Search:

    • YOUR-SEARCH-RESOURCE-NAME
    • YOUR-SEARCH-ADMIN-KEY
    import fetch from 'node-fetch';
    import Papa from 'papaparse';
    import {
      SearchClient,
      SearchIndexClient,
      AzureKeyCredential
    } from '@azure/search-documents';
    
    // Azure AI Search resource settings
    const SEARCH_ENDPOINT = 'https://YOUR-RESOURCE-NAME.search.windows.net';
    const SEARCH_ADMIN_KEY = 'YOUR-RESOURCE-ADMIN-KEY';
    
    // Azure AI Search index settings
    const SEARCH_INDEX_NAME = 'good-books';
    import SEARCH_INDEX_SCHEMA from './good-books-index.json' assert { type: 'json' };
    
    // Data settings
    const BOOKS_URL =
      'https://raw.githubusercontent.com/Azure-Samples/azure-search-sample-data/main/good-books/books.csv';
    const BATCH_SIZE = 1000;
    
    // Create Search service client
    // used to upload docs into Index
    const client = new SearchClient(
      SEARCH_ENDPOINT,
      SEARCH_INDEX_NAME,
      new AzureKeyCredential(SEARCH_ADMIN_KEY)
    );
    
    // Create Search service Index client
    // used to create new Index
    const clientIndex = new SearchIndexClient(
      SEARCH_ENDPOINT,
      new AzureKeyCredential(SEARCH_ADMIN_KEY)
    );
    
    // Insert docs into Search Index
    // in batch
    const insertData = async (data) => {
      let batch = 0;
      let batchArray = [];
    
      for (let i = 0; i < data.length; i++) {
        const row = data[i];
    
        // Convert string data to typed data
        // Types are defined in schema
        batchArray.push({
          id: row.book_id,
          goodreads_book_id: parseInt(row.goodreads_book_id),
          best_book_id: parseInt(row.best_book_id),
          work_id: parseInt(row.work_id),
          books_count: !row.books_count ? 0 : parseInt(row.books_count),
          isbn: row.isbn,
          isbn13: row.isbn13,
          authors: row.authors.split(',').map((name) => name.trim()),
          original_publication_year: !row.original_publication_year
            ? 0
            : parseInt(row.original_publication_year),
          original_title: row.original_title,
          title: row.title,
          language_code: row.language_code,
          average_rating: !row.average_rating ? 0 : parseFloat(row.average_rating),
          ratings_count: !row.ratings_count ? 0 : parseInt(row.ratings_count),
          work_ratings_count: !row.work_ratings_count
            ? 0
            : parseInt(row.work_ratings_count),
          work_text_reviews_count: !row.work_text_reviews_count
            ? 0
            : parseInt(row.work_text_reviews_count),
          ratings_1: !row.ratings_1 ? 0 : parseInt(row.ratings_1),
          ratings_2: !row.ratings_2 ? 0 : parseInt(row.ratings_2),
          ratings_3: !row.ratings_3 ? 0 : parseInt(row.ratings_3),
          ratings_4: !row.ratings_4 ? 0 : parseInt(row.ratings_4),
          ratings_5: !row.ratings_5 ? 0 : parseInt(row.ratings_5),
          image_url: row.image_url,
          small_image_url: row.small_image_url
        });
    
        console.log(`${i}`);
    
        // Insert batch into Index
        if (batchArray.length % BATCH_SIZE === 0) {
          await client.uploadDocuments(batchArray);
    
          console.log(`BATCH SENT`);
          batchArray = [];
        }
      }
      // Insert any final batch into Index
      if (batchArray.length > 0) {
        await client.uploadDocuments(batchArray);
    
        console.log(`FINAL BATCH SENT`);
        batchArray = [];
      }
    };
    const bulkInsert = async () => {
      // Download CSV Data file
      const response = await fetch(BOOKS_URL, {
        method: 'GET'
      });
      if (response.ok) {
        console.log(`book list fetched`);
        const fileData = await response.text();
        console.log(`book list data received`);
    
        // convert CSV to JSON
        const dataObj = Papa.parse(fileData, {
          header: true,
          encoding: 'utf8',
          skipEmptyLines: true
        });
        console.log(`book list data parsed`);
    
        // Insert JSON into Search Index
        await insertData(dataObj.data);
        console.log(`book list data inserted`);
      } else {
        console.log(`Couldn\t download data`);
      }
    };
    
    // Create Search Index
    async function createIndex() {
      SEARCH_INDEX_SCHEMA.name = SEARCH_INDEX_NAME;
    
      const result = await clientIndex.createIndex(SEARCH_INDEX_SCHEMA);
    }
    
    await createIndex();
    console.log('index created');
    
    await bulkInsert();
    console.log('data inserted into index');
    
  2. Abra un terminal integrado en Visual Studio para el subdirectorio del directorio del proyecto, search-website-functions-v4/bulk-insert, y ejecute el siguiente comando para instalar las dependencias.

    npm install 
    
  1. Siga utilizando el terminal integrado en Visual Studio para el subdirectorio del directorio del proyecto, search-website-functions-v4/bulk-insert, a fin de ejecutar el script bulk_insert_books.js:

    npm start
    
  2. A medida que se va ejecutando el código, la consola muestra el progreso.

  3. Una vez completada la carga, la última instrucción impresa en la consola es "Done" (Hecho).

Revisión del nuevo índice de búsqueda

Una vez que la carga se completa, el índice de búsqueda está preparado para su uso. Examine el índice nuevo en Azure Portal.

  1. En Azure Portal, busque el servicio de búsqueda que creó en el paso anterior.

  2. A la izquierda, seleccione Índices y, a continuación, seleccione el índice de libros correctos.

    Expandable screenshot of Azure portal showing the index.

  3. De forma predeterminada, el índice se abre en la pestaña Explorador de búsqueda. Seleccione Buscar para devolver documentos del índice.

    Expandable screenshot of Azure portal showing search results

Reversión de cambios de archivos de importación masiva

Use el siguiente comando git en el terminal de Visual Studio Code integrado en el directorio bulk-insert para revertir los cambios. No son necesarios para continuar con el tutorial y no debe guardar ni insertar estos secretos en el repositorio.

git checkout .

Copia del nombre del recurso Search

Anote el nombre del recurso Search. Lo necesitará para conectar la aplicación de funciones de Azure a su recurso de Search.

Precaución

Aunque es posible que se sienta tentado a utilizar la clave de administrador de Search en Azure Functions, eso no sigue el principio de privilegios mínimos. Función de Azure usará la clave de consulta para ajustarse al privilegio mínimo.

Pasos siguientes

Implementación de la aplicación web estática