Início Rápido: Criar um índice de pesquisa no portal do Azure

Neste guia de início rápido da Pesquisa de IA do Azure, crie seu primeiro índice de pesquisa usando o assistente Importar dados e uma fonte de dados de exemplo interna que consiste em dados de hotel fictícios hospedados pela Microsoft. O assistente orienta você pela criação de um índice de pesquisa sem código para ajudá-lo a escrever consultas interessantes em minutos.

O assistente cria vários objetos em seu serviço de pesquisa - índice pesquisável - mas também um indexador e uma conexão de fonte de dados para recuperação automatizada de dados. No final deste início rápido, revisamos cada objeto.

Observação

O assistente Importar dados inclui opções para OCR, tradução de texto e outros enriquecimentos de IA que não são abordados neste início rápido. Para obter um passo a passo semelhante que se concentra no enriquecimento de IA, consulte Guia de início rápido: criar um conjunto de habilidades no portal do Azure.

Pré-requisitos

Verificar o espaço

Muitos clientes começam com o serviço gratuito. A camada gratuita é limitada a três índices, três fontes de dados e três indexadores. Verifique se há espaço para itens extras antes de começar. Este guia de início rápido cria uma unidade de cada objeto.

Verifique a guia Visão geral > do uso do serviço para ver quantos índices, indexadores e fontes de dados você já tem.

Screenshot of the Overview page for an Azure AI Search service instance in the Azure portal, showing the number of indexes, indexers, and data sources.

Iniciar o assistente

  1. Entre no portal do Azure com sua conta do Azure e acesse o serviço de IA do Azure Search.

  2. Na página Visão geral, selecione Importar dados para iniciar o assistente.

    Screenshot that shows how to open the Import data wizard in the Azure portal.

Criar e carregar um índice

Nesta seção, crie e carregue um índice em quatro etapas.

Conectar-se a uma fonte de dados

O assistente cria uma conexão de fonte de dados com dados de exemplo hospedados pela Microsoft no Azure Cosmos DB. Esses dados de exemplo são recuperados, acessados por meio de uma conexão interna. Você não precisa de sua própria conta do Azure Cosmos DB ou arquivos de origem para executar esse início rápido.

  1. Em Conectar-se aos seus dados, expanda a lista suspensa Fonte de Dados e selecione Exemplos.

  2. Na lista de amostras internas, selecione hotels-sample.

    Screenshot that shows how to select the hotels-sample data source in the Import data wizard.

  3. Selecione Avançar: Adicionar habilidades cognitivas (opcional) para continuar.

Ignorar configuração para habilidades cognitivas

O assistente Importar dados oferece suporte à criação de um conjunto de habilidades e ao enriquecimento de IA na indexação.

  1. Para este início rápido, ignore as opções de configuração de enriquecimento de IA na guia Adicionar habilidades cognitivas.

  2. Selecione Pular para: personalizar índice de destino para continuar.

    Screenshot that shows how to Skip to the Customize target index tab in the Import data wizard.

Dica

Interessado em enriquecimento de IA? Experimente este Guia de início rápido: criar um conjunto de habilidades no portal do Azure

Configurar o índice

O assistente infere um esquema para o índice interno de amostra de hotéis. Siga estas etapas para configurar o índice:

  1. Aceite os valores gerados pelo sistema para os campos Nome do índice (hotels-sample-index) e Chave (HotelId).

  2. Aceite os valores gerados pelo sistema para todos os atributos de campo.

    Importante

    Se você executar novamente o assistente e usar uma fonte de dados de exemplo de hotéis existente, o índice não será configurado com atributos padrão. Você precisa selecionar manualmente atributos em importações futuras.

  3. Selecione Próximo: criar um indexador para continuar.

Screenshot that shows the generated index definition for the hotels-sample data source in the Import data wizard.

No mínimo, o índice requer um Nome do índice e uma coleção de Campos. Um campo deve ser marcado como a chave do documento para identificar exclusivamente cada documento. O valor é sempre uma cadeia de caracteres. O assistente verifica campos de cadeia de caracteres exclusivos e escolhe um para a chave.

Cada campo tem um nome, tipo de dados e atributos que controlam como usar o campo no índice de pesquisa. As caixas de seleção habilitam ou desabilitam os seguintes atributos:

  • Recuperável: campos retornados em uma resposta de consulta.
  • Filtrável: campos que aceitam uma expressão de filtro.
  • Classificável: campos que aceitam uma expressão orderby.
  • Facetable: Campos usados em uma estrutura de navegação facetada.
  • Pesquisável: Campos usados na pesquisa de texto completo. As cadeias de caracteres são pesquisáveis. Campos numéricos e boolianos geralmente são marcados como não pesquisáveis.

As cadeias de caracteres são atribuídas como Recuperáveis e Pesquisáveis. Os inteiros são atribuídos como Recuperável, Filtrável, Classificável e Facetável.

Os atributos afetam o armazenamento. Os campos filtráveis consomem armazenamento extra, mas os recuperáveis não. Para obter mais informações, consulte Exemplo demonstrando as implicações de armazenamento de atributos e sugestões.

Se você quiser preenchimento automático ou consultas sugeridas, especifique Analisadores ou Sugestões de idioma.

Configurar e executar o indexador

A última etapa configura e executa o indexador. Esse objeto define um processo executável. A fonte de dados, o índice e o indexador são criados nesta etapa.

  1. Aceite o valor gerado pelo sistema para o Nome do indexador (hotels-sample-indexer).

  2. Para esse início rápido, use a opção padrão para executar o indexador uma vez, imediatamente. Os dados hospedados são estáticos, portanto, não há controle de alterações habilitado para eles.

  3. Selecione Enviar para criar e executar o indexador simultaneamente.

    Screenshot that shows how to configure the indexer for the hotels-sample data source in the Import data wizard.

Monitorar o progresso do indexador

Você pode monitorar a criação do indexador ou índice no portal. A página de Visão geral do serviço fornece links para os recursos criados no serviço de IA do Azure Search.

  1. À esquerda, selecione Indexadores.

    Screenshot that shows the creation of the indexer in progress in the Azure portal.

    Pode levar alguns minutos para que os resultados da página sejam atualizados no portal do Azure. Você deve ver o indexador recém-criado na lista com um status de Em andamento ou Êxito. A lista também mostra o número de documentos indexados.

Verificar os resultados do índice de pesquisa

  1. À esquerda, selecione Índices.

  2. Selecione hotels-sample-index.

    Aguarde até que a página do portal do Azure seja atualizada. Você deve ver o índice com uma contagem de documentos e tamanho de armazenamento.

    Screenshot of the Indexes list on the Azure AI Search service dashboard in the Azure portal.

  3. Selecione a guia Campos para exibir o esquema de índice.

    Verifique quais campos são filtráveis ou classificáveis para saber quais consultas gravar.

    Screenshot that shows the schema definition for an index in the Azure AI Search service in the Azure portal.

Adicionar ou alterar campos

Na guia Campos, você pode criar um novo campo usando Adicionar campo com nome, tipo de dados com suporte e atribuições.

Alterar campos existentes é mais difícil. Os campos existentes têm uma representação física no índice, portanto, não são modificáveis, nem mesmo no código. Para alterar fundamentalmente um campo existente, você precisa criar um novo campo que substitua o original. Outros construtos, como perfis de pontuação e opções CORS, podem ser adicionados a um índice a qualquer momento.

Para entender claramente o que você pode ou não editar durante o design do índice, reserve um minuto para exibir as opções de definição de índice. As opções em cinza na lista de campos indicam valores que não podem ser modificados ou excluídos.

Consultar com o Gerenciador de pesquisa

Agora você tem um índice de pesquisa que pode ser consultado com o Gerenciador de pesquisa. O explorador de pesquisa envia chamadas REST que estão em conformidade com a API REST do Search POST. A ferramenta suporta sintaxe de consulta simples e sintaxe de consulta Lucene completa.

  1. Na guia Gerenciador de pesquisa, insira o texto para pesquisar.

    Screenshot that shows how to enter and run a query in the Search Explorer tool.

  2. Use o Minimapa para saltar rapidamente para áreas não visíveis da saída.

    Screenshot that shows long results for a query in the Search Explorer tool and the mini-map.

  3. Para especificar a sintaxe, alterne para o modo de exibição JSON.

    Screenshot of the JSON view selector.

Exemplo de consultas para o índice de amostra de hotéis

Os exemplos a seguir pressupõem o modo de exibição JSON e a versão da API REST 2023-11-01.

Exemplos de filtro

Estacionamento, tags, data de renovação, classificação e localização são filtráveis.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

Os filtros booleanos assumem "true" por padrão.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

A pesquisa geoespacial é baseada em filtros. A geo.distance função filtra todos os resultados para dados posicionais com base nas coordenadas especificadas Location e geography'POINT coordenadas. A consulta busca hotéis que estejam a menos de 5 quilômetros das coordenadas de latitude e longitude -122.12 47.67, que é "Redmond, Washington, EUA". A consulta exibe o número total de correspondências &$count=true com os nomes dos hotéis e locais de endereço.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

Exemplos completos de sintaxe Lucene

A sintaxe padrão é a sintaxe simples, mas se você quiser pesquisa difusa ou aumento de termos ou expressões regulares, especifique a sintaxe completa.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

Por padrão, termos de consulta com erros ortográficos, como seatle para Seattle, não retornam correspondências em uma pesquisa típica. O parâmetro queryType=full invoca o analisador de consulta Lucene completo, que oferece suporte ao operando til ~. Quando esses parâmetros estão presentes, a consulta executa uma pesquisa difusa para a palavra-chave especificada. A consulta procura resultados correspondentes juntamente com resultados que são semelhantes, mas não uma correspondência exata para a palavra-chave.

Reserve um minuto para experimentar algumas dessas consultas de exemplo para seu índice. Para saber mais sobre consultas, consulte Consultando na Pesquisa de IA do Azure.

Limpar os recursos

Quando você trabalha em sua própria assinatura, é uma boa ideia no final de um projeto identificar se você ainda precisa dos recursos criados. Recursos deixados em execução podem custar dinheiro. Você pode excluir os recursos individualmente ou excluir o grupo de recursos para excluir todo o conjunto de recursos.

Você pode localizar e gerenciar recursos para seu serviço no portal do Azure em Todos os recursos ou Grupos de recursos no painel esquerdo.

Se você usa um serviço gratuito, lembre-se de que o limite é de três índices, indexadores e fontes de dados. Você pode excluir itens individuais no portal do Azure para permanecer abaixo do limite.

Próximas etapas

Experimente um assistente do portal do Azure para gerar um aplicativo Web pronto para uso executado em um navegador. Use este assistente no pequeno índice criado neste guia de início rápido ou use um dos conjuntos de dados de exemplo internos para uma experiência de pesquisa mais rica.