Guia de início rápido: criar um índice de pesquisa no portal do Azure

Neste início rápido do Azure AI Search, crie seu primeiro índice de pesquisa usando o assistente Importar dados e uma fonte de dados de exemplo interna que consiste em dados fictícios de hotéis hospedados pela Microsoft. O assistente orienta você através da criação de um índice de pesquisa sem código para ajudá-lo a escrever consultas interessantes em poucos minutos.

O assistente cria vários objetos em seu serviço de pesquisa - índice pesquisável - mas também um indexador e conexão de fonte de dados para recuperação automatizada de dados. No final deste início rápido, analisamos cada objeto.

Nota

O assistente Importar dados inclui opções para OCR, tradução de texto e outros enriquecimentos de IA que não são abordados neste início rápido. Para obter um passo a passo semelhante que se concentra no enriquecimento da IA, consulte Guia de início rápido: criar um conjunto de habilidades no portal do Azure.

Pré-requisitos

Verificar o espaço

Muitos clientes começam com o serviço gratuito. O nível gratuito é limitado a três índices, três fontes de dados e três indexadores. Certifique-se de que tem espaço para itens adicionais antes de começar. Este guia de início rápido cria um de cada objeto.

Verifique a guia Visão geral > do uso do serviço para ver quantos índices, indexadores e fontes de dados você já tem.

Screenshot of the Overview page for an Azure AI Search service instance in the Azure portal, showing the number of indexes, indexers, and data sources.

Iniciar o assistente

  1. Entre no portal do Azure com sua conta do Azure e vá para seu serviço Azure AI Search.

  2. Na página Visão geral, selecione Importar dados para iniciar o assistente.

    Screenshot that shows how to open the Import data wizard in the Azure portal.

Criar e carregar um índice

Nesta seção, crie e carregue um índice em quatro etapas.

Ligar a uma origem de dados

O assistente cria uma conexão de fonte de dados com dados de exemplo hospedados pela Microsoft no Azure Cosmos DB. Esses dados de exemplo são recuperados, acessados por meio de uma conexão interna. Você não precisa de sua própria conta do Azure Cosmos DB ou arquivos de origem para executar este início rápido.

  1. Em Conectar aos seus dados, expanda a lista suspensa Fonte de Dados e selecione Exemplos.

  2. Na lista de exemplos incorporados, selecione hotels-sample.

    Screenshot that shows how to select the hotels-sample data source in the Import data wizard.

  3. Selecione Next: Add cognitive skills (Optional) para continuar.

Pular configuração para habilidades cognitivas

O assistente Importar dados suporta a criação de um conjunto de habilidades e enriquecimento de IA na indexação.

  1. Para este início rápido, ignore as opções de configuração de enriquecimento de IA na guia Adicionar habilidades cognitivas .

  2. Selecione Saltar para: Personalizar índice de destino para continuar.

    Screenshot that shows how to Skip to the Customize target index tab in the Import data wizard.

Gorjeta

Interessado no enriquecimento da IA? Experimente este Guia de início rápido: criar um conjunto de habilidades no portal do Azure

Configurar o índice

O assistente infere um esquema para o índice de amostra de hotéis interno. Siga estas etapas para configurar o índice:

  1. Aceite os valores gerados pelo sistema para o nome do índice (hotels-sample-index) e o campo Key (HotelId).

  2. Aceite os valores gerados pelo sistema para todos os atributos de campo.

    Importante

    Se você executar novamente o assistente e usar uma fonte de dados de exemplo de hotéis existente, o índice não será configurado com atributos padrão. Você tem que selecionar manualmente atributos em importações futuras.

  3. Selecione Avançar: Criar um indexador para continuar.

Screenshot that shows the generated index definition for the hotels-sample data source in the Import data wizard.

No mínimo, o índice requer um nome de índice e uma coleção de campos. Um campo deve ser marcado como a chave do documento para identificar exclusivamente cada documento. O valor é sempre uma cadeia de caracteres. O assistente verifica campos de cadeia de caracteres exclusivos e escolhe um para a chave.

Cada campo tem um nome, tipo de dados e atributos que controlam como usar o campo no índice de pesquisa. As caixas de seleção habilitam ou desabilitam os seguintes atributos:

  • Recuperável: campos retornados em uma resposta de consulta.
  • Filtrável: campos que aceitam uma expressão de filtro.
  • Classificável: campos que aceitam uma expressão orderby.
  • Facetable: Campos utilizados numa estrutura de navegação facetada.
  • Pesquisável: Campos utilizados na pesquisa de texto completo. As cadeias são pesquisáveis. Os campos numéricos e booleanos são frequentemente marcados como não pesquisáveis.

As cadeias de caracteres são atribuídas como recuperáveis e pesquisáveis. Os inteiros são atribuídos como Recuperáveis, Filtráveis, Classificáveis e Facetable.

Os atributos afetam o armazenamento. Os campos filtráveis consomem armazenamento extra, mas o Rerecuperável não. Para obter mais informações, consulte Exemplo demonstrando as implicações de armazenamento de atributos e sugestões.

Se desejar preencher automaticamente ou sugerir consultas, especifique Analisadores ou Sugestões de idioma.

Configurar e executar o indexador

A última etapa configura e executa o indexador. Este objeto define um processo executável. A fonte de dados, o índice e o indexador são criados nesta etapa.

  1. Aceite o valor gerado pelo sistema para o nome do indexador (hotels-sample-indexer).

  2. Para este início rápido, use a opção padrão para executar o indexador uma vez, imediatamente. Os dados hospedados são estáticos, portanto, não há controle de alterações habilitado para eles.

  3. Selecione Enviar para criar e executar simultaneamente o indexador.

    Screenshot that shows how to configure the indexer for the hotels-sample data source in the Import data wizard.

Monitorar o progresso do indexador

Você pode monitorar a criação do indexador ou índice no portal. A página Visão geral do serviço fornece links para os recursos criados em seu serviço Azure AI Search.

  1. À esquerda, selecione Indexadores.

    Screenshot that shows the creation of the indexer in progress in the Azure portal.

    Pode levar alguns minutos para que os resultados da página sejam atualizados no portal do Azure. Você deve ver o indexador recém-criado na lista com um status de Em andamento ou Sucesso. A lista também mostra o número de documentos indexados.

Verificar os resultados do índice de pesquisa

  1. À esquerda, selecione Índices.

  2. Selecione hotels-sample-index.

    Aguarde até que a página do portal do Azure seja atualizada. Você verá o índice com uma contagem de documentos e tamanho de armazenamento.

    Screenshot of the Indexes list on the Azure AI Search service dashboard in the Azure portal.

  3. Selecione a guia Campos para exibir o esquema de índice.

    Verifique quais campos são Filtráveis ou Classificáveis para saber quais consultas escrever.

    Screenshot that shows the schema definition for an index in the Azure AI Search service in the Azure portal.

Adicionar ou alterar campos

Na guia Campos, você pode criar um novo campo usando Adicionar campo com nome, tipo de dados suportado e atribuições.

Alterar campos existentes é mais difícil. Os campos existentes têm uma representação física no índice, portanto, não são modificáveis, nem mesmo no código. Para alterar fundamentalmente um campo existente, você precisa criar um novo campo que substitua o original. Outras construções, como perfis de pontuação e opções de CORS, podem ser adicionadas a um índice a qualquer momento.

Para entender claramente o que você pode e o que não pode editar durante o design do índice, reserve um minuto para visualizar as opções de definição do índice. As opções cinzentas na lista de campos indicam valores que não podem ser modificados ou eliminados.

Consultar com o Explorador de procura

Agora você tem um índice de pesquisa que pode ser consultado com o explorador de pesquisa. O explorador de pesquisa envia chamadas REST que estão em conformidade com a API REST de pesquisa POST. A ferramenta suporta sintaxe de consulta simples e sintaxe de consulta Lucene completa.

  1. No separador Explorador de pesquisa, introduza texto para pesquisar.

    Screenshot that shows how to enter and run a query in the Search Explorer tool.

  2. Use o Minimapa para saltar rapidamente para áreas não visíveis da saída.

    Screenshot that shows long results for a query in the Search Explorer tool and the mini-map.

  3. Para especificar a sintaxe, alterne para o modo de exibição JSON.

    Screenshot of the JSON view selector.

Exemplo de consultas para índice de exemplo de hotéis

Os exemplos a seguir assumem a exibição JSON e a versão 2023-11-01 da API REST.

Exemplos de filtros

Estacionamento, tags, data de renovação, classificação e localização são filtráveis.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

Os filtros booleanos assumem "true" por padrão.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

A pesquisa geoespacial é baseada em filtros. A geo.distance função filtra todos os resultados para dados posicionais com base no especificado Location e geography'POINT coordenadas. A consulta procura hotéis que estejam a menos de 5 quilômetros das coordenadas -122.12 47.67de latitude, que é "Redmond, Washington, EUA". A consulta exibe o número total de correspondências &$count=true com os nomes dos hotéis e os locais de endereço.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

Exemplos completos de sintaxe Lucene

A sintaxe padrão é simples, mas se você quiser pesquisa difusa ou aumento de termos ou expressões regulares, especifique a sintaxe completa.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

Por padrão, termos de consulta com erros ortográficos, como seatle for Seattle , não retornam correspondências em uma pesquisa típica. O queryType=full parâmetro invoca o analisador de ~ consulta Lucene completo, que suporta o operando til. Quando esses parâmetros estão presentes, a consulta executa uma pesquisa difusa para a palavra-chave especificada. A consulta procura resultados correspondentes juntamente com resultados que são semelhantes, mas não uma correspondência exata para a palavra-chave.

Reserve um minuto para tentar algumas dessas consultas de exemplo para o seu índice. Para saber mais sobre consultas, consulte Consultando no Azure AI Search.

Clean up resources (Limpar recursos)

Quando você trabalha em sua própria assinatura, é uma boa ideia no final de um projeto identificar se você ainda precisa dos recursos que criou. Os recursos que deixar em execução podem custar dinheiro. Pode eliminar recursos individualmente ou eliminar o grupo de recursos para eliminar todo o conjunto de recursos.

Você pode encontrar e gerenciar recursos para seu serviço no portal do Azure em Todos os recursos ou Grupos de recursos no painel esquerdo.

Se você usa um serviço gratuito, lembre-se de que o limite é de três índices, indexadores e fontes de dados. Você pode excluir itens individuais no portal do Azure para ficar abaixo do limite.

Próximos passos

Experimente um assistente do portal do Azure para gerar um aplicativo Web pronto para uso que seja executado em um navegador. Use este assistente no pequeno índice criado neste início rápido ou use um dos conjuntos de dados de exemplo internos para uma experiência de pesquisa mais avançada.