Quickstart: Criar um índice de Azure Cognitive Search no portal do Azure

Crie o seu primeiro índice de pesquisa utilizando o assistente de dados de Importação e uma fonte de dados de amostra incorporada composta por dados fictícios do hotel. O assistente guia-o através da criação de um índice de pesquisa (hotéis-índice de amostra) para que possa escrever consultas interessantes em minutos.

Embora não utilize as opções neste arranque rápido, o assistente inclui uma página para enriquecimento de IA para que possa extrair texto e estrutura a partir de ficheiros de imagem e texto não estruturado. Para uma passagem semelhante que inclua enriquecimento de IA, consulte + Quickstart: Crie um skillset.

Pré-requisitos

Verificar o espaço

Muitos clientes começam com o serviço gratuito. O nível livre é limitado a três índices, três fontes de dados e três indexantes. Certifique-se de que tem espaço para itens adicionais antes de começar. Este tutorial cria um objeto de cada.

Consulte a página geral do serviço para saber quantos índices, indexadores e fontes de dados já tem.

Listas de índices, indexadores e fontes de dados

Criar um índice e carregar dados

As consultas de pesquisa iteram num índice que contém dados pesquisáveis, metadados e construções adicionais que otimizam determinados comportamentos de pesquisa.

Para este tutorial, usamos um conjunto de dados de amostra incorporado que pode ser rastreado usando um indexante através do assistente de dados de Importação. Um indexador é um crawler específico da origem que pode ler metadados e conteúdo de origens de dados suportadas pelo Azure. Normalmente, os indexantes são utilizados programáticamente, mas no portal, pode aceder-lhes através do assistente de dados De importação .

Passo 1 - Inicie o assistente de dados de importação e crie uma fonte de dados

  1. Inicie sessão no portal do Azure com a sua conta do Azure.

  2. Encontre o seu serviço de pesquisa e na página 'Vista Geral', clique em Importar dados na barra de comando para criar e preencher um índice de pesquisa.

    Screenshot do comando de dados de importação

  3. No assistente, clique em Ligar para os seus dados>Samples>hotels-sample. Esta fonte de dados está incorporada. Se estava a criar a sua própria fonte de dados, precisaria de especificar um nome, tipo e informações de ligação. Depois de criada, torna-se uma “origem de dados existente”, que pode ser reutilizada noutras operações de importação.

    Selecionar o conjunto de dados de exemplo

  4. Continue para a próxima página.

Passo 2 - Ignore a página "Enriquecer conteúdo"

O assistente suporta a criação de um oleoduto de enriquecimento de IA para incorporar os algoritmos de IA dos Serviços Cognitivos na indexação.

Vamos saltar este passo por enquanto, e passar diretamente para o índice de alvos personalizado.

Ignorar o passo de capacidades cognitivas

Dica

Você pode passar por um exemplo de indexação de IA em um arranque rápido ou tutorial.

Passo 3 - Índice de configuração

Para o índice de amostra de hotéis incorporados, é definido um esquema de índice padrão para si. Com exceção de alguns exemplos avançados de filtro, as consultas na documentação e amostras que visam o índice de amostras de hotéis serão executadas nesta definição de índice:

Índice de hotéis gerados

Normalmente, num exercício baseado em código, a criação de índices é concluída antes de carregar dados. O assistente de dados De importação condensa estes passos gerando um índice básico para qualquer fonte de dados que possa rastejar. No mínimo, os índices precisam de um nome e de uma coleção de campos; um dos campos deve ser marcado como a chave do documento para identificar exclusivamente cada documento. Além disso, pode especificar analisadores de idiomas ou sugestores se quiser consultas autocompletas ou sugeridas.

Os campos têm tipos de dados e atributos. As caixas de verificação na parte superior são atributos de índice que controlam a forma como o campo é utilizado.

  • Recuperável significa que aparece na lista de resultados da pesquisa. Pode marcar os campos individuais como fora dos limites para os resultados da pesquisa, limpando esta caixa de verificação, por exemplo, para campos utilizados apenas em expressões de filtro.
  • A chave é o identificador de documentos único. É sempre uma corda, e é necessário.
  • Filtrado, ordenado e facetable determinam se os campos são usados numa estrutura de navegação filtrada, ordenada ou facetada.
  • Pesquisável significa que um campo está incluído na pesquisa de texto completo. As cadeias são pesquisáveis. Os campos numéricos e booleanos são frequentemente marcados como não pesquisáveis.

Os requisitos de armazenamento não variam como resultado da sua seleção. Por exemplo, se definir o atributo Retrievable em vários campos, os requisitos de armazenamento não sobem.

Por predefinição, o assistente verifica a origem de dados relativamente a identificadores exclusivos como a base do campo de chaves. As cordas são atribuídas como Recuperáveis e Pesmáveis. Os inteiros são atribuídos como Recuperáveis, Filtrados, Ordenados e Facetable.

  1. Aceite as predefinições.

    Se refazer o assistente uma segunda vez utilizando uma fonte de dados de hotéis existente, o índice não será configurado com atributos predefinidos. Terá de selecionar manualmente atributos sobre importações futuras.

  2. Continue para a próxima página.

Passo 4 - Indexador de configuração

Ainda no assistente para Importar dados, clique em Indexador>Nome e escreva um nome para o indexador.

Este objeto define um processo executável. Pode colocá-lo em horários recorrentes, mas por enquanto use a opção padrão para executar o indexante uma vez, imediatamente.

Clique em Submeter para criar e executar simultaneamente o indexante.

indexante de hotéis

Monitorizar o progresso

O assistente deve levá-lo à lista de Indexantes onde pode monitorizar o progresso. Para auto-navegação, vá à página 'Vista Geral' e clique no separador Indexantes .

Pode levar alguns minutos para o portal atualizar a página, mas você deve ver o indexante recém-criado na lista, com o estado indicando "em progresso" ou sucesso, juntamente com o número de documentos indexados.

Mensagem de indexador em curso

Ver o índice

A página geral do serviço fornece links para os recursos criados no seu serviço Azure Cognitive Search. Para ver o índice que acabou de criar, clique em Índices a partir da lista de links.

Aguarde que a página do portal se refresque. Após alguns minutos, deverá ver o índice com uma contagem de documentos e tamanho de armazenamento.

Lista de índices no painel de serviço

A partir desta lista, você pode clicar no índice de amostra de hotéis que acabou de criar, ver o esquema de índice. e opcionalmente adicionar novos campos.

O separador Fields mostra o esquema de índice. Se estiver a escrever consultas e precisar de verificar se um campo é filtrado ou ordenado, este separador mostra-lhe os atributos.

Percorra a parte inferior da lista para entrar num novo campo. Embora possa sempre criar um novo campo, na maioria dos casos, não pode mudar os campos existentes. Os campos existentes têm uma representação física no seu serviço de pesquisa e, portanto, não são modificáveis, nem mesmo em código. Para alterar fundamentalmente um campo existente, crie um novo índice, deixando cair o original.

definição de índice de exemplo

Outras construções, como a classificação de perfis e as opções de CORS, podem ser adicionadas a qualquer momento.

Para entender claramente o que pode e não pode editar durante o design do índice, desem um minuto para ver opções de definição de índice. As opções acinzentadas são um indicador de que um valor não pode ser modificado ou eliminado.

Consulta usando explorador de pesquisa

Tem agora um índice de pesquisa que pode ser consultado através do Explorador de Pesquisa.

O explorador de pesquisa envia chamadas REST que estão em conformidade com a API de Documentos de Busca. A ferramenta suporta sintaxe de consulta simples e parser de consulta lucene completo.

  1. Selecione Explorador de pesquisa na barra de comando.

    Comando do Explorador de pesquisa

  2. A partir do Índice, escolha "hotéis-índice de amostra".

    Comandos de índice e de API

  3. Na barra de pesquisa, cole uma cadeia de consulta dos exemplos abaixo e selecione Procurar.

    Botão de pesquisa e corda de consulta

Consultas de exemplo

Todas as consultas nesta secção são projetadas para Search Explorer e o índice de amostras de Hotéis. Os resultados são devolvidos como documentos verbosos da JSON. Todos os campos marcados como "recuperáveis" no índice podem aparecer em resultados. Para obter mais informações sobre consultas, consulte a consulta em Azure Cognitive Search.

Consulta Description
search=spa Consulta de texto completo simples com os melhores resultados N. O search= parâmetro é utilizado para pesquisa de palavras-chave, neste caso, devolvendo dados do hotel para aqueles que contenham spa em qualquer campo pesjável no documento.
search=beach &$filter=Rating gt 4 Consulta filtrada. Neste caso, classificações superiores a 4.
search=spa &$select=HotelName,Description,Tags &$count=true &$top=10 Consulta parametrizada. O símbolo & é utilizado para acrescentar os parâmetros da pesquisa, que podem ser especificados por qualquer ordem.
$select parâmetro devolve um subconjunto de campos para resultados de pesquisa mais concisos.
$count=true parâmetro devolve a contagem total de todos os documentos que correspondem à consulta.
$top=10 devolve o mais alto classificado 10 documentos do total. Por padrão, Azure Cognitive Search devolve os primeiros 50 melhores jogos. Pode aumentar ou diminuir a quantidade utilizando este parâmetro.
search=* &facet=Category &$top=2 Consulta faceta, usada para devolver uma contagem agregada de documentos que correspondem a um valor faceta que fornece. Numa busca vazia ou não qualificada, todos os documentos estão representados. No índice de hotéis, o campo categoria é marcado como "facetable".
search=spa &facet=Rating Faceta sobre valores numéricos. Esta consulta é faceta para classificação, em uma pesquisa de texto para "spa". O termo "Classificação" pode ser especificado como uma faceta porque o campo é marcado como recuperável, filtrado e facetable no índice, e os seus valores numéricos (1 a 5) são adequados para agrupar resultados por cada valor.
search=beach &highlight=Description &$select=HotelName, Description, Category, Tags Acerte o destaque. O termo "praia" será realçado quando aparecer no campo "Descrição".
search=seatle seguido por
search=seatle~ &queryType=full
Procura peluda. Por padrão, termos de consulta mal escritos, como assento para "Seattle", não retornam os jogos em busca típica. O primeiro exemplo não devolve resultados. A adição queryType=full invoca o parser de consulta lucene completo, que suporta o ~ operand para pesquisa confusa.
$filter=geo.distance(Location, geography'POINT(-122.12 47.67)') le 5 &search=* &$select=HotelName, Address/City, Address/StateProvince &$count=true Procura geoespacial. A consulta de exemplo filtra todos os resultados para dados posicionais, onde os resultados estão a menos de 5 km de um dado ponto, conforme especificado pelas coordenadas de latitude e longitude (este exemplo usa Redmond, Washington como ponto de origem).

Conclusões

Este tutorial proporcionou uma rápida introdução ao Azure Cognitive Search usando o portal do Azure.

Aprendeu a criar um índice de pesquisa com o assistente para Importar dados. Criou o seu primeiro indexador e aprendeu o fluxo básico de trabalho para o design de índices.

Utilizando o explorador de pesquisa no portal do Azure, aprendeu alguma sintaxe de consulta básica através de exemplos práticos que demonstraram capacidades-chave como filtros, destaques de impacto, pesquisa difusa e pesquisa geoespacial.

Limpar os recursos

Ao trabalhar na sua própria subscrição, recomendamos que verifique, depois de concluir um projeto, se irá precisar dos recursos que criou. Os recursos que deixar em execução podem custar-lhe dinheiro. Pode eliminar recursos individualmente ou eliminar o grupo de recursos para eliminar todo o conjunto de recursos.

Pode encontrar e gerir recursos no portal, utilizando a ligação de todos os recursos ou grupos de recursos no painel de navegação à esquerda.

Se estiver a utilizar um serviço gratuito, lembre-se que o limite são três índices, indexadores e fontes de dados. Pode eliminar itens individuais no portal para ficar abaixo do limite.

Passos seguintes

Utilize um assistente de portal para gerar uma aplicação web pronta a usar que funciona num browser. Pode experimentar este assistente no pequeno índice que acabou de criar ou utilizar um dos conjuntos de dados de amostras incorporados para uma experiência de pesquisa mais rica.