Quickstart: Criar um índice de Azure Cognitive Search no portal do Azure

Neste quickstart, você criará o seu primeiro índice de pesquisa usando o assistente de dados de Importação e uma fonte de dados de amostra incorporada composta por dados fictícios do hotel. O assistente guia-o através da criação de um índice de pesquisa (hotéis-índice de amostra) para que possa escrever consultas interessantes em minutos.

Embora não utilize as opções neste arranque rápido, o assistente inclui uma página para enriquecimento de IA para que possa extrair texto e estrutura a partir de ficheiros de imagem e texto não estruturado. Para uma passagem semelhante que inclua enriquecimento de IA, consulte Quickstart: Crie um skillset.

Pré-requisitos

Verificar o espaço

Muitos clientes começam com o serviço gratuito. O nível livre é limitado a três índices, três fontes de dados e três indexantes. Certifique-se de que tem espaço para itens adicionais antes de começar. Este quickstart cria um de cada objeto.

Consulte a página geral do serviço para saber quantos índices, indexadores e fontes de dados já tem.

Screenshot de listas de índices, indexadores e fontes de dados no painel de serviço.

Criar e carregar um índice

As consultas de pesquisa iteram sobre um índice que contém dados pes pesjáveis, metadados e outras construções que otimizam certos comportamentos de pesquisa.

Para este arranque rápido, vamos criar e carregar o índice usando um conjunto de dados de amostra incorporada que pode ser rastreado usando um indexante através do assistente de dados De importação. O conjunto de dados de amostras de hotéis é hospedado em Microsoft em Azure Cosmos DB e acedido sobre uma ligação interna. Não precisa da sua própria conta Cosmos ou de ficheiros de origem para aceder aos dados.

Um indexador é um crawler específico da origem que pode ler metadados e conteúdo de origens de dados suportadas pelo Azure. Normalmente, os indexantes são criados programáticamente, mas no portal, pode criá-los através do assistente de dados De importação.

Passo 1 - Inicie o assistente de dados de importação e crie uma fonte de dados

  1. Inicie sessão no portal do Azure com a sua conta do Azure.

  2. Encontre o seu serviço de pesquisa e na página 'Vista Geral', selecione dados de importação na barra de comando para criar e preencher um índice de pesquisa.

    Screenshot do comando de dados de Importação na barra de comando.

  3. No assistente, selecione Connect to your data>Samples>hotels-sample. Esta fonte de dados está incorporada. Se estava a criar a sua própria fonte de dados, precisaria de especificar um nome, tipo e informações de ligação. Depois de criada, torna-se uma “origem de dados existente”, que pode ser reutilizada noutras operações de importação.

    Screenshot da página de conjunto de dados de amostra seletiva no assistente.

  4. Continue para a próxima página.

Passo 2 - Ignore a página "Enriquecer conteúdo"

O assistente suporta a criação de um oleoduto de enriquecimento de IA para incorporar os algoritmos de IA dos Serviços Cognitivos na indexação.

Vamos saltar este passo por enquanto, e passar diretamente para o índice de alvos personalizado.

Screenshot do botão de habilidade cognitiva Skip no assistente.

Dica

Você pode passar por um exemplo de indexação de IA em um arranque rápido ou tutorial.

Passo 3 - Índice de configuração

Para o índice de amostra de hotéis incorporados, é definido um esquema de índice padrão para si. Com exceção de alguns exemplos avançados de filtro, as consultas na documentação e as amostras que visam o índice de amostras de hotéis serão executadas nesta definição de índice:

Screenshot da definição de índice de hotéis gerados no assistente.

Normalmente, num exercício baseado em código, a criação de índices é concluída antes de carregar dados. O assistente de dados De importação condensa estes passos gerando um índice básico para qualquer fonte de dados que possa rastejar. Minimamente, um índice requer um nome e uma coleção de campos. Um dos campos deve ser marcado como a chave do documento para identificar de forma única cada documento. Além disso, pode especificar analisadores de idiomas ou sugestores se quiser consultas autocompletas ou sugeridas.

Os campos têm um tipo de dados e atributos. As caixas de verificação em toda a parte superior são atributos que controlam a forma como o campo é utilizado.

  • A chave é o identificador de documentos único. É sempre uma corda, e é necessário. Só um campo pode ser a chave.
  • Recuperável significa que os conteúdos de campo aparecem na lista de resultados de pesquisa. Pode marcar os campos individuais como fora dos limites para os resultados da pesquisa, limpando esta caixa de verificação, por exemplo, para campos utilizados apenas em expressões de filtro.
  • Filtrado, ordenado e facetable determinam se os campos são usados numa estrutura de navegação filtrada, ordenada ou facetada.
  • Pesquisável significa que um campo está incluído na pesquisa de texto completo. As cadeias são pesquisáveis. Os campos numéricos e booleanos são frequentemente marcados como não pesquisáveis.

Os requisitos de armazenamento podem variar como resultado da seleção de atributos. Por exemplo, filtrado requer mais armazenamento, mas o Retrievable não.

Por predefinição, o assistente verifica a origem de dados relativamente a identificadores exclusivos como a base do campo de chaves. As cordas são atribuídas como Recuperáveis e Pesmáveis. Os inteiros são atribuídos como Recuperáveis, Filtrados, Ordenados e Facetable.

  1. Aceite as predefinições.

    Se refazer o assistente uma segunda vez utilizando uma fonte de dados de hotéis existente, o índice não será configurado com atributos predefinidos. Terá de selecionar manualmente atributos sobre importações futuras.

  2. Continue para a próxima página.

Passo 4 - Indexador de configuração

Ainda no assistente de dados de importação , selecione Indexer>Name e escreva um nome para o indexante.

Este objeto define um processo executável. Pode colocá-lo em horários recorrentes, mas por enquanto use a opção padrão para executar o indexante uma vez, imediatamente.

Selecione Submeter para criar e executar simultaneamente o indexante.

Screenshot da definição do indexante dos hotéis no assistente.

Monitorizar o progresso

O assistente deve levá-lo à lista de Indexantes onde pode monitorizar o progresso. Para auto-navegação, vá à página 'Vista Geral' e selecione o separador Indexantes .

Pode levar alguns minutos para o portal atualizar a página, mas você deve ver o indexante recém-criado na lista, com o estado indicando "em progresso" ou sucesso, juntamente com o número de documentos indexados.

Screenshot da mensagem de progresso do indexante no assistente.

Verificar resultados

A página geral do serviço fornece links para os recursos criados no seu serviço Azure Cognitive Search. Para visualizar o índice que acabou de criar, selecione Índices da lista de links.

Aguarde que a página do portal se refresque. Após alguns minutos, deverá ver o índice com uma contagem de documentos e tamanho de armazenamento.

Screenshot da lista de índices no painel de instrumentos de serviço.

A partir desta lista, você pode selecionar no índice de amostra de hotéis que acabou de criar, ver o esquema de índice. e opcionalmente adicionar novos campos.

O separador Fields mostra o esquema de índice. Se estiver a escrever consultas e precisar de verificar se um campo é filtrado ou ordenado, este separador mostra-lhe os atributos.

Percorra a parte inferior da lista para entrar num novo campo. Embora possa sempre criar um novo campo, na maioria dos casos, não pode mudar os campos existentes. Os campos existentes têm uma representação física no seu serviço de pesquisa e, portanto, não são modificáveis, nem mesmo em código. Para alterar fundamentalmente um campo existente, crie um novo índice, deixando cair o original.

Screenshot da definição do índice de amostra em portal do Azure.

Outras construções, como a classificação de perfis e as opções de CORS, podem ser adicionadas a qualquer momento.

Para entender claramente o que pode e não pode editar durante o design do índice, desem um minuto para ver opções de definição de índice. As opções acinzentadas são um indicador de que um valor não pode ser modificado ou eliminado.

Consulta usando explorador de pesquisa

Tem agora um índice de pesquisa que pode ser consultado através do Explorador de Pesquisa.

O explorador de pesquisa envia chamadas REST que estão em conformidade com a API de Documentos de Busca. A ferramenta suporta sintaxe de consulta simples e parser de consulta lucene completo.

  1. Selecione Explorador de pesquisa na barra de comando.

    Screenshot do comando Do Explorador de Busca na barra de comando.

  2. A partir do Índice, escolha "hotéis-índice de amostra".

    Screenshot das listas de seleção de Índice e API no Search Explorer.

  3. Na barra de pesquisa, cole uma cadeia de consulta dos exemplos abaixo e selecione Procurar.

    Screenshot do campo de texto de cadeia de consulta e botão de pesquisa no Search Explorer.

Executar mais consultas de exemplo

Todas as consultas nesta secção são projetadas para Search Explorer e o índice de amostras de Hotéis. Os resultados são devolvidos como documentos verbosos da JSON. Todos os campos marcados como "recuperáveis" no índice podem aparecer em resultados. Para obter mais informações sobre consultas, consulte a consulta em Azure Cognitive Search.

Consulta Description
search=spa Consulta de texto completo simples com os melhores resultados N. O search= parâmetro é utilizado para pesquisa de palavras-chave, neste caso, devolvendo dados do hotel para aqueles que contenham spa em qualquer campo pesjável no documento.
search=beach &$filter=Rating gt 4 Consulta filtrada. Neste caso, classificações superiores a 4.
search=spa &$select=HotelName,Description,Tags &$count=true &$top=10 Consulta parametrizada. O símbolo & é utilizado para acrescentar os parâmetros da pesquisa, que podem ser especificados por qualquer ordem.
$select parâmetro devolve um subconjunto de campos para resultados de pesquisa mais concisos.
$count=true parâmetro devolve a contagem total de todos os documentos que correspondem à consulta.
$top=10 devolve o mais alto classificado 10 documentos do total. Por padrão, Azure Cognitive Search devolve os primeiros 50 melhores jogos. Pode aumentar ou diminuir a quantidade utilizando este parâmetro.
search=* &facet=Category &$top=2 Consulta faceta, usada para devolver uma contagem agregada de documentos que correspondem a um valor faceta que fornece. Numa busca vazia ou não qualificada, todos os documentos estão representados. No índice de hotéis, o campo categoria é marcado como "facetable".
search=spa &facet=Rating Faceta sobre valores numéricos. Esta consulta é faceta para classificação, em uma pesquisa de texto para "spa". O termo "Classificação" pode ser especificado como uma faceta porque o campo é marcado como recuperável, filtrado e facetable no índice, e os seus valores numéricos (1 a 5) são adequados para agrupar resultados por cada valor.
search=beach &highlight=Description &$select=HotelName, Description, Category, Tags Acerte o destaque. O termo "praia" será realçado quando aparecer no campo "Descrição".
search=seatle seguido por
search=seatle~ &queryType=full
Procura peluda. Por padrão, termos de consulta mal escritos, como assento para "Seattle", não retornam os jogos em busca típica. O primeiro exemplo não devolve resultados. A adição queryType=full invoca o parser de consulta lucene completo, que suporta o ~ operand para pesquisa confusa.
$filter=geo.distance(Location, geography'POINT(-122.12 47.67)') le 5 &search=* &$select=HotelName, Address/City, Address/StateProvince &$count=true Procura geoespacial. A consulta de exemplo filtra todos os resultados para dados posicionais, onde os resultados estão a menos de 5 km de um dado ponto, conforme especificado pelas coordenadas de latitude e longitude (este exemplo usa Redmond, Washington como ponto de origem).

Conclusões

Este quickstart proporcionou uma rápida introdução à Azure Cognitive Search usando o portal do Azure.

Aprendeu a criar um índice de pesquisa com o assistente para Importar dados. Criou o seu primeiro indexador e aprendeu o fluxo básico de trabalho para o design de índices. Consulte o assistente de dados de importação em Azure Cognitive Search para obter mais informações sobre os benefícios e limitações do assistente.

Utilizando o explorador de pesquisa no portal do Azure, aprendeu alguma sintaxe de consulta básica através de exemplos práticos que demonstraram capacidades-chave como filtros, destaques de impacto, pesquisa difusa e pesquisa geoespacial.

Limpar os recursos

Ao trabalhar na sua própria subscrição, recomendamos que verifique, depois de concluir um projeto, se irá precisar dos recursos que criou. Os recursos que deixar em execução podem custar-lhe dinheiro. Pode eliminar recursos individualmente ou eliminar o grupo de recursos para eliminar todo o conjunto de recursos.

Pode encontrar e gerir recursos no portal, utilizando a ligação de todos os recursos ou grupos de recursos no painel de navegação à esquerda.

Se estiver a utilizar um serviço gratuito, lembre-se que o limite são três índices, indexadores e fontes de dados. Pode eliminar itens individuais no portal para ficar abaixo do limite.

Passos seguintes

Utilize um assistente de portal para gerar uma aplicação web pronta a usar que funciona num browser. Pode experimentar este assistente no pequeno índice que acabou de criar ou utilizar um dos conjuntos de dados de amostras incorporados para uma experiência de pesquisa mais rica.