Encontre respostas para perguntas frequentes sobre a IA do Azure Search.
Geral
O que é a IA do Azure Search?
O Azure AI Search fornece um mecanismo de pesquisa dedicado e um armazenamento persistente do conteúdo pesquisável para cenários de pesquisa de texto completo e vetor. Isso também inclui a IA opcional e integrada para extrair mais texto e estrutura do conteúdo bruto e para dividir em partes e vetorizar conteúdo para busca em vetores.
Como faço para trabalhar com o Azure AI Search?
O fluxo de trabalho primário é criar, carregar e consultar um índice. Embora você possa usar o portal do Azure para a maioria das tarefas, a Pesquisa de IA do Azure deve ser usado programaticamente, tratando solicitações do código do cliente. O suporte programático é fornecido por meio de APIs REST e bibliotecas de clientes em SDKs de .NET, Python, Java e JavaScript para Azure.
O "Azure Search", o "Azure Cognitive Search" e a "IA do Azure Search" são o mesmo produto?
Em outubro de 2019, o Azure Search foi renomeado para Azure Cognitive Search para refletir o uso expandido (ainda opcional) de habilidades cognitivas e processamento de IA nas operações de serviço. O Azure Cognitive Search foi renomeado para IA do Azure Search em outubro de 2023 para se alinhar aos serviços de IA do Azure.
Quais idiomas têm suporte?
No caso dos vetores, os modelos de inserção usados determinam a experiência linguística.
Para cadeias de caracteres e números não vetoriais, o analisador padrão usado para a tokenização é o Lucene padrão, que é independente de linguagem. Caso contrário, o suporte à linguagem é expresso por meio de analisadores de idiomas que aplicam regras linguísticas ao conteúdo de entrada (indexação) e de saída (consultas). Alguns recursos, como ortográfico e regravação de consulta, estão limitados a um subconjunto de idiomas.
Como integrar a pesquisa à minha solução?
O código do cliente deve chamar as bibliotecas de cliente SDK do Azure ou APIs REST para se conectar a um índice de pesquisa, formular consultas e manipular respostas. Você também pode escrever código que cria e atualiza um índice ou executa indexadores programaticamente ou por script.
Há paridade funcional entre as várias APIs?
Nem sempre. A API REST é sempre a primeira a implementar novos recursos em versões de API de versão prévia. As bibliotecas de cliente nos SDKs do Azure escolherão novos recursos ao longo do tempo, mas serão lançadas por conta própria.
Embora as APIs REST sejam a primeira a sair com os recursos mais novos, os SDKs do Azure oferecem mais suporte à codificação e são recomendados em REST, a menos que um recurso necessário não esteja disponível.
Posso pausar o serviço e parar a cobrança?
Não é possível pausar um serviço de pesquisa. Na IA do Azure Search, os recursos de computação são alocados quando o serviço é criado. Não é possível liberar e recuperar os recursos sob demanda.
Posso atualizar ou fazer downgrade do serviço?
Os serviços criados antes de abril de 2024 em regiões selecionadas podem ser atualizados para clusters de maior capacidade. Não há suporte para o downgrade do serviço.
Para obter mais capacidade, você também pode mudar para um tipo de preço mais alto. Sua região não pode ter restrições de capacidade na camada mais alta e você só pode mover entre as camadas Básica e Standard (S1, S2 e S3), como ir de Basic para S1. Atualmente, você não pode alternar para uma camada inferior.
Posso renomear ou mover o serviço?
O nome do serviço e a região são corrigidos para o tempo de vida do serviço.
Se eu migrar meu serviço de pesquisa para outra assinatura ou outro grupo de recursos, devo esperar que haja tempo de inatividade?
Contanto que você siga a lista de verificação antes de mover os recursos e conclua cada etapa, não deve haver tempo de inatividade.
Por que vejo limites de armazenamento diferentes para serviços de pesquisa de mesma camada?
Os limites de armazenamento podem variar de acordo com a data de criação do serviço. Na maioria das regiões com suporte, os serviços mais recentes têm limites de armazenamento mais altos do que os serviços mais antigos, mesmo que estejam na mesma camada. No entanto, talvez você possa atualizar seu serviço antigo para acessar os novos limites.
Indexação
O que significa "indexação" na IA do Azure Search?
Refere-se à ingestão, análise e armazenamento de conteúdo textual e tokens que preenchem um índice de pesquisa. A indexação cria indexadores invertidos e outras estruturas de dados físicos que dão suporte à recuperação de informações.
Ele criará índices de vetor se o esquema incluir campos de vetor.
Posso mover, fazer backup e restaurar índices?
Não há suporte nativo para a portabilidade de índices. Os índices de pesquisa são considerados estruturas de dados downstream, aceitando o conteúdo de outras fontes de dados que coletam dados operacionais. Dessa forma, não há suporte integrado para fazer o back-up e restaurar índices porque a expectativa é que você reconstrua um índice dos dados de origem se você o excluiu ou quis movê-lo.
No entanto, se desejar mover um índice entre os serviços de pesquisa, é possível experimentar o código de exemplo index-backup-restore neste repositório de exemplo .NET da IA do Azure Search. Há também uma versão Python de backup e restauração.
Eu poderei restaurar meu índice ou serviço depois que ele for excluído?
Não, se você excluir um serviço ou índice da IA do Azure Search, não será possível recuperá-lo. Quando você exclui um serviço de pesquisa, todos os índices no serviço são excluídos permanentemente.
Posso indexar de Banco de Dados SQL réplicas?
Se você estiver usando o indexador de pesquisa para Banco de Dados SQL do Azure, não haverá restrições sobre o uso de réplicas primárias ou secundárias como uma fonte de dados ao criar um índice do zero. No entanto, a atualização de um índice com atualizações incrementais (com base em registros modificados) exige a réplica primária. Esse requisito vem do Banco de Dados SQL, que garante o controle de alterações somente em réplicas primárias. Se você tentar usar réplicas secundárias para uma carga de trabalho de atualização do índice, não há nenhuma garantia de que obterá todos os dados.
Vetores
O que é a pesquisa vetorial?
A busca em vetores é uma técnica que localiza os documentos mais semelhantes comparando suas representações de vetor. Como o objetivo de uma representação de vetor é capturar as características essenciais de um item em um formato numérico, as consultas de vetor podem identificar conteúdo semelhante mesmo se não houver correspondências explícitas com base em palavras-chave ou marcas. Quando um usuário executa uma pesquisa, a consulta é resumida em uma representação de vetor e o mecanismo de busca em vetores identifica os documentos mais parecidos. Para melhorar a eficiência em bancos de dados grandes, a busca em vetores geralmente fornece os vizinhos mais próximos aproximados para um vetor de consulta. Confira a visão geral sobre busca em vetores para obter as especificidades da oferta de vetor da Pesquisa de IA do Azure.
A IA do Azure Search dá suporte à busca em vetores?
A IA do Azure Search dá suporte à indexação e recuperação de vetor. Ele pode agrupar e vetorizar cadeias de caracteres de consulta e conteúdo se você usar vetorização integrada e assumir uma dependência de indexadores e conjuntos de habilidades.
Como a busca em vetores funciona na IA do Azure Search?
Com a pesquisa de vetor autônomo, primeiro você usa um modelo de inserção para transformar conteúdo em uma representação de vetor dentro de um espaço de inserção. Em seguida, você pode fornecer esses vetores em um conteúdo de documento ao índice de pesquisa para indexação. Para atender às solicitações de pesquisa, use o mesmo modelo de inserção para transformar a consulta de pesquisa em uma representação de vetor e a pesquisa de vetor localiza os vetores mais semelhantes e retorna os documentos correspondentes.
Na IA do Azure Search, você pode indexar dados vetoriais como campos em documentos, além de texto e outros tipos de conteúdo. Há vários tipos de dados para campos de vetor.
Consultas vetoriais podem ser emitidas d forma autônoma ou combinadas a outros tipos de consulta, incluindo consultas de termo e filtros na mesma solicitação de pesquisa.
A IA do Azure Search pode vetorizar meu conteúdo ou consultas?
No momento, a vetorização integrada interna está Disponível para o público geral.
Meu serviço de pesquisa oferece suporte à busca em vetores?
A maioria dos serviços existentes dá suporte à busca em vetores. Se você estiver usando um pacote ou uma API que dê suporte à busca em vetores e à criação de índice falhar, o serviço de pesquisa subjacente não oferecerá suporte à busca em vetores e um novo serviço deverá ser criado. Isso pode ocorrer em um pequeno subconjunto de serviços criados antes de 1º de janeiro de 2019.
Posso adicionar a busca em vetores a um índice existente?
Se o serviço de pesquisa der suporte à busca em vetores, tanto os índices existentes quanto os novos poderão acomodar campos vetoriais.
Por que vejo limites de tamanho de índice de vetor diferentes entre meus novos serviços de pesquisa e os serviços existentes?
A Pesquisa de IA do Azure distribuiu limites aprimorados de tamanho de índice de vetor no mundo todo para novos serviços de pesquisa, mas algumas regiões têm restrições de capacidadee algumas regiões não têm a infraestrutura necessária. Novos serviços de pesquisa criados após maio de 2024 em regiões com suporte devem ver limites de tamanho de índice vetor aumentados. Como alternativa, se você tiver um serviço existente em uma região com suporte, poderá atualizar seu serviço para acessar os novos limites.
Por que meu índice de vetor mostra armazenamento zero?
Somente índices de vetor que usam o relatório de algoritmo hierárquico de HNSW (Navigable Small World) no tamanho do índice vetor no portal do Azure. Se o índice usar o KNN exaustivo, o tamanho do índice vetor será relatado como zero, mesmo que o índice contenha vetores.
Como fazer para habilitar a busca em vetores em um índice de pesquisa?
Para habilitar a busca em vetores em um índice, é preciso:
Adicione um ou mais campos de vetor a uma coleção de campos.
Adicionar uma seção "vectorSearch" ao esquema de índice que especifica a configuração usada pelos campos de busca em vetores, incluindo os parâmetros do algoritmo usado de vizinho mais próximo aproximado, como HNSW.
Use a versão estável mais recente, 2024-07-01 ou um SDK do Azure para criar ou atualizar o índice, carregar documentos e emitir consultas. Para obter mais informações, consulte Criar um índice de vetor.
Consultas
Onde a execução da consulta ocorre?
As consultas são executadas em apenas um índice de pesquisa hospedado em seu serviço de pesquisa. Você não pode unir vários índices para pesquisar conteúdo em dois ou mais índices, mas pode consultar índices de mesmo nome em vários serviços de pesquisa.
Por que não aparece correspondência em termos que sei que são válidos?
O mais comum é não saber que cada tipo de consulta dá suporte a níveis de análise linguística e a comportamentos de pesquisa diferentes. A pesquisa de texto completo, que é a carga de trabalho predominante, inclui uma fase de análise de linguagem que divide os termos de acordo com a raiz. Esse aspecto da análise de consulta amplia as possíveis correspondências, pois o termo indexado corresponde a um número maior de variantes.
Consultas difusas, de regex e com caractere curinga, no entanto, não são analisadas como consultas de termos ou frases comuns e podem levar a uma recuperação ruim se a consulta não coincidir com o formulário analisado da palavra no índice de pesquisa. Veja mais informações sobre verificação e análise de consultas em arquitetura de consulta.
Por que minhas pesquisas de curinga estão lentas?
A maioria das consultas de pesquisa com caractere curinga, como prefixo, difusa e regex, são reconfiguradas internamente com termos correspondentes no índice de pesquisa. Esse processamento extra adiciona latência. Além disso, consultas de pesquisa amplas, como a*
, por exemplo, provavelmente serão reescritas com muitos termos, que podem ser lentas. Para pesquisas com muitos caracteres curingas, considere definir um analisador personalizado.
Posso pesquisar em vários índices?
Não, uma consulta é sempre direcionada a um único índice.
Por que a pontuação de pesquisa é uma constante de 1,0 para cada jogo?
As pontuações de pesquisa são geradas para consultas de pesquisa de texto completo, com base nas propriedades estatísticas dos termos de correspondência e ordenados do mais alto para o mais baixo do conjunto de resultados. Os tipos de consulta que não são pesquisa de texto completo (curinga, prefixo, regex) não são classificados por uma pontuação de relevância. Este é o comportamento padrão. Uma pontuação constante permite que as correspondências encontradas pela expansão de consulta sejam incluídas nos resultados sem afetar a classificação.
Por exemplo, suponha que a entrada "tour*" em uma pesquisa com curinga produz correspondências em "tours", "tourettes "e "tourmaline". Dada a natureza desses resultados, não é possível inferir de maneira razoável quais termos são mais valiosos do que outros. Por esse motivo, as frequências de termos são ignoradas ao pontuar resultados em consultas dos tipos caractere curinga, prefixo e regex. Os resultados da pesquisa com base em uma entrada parcial recebem uma pontuação constante para evitar a tendência de correspondências possivelmente inesperadas.
Segurança
Onde a IA do Azure Search armazena os dados do cliente?
Ele armazena os seus dados na área geográfica (Geo) em que o seu serviço é implantado. A Microsoft pode replicar seus dados na mesma área geográfica para alta disponibilidade e durabilidade. Para obter mais informações, confira residência de dados no Azure.
A IA do Azure Search envia dados do cliente para outros serviços fazerem o processamento?
Sim, habilidades e vetores fazem chamadas de saída da Pesquisa de IA do Azure para outros recursos do Azure ou modelos externos especificados para inserção ou chat. As chamadas para essas APIs normalmente contêm conteúdo bruto a ser processado ou consultas que são vetorizadas por um modelo de inserção. Para conexões do Azure para o Azure, o serviço envia solicitações pela rede interna. Se você adicionar uma habilidade personalizada ou um vetorizador, o indexador enviará conteúdo para o URI fornecido na habilidade personalizada pela rede pública, a menos que você configure um link privado compartilhado.
A Pesquisa de IA do Azure processa dados do cliente em outras regiões?
O processamento (vetorização ou transformações de IA aplicada) é executado na área geográfica que hospeda os serviços de IA do Azure usados pelas habilidades, os aplicativos ou funções do Azure que hospedam habilidades personalizadas ou a região do Azure OpenAI ou do Azure AI Foundry que hospeda seus modelos implantados. Esses recursos são especificados por você, para que você possa escolher se deseja implantá-los na mesma Área Geográfica do serviço de pesquisa ou não.
Se você enviar dados para modelos ou serviços externos (não do Azure), o local de processamento será determinado pelo serviço externo.
Posso controlar o acesso aos resultados da pesquisa com base na identidade do usuário?
Você poderá implementar uma solução que associe documentos a uma identidade de usuário. Normalmente, os usuários autorizados a executar seu aplicativo também estão autorizados a ver todos os resultados da pesquisa. A IA do Azure Search não tem suporte integrado para permissões em nível de linha ou de documento, mas você pode implementar filtros de segurança como uma solução alternativa. Para obter etapas e script, confira Introdução à amostra de chat empresarial do Python usando a RAG.
Posso controlar o acesso a operações com base na identidade do usuário?
Sim, você pode usar a autorização baseada em função para operações de plano de dados por conteúdo.
Posso usar o portal do Azure para exibir e gerenciar o conteúdo da pesquisa se o serviço de pesquisa estiver atrás de um firewall IP ou de um ponto de extremidade privado?
Você pode usar o portal do Azure em um serviço de pesquisa protegido por rede se criar uma exceção de rede que permita o acesso ao cliente e ao portal. Para mais informações, confira conectar-se por meio de um firewall IP ou conectar-se por meio de um ponto de extremidade privado.
Próximas etapas
Se a sua pergunta não estiver respondida aqui, confira as fontes a seguir para ver mais perguntas e respostas.
Stack Overflow: IA do Azure Search
Como funciona a pesquisa de texto completo na IA do Azure Search
O que é a IA do Azure Search?