Partilhar via


Armazenamentos vetoriais para pesquisa de arquivos

Os objetos de armazenamento vetorial dão à ferramenta de pesquisa de arquivos a capacidade de pesquisar seus arquivos. Quando adicionas um ficheiro a uma loja vetorial, o serviço analisa, divide em partes, incorpora e indexa o ficheiro para que a ferramenta possa executar tanto uma pesquisa por palavras-chave quanto uma pesquisa semântica.

Os armazenamentos vetoriais podem ser ligados tanto a agentes como a conversas. Atualmente, pode-se anexar no máximo um armazenamento vetorial a um agente e, no máximo, um armazenamento vectorial a uma conversa. Para uma visão conceptual das conversas, veja Componentes de tempo de execução do Agente.

Na atual experiência do desenvolvedor de agentes, a geração de respostas utiliza respostas e conversas. Alguns SDKs e samples mais antigos usam o termo run. Se vires ambos os termos, trata execução como geração de resposta. Para orientações sobre migração, veja Como migrar para o novo serviço de agentes.

Para obter uma lista de limites para pesquisa vetorial (como tamanhos máximos de arquivo permitidos), consulte o artigo cotas e limites .

Pré-requisitos

Limites principais e incumprimentos

Os armazenamentos vetoriais são frequentemente o primeiro ponto onde os fluxos de trabalho de recuperação falham em produção, por isso ajuda conhecer as configurações padrão e os limites fixos.

  • Ficheiros por armazenamento vetorial: Cada armazenamento vetorial pode conter até 10.000 ficheiros.
  • Anexos: Pode anexar no máximo um armazenamento vetorial a um agente e no máximo um armazenamento vetorial a uma conversa.
  • Definições padrão de recuperação (pesquisa de ficheiros):
    • Tamanho do bloco: 800 tokens
    • Sobreposição de blocos: 400 tokens
    • Modelo de incorporação: text-embedding-3-large em 256 dimensões
    • Número máximo de partes adicionadas ao contexto: 20

Para tamanhos de ficheiros e limites de tokens, veja quotas e limites.

Conceitos-chave

Term Meaning
Armazém de Vetores Um contentor para conteúdo pesquisável de ficheiros (fragmentos e embeddings) utilizado pela ferramenta de busca de ficheiros.
Ingestão O processo assíncrono que analisa, fragmenta, incorpora e indexa um ficheiro para pesquisa.
Prontidão Se a ingestão foi concluída e o armazenamento vetorial é pesquisável.
Política de expiração Uma política de ciclo de vida que desativa um armazenamento vetorial após um período de inatividade.

A pesquisa de ficheiros aplica as melhores práticas de recuperação para ajudar o seu agente a encontrar o conteúdo certo dos seus ficheiros. Dependendo da consulta e dos seus dados, a ferramenta pode:

  • Reescreva as consultas dos utilizadores para melhorar os resultados da recuperação.
  • Divida consultas complexas em múltiplas pesquisas.
  • Executa pesquisas tanto por palavras-chave como semânticas nos armazenamentos de vetores de conversação e de agentes.
  • Reclassificar os resultados antes de os adicionar ao contexto do modelo.

Para as definições atuais de recuperação padrão (tamanho e sobreposição de blocos, modelo de embedding e o número máximo de blocos adicionados ao contexto), consulte Como funciona.

Onde vivem os seus dados (configuração básica vs padrão de agente)

Onde vivem os ficheiros e recursos de pesquisa depende da configuração do seu agente:

  • Configuração básica do agente: A pesquisa de ficheiros utiliza recursos de storage e pesquisa geridos pela Microsoft.
  • Configuração padrão do agente: A pesquisa de ficheiros usa os recursos Azure Blob Storage e Azure AI Search que ligas durante a configuração, para que os teus ficheiros permaneçam na tua storage.

Para configurar o seu ambiente, veja Configuração do ambiente do Agente. Para mais detalhes, consulte Dependência na configuração do agente.

Assegure a prontidão do armazenamento vetorial antes de criar respostas

Assegura-te de que todos os ficheiros numa loja vetorial são totalmente processados antes de criares uma resposta. Este passo garante que todos os dados no seu armazenamento vetorial são pesquisáveis.

Para verificar a prontidão, use os auxiliares de sondamento do SDK (por exemplo, criar e inquirir e carregar e inquirir) ou consultar o objeto de armazenamento vetorial até que o seu estado esteja concluído. Para exemplos de código, consulte a ferramenta de pesquisa de ficheiros para agentes.

Durante a ingestão, um armazenamento vetorial pode estar em estado in_progress. Quando a ingestão termina, o estado muda para concluído.

Como plano B, a geração de respostas inclui uma espera máxima de 60 segundos quando o armazenamento vetorial da conversa contém ficheiros que ainda estão a ser processados. Este tempo de espera de contingência não se aplica ao armazenamento vetorial do agente.

Lista de verificação de fluxo de trabalho de ponta a ponta

Use esta lista de verificação para validar um fluxo de trabalho de armazenamento vetorial funcional desde a ingestão até à gestão do ciclo de vida.

  1. Decide se usas configuração básica de agentes ou configuração padrão, com base em onde queres que os teus ficheiros e recursos de pesquisa fiquem. Veja onde vivem os seus dados (configuração básica vs padrão de agente).
  2. Carregue seus arquivos e crie uma loja vetorial. Para um exemplo passo a passo, consulte Carregar ficheiros e adicioná-los a uma loja vetorial.
  3. Espera que a ingestão termine antes de gerares respostas. Utilize os auxiliares de sondagem do SDK ou sonde a loja vetorial até que o seu estado esteja concluído e não restem ficheiros em progresso. Consulte Garantir a prontidão do armazenamento vetorial antes de criar respostas.
  4. Anexa o armazenamento vetorial ao agente ou conversa que usas para pesquisa de ficheiros. Tenha em mente os limites do apego. Ver armazenamentos vetoriais.
  5. Crie uma resposta que use pesquisa de ficheiros e verifique se a ferramenta está a recuperar das fontes esperadas. Veja Criar resposta com pesquisa de ficheiros e Verificar resultados.
  6. Gerir o ciclo de vida: remover ficheiros que já não precisa e planear políticas de expiração (especialmente para lojas vetoriais criadas por ajudantes de conversa). Veja Armazenamentos vetoriais e Armazenamentos vetoriais de conversação têm políticas de expiração padrão.

Adicionar ficheiros e gerir armazenamentos vetoriais

Adicionar ficheiros a armazenamentos vetoriais é uma operação assíncrona. Para garantir que a ingestão está concluída, utilize os auxiliares de criação e sondagem nos SDKs oficiais. Se não estiveres a usar um SDK, verifica a loja vetorial até que o seu estado esteja concluído e não restem ficheiros em progresso.

Os ficheiros também podem ser adicionados a um repositório de vetores após a sua criação, através da criação de ficheiros de armazenamento de vetores. Como alternativa, você pode adicionar vários arquivos a um repositório vetorial criando lotes de até 500 arquivos.

Quando você carrega um arquivo para criar um repositório vetorial, o sistema automaticamente:

  1. Divide o teu conteúdo em partes geríveis.
  2. Converte cada bloco em vetores de alta dimensão usando modelos de embedding.
  3. Armazena estes vetores num índice de pesquisa otimizado.
  4. Cria associações entre os vetores e o teu conteúdo original.

Remover ficheiros dos armazenamentos vetoriais

Pode remover ficheiros de um armazenamento vetorial de duas formas diferentes:

  • Apaga o objeto do ficheiro de armazenamento vetorial.
  • Apaga o objeto de ficheiro subjacente. Isto remove o ficheiro de todas as configurações de vector store em todos os agentes e conversas da sua organização.

Gerir o ciclo de vida com apólices de expiração

As políticas de expiração ajudam a gerir o ciclo de vida da loja vetorial. Você pode definir essas políticas ao criar ou atualizar o objeto de armazenamento de vetores.

Os armazenamentos vetoriais de conversação têm políticas de expiração padrão

Os armazenamentos vetoriais criados usando ajudantes de conversa têm uma política de expiração padrão de sete dias após a última atividade (definida como a última vez que o armazenamento vetorial foi usado durante a geração de respostas).

Quando um armazenamento vetorial expira, a geração de respostas para essa conversa falha. Para resolver o problema, recria um novo armazenamento vetorial com os mesmos ficheiros e volta a anexá-lo à conversa. Para mais detalhes, consulte as lojas vetoriais de conversa têm políticas de expiração por defeito.

Tipos de ficheiros suportados e limites de chave

Para a lista de tipos de ficheiros suportados e os requisitos de codificação, veja Tipos de ficheiros suportados.

Principais limites a ter em conta:

  • Pode associar, no máximo, um armazenamento vetorial a um agente e, no máximo, um armazenamento vetorial a uma conversa.
  • O tamanho do ficheiro e os limites dos tokens variam consoante a funcionalidade. Ver Quotas e limites.

Solução de problemas

  • O seu armazenamento vetorial ainda não é pesquisável: Aguarde que a ingestão termine. Utilize os auxiliares de sondagem do SDK ou sonde o armazenamento vetorial até que o seu estado esteja concluído.
  • A geração de respostas falha após alguns dias: O seu armazenamento de vetores de conversa pode ter expirado. Recriar um novo armazenamento vetorial com os mesmos ficheiros e voltar a anexá-lo.
  • Um ficheiro desapareceu de múltiplos agentes ou conversas: Pode ter eliminado o objeto de ficheiro subjacente, o que remove o ficheiro de todas as configurações de vector store na sua organização.
  • Falhas nos carregamentos ou na ingestão: Verifique o tamanho do ficheiro e os limites dos tokens em Quotas e limites.

Próximos passos