Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Os objetos de armazenamento vetorial dão à ferramenta de pesquisa de ficheiros a capacidade de pesquisar os teus ficheiros. Adicionar um ficheiro a um repositório vetorial fornece ao modelo Foundry do agente informação além dos seus dados de treino. O serviço analisa, fragmenta, incorpora e indexa o ficheiro para que a ferramenta possa executar tanto pesquisa por palavras-chave como semântica.
Os armazenamentos vetoriais podem ser ligados tanto a agentes como a conversas. Atualmente, pode-se anexar no máximo um armazenamento vetorial a um agente e, no máximo, um armazenamento vectorial a uma conversa. Para uma visão conceptual das conversas, veja Componentes de tempo de execução do Agente.
Na experiência atual do desenvolvedor de agentes, a geração de respostas usa respostas e conversas. Alguns SDKs e samples mais antigos usam o termo run. Se vires ambos os termos, trata execução como geração de resposta. Para orientações sobre migração, veja Como migrar para o novo serviço de agentes.
Para uma lista de limites para pesquisa vetorial (como tamanhos máximos permitidos de ficheiros), consulte o artigo sobre quotas e limites .
Pré-requisitos
- Um projeto Microsoft Foundry.
- Um agente ou conversa que utiliza a ferramenta de pesquisa de ficheiros .
- Se usares a configuração padrão de agentes, liga o Armazenamento de Blobs do Azure e o Pesquisa de IA do Azure durante a configuração para que os teus ficheiros permaneçam no teu armazenamento. Veja Configuração do ambiente do agente.
- Os papéis e permissões variam consoante a tarefa (por exemplo, criar projetos, atribuir funções para configuração padrão ou criar e editar agentes). Consulte a tabela de permissões necessárias na configuração do ambiente do Agente.
- A disponibilidade de funcionalidades pode variar consoante a região. Para conhecer a cobertura atual, veja Disponibilidade de funcionalidades do Microsoft Foundry nas regiões de nuvem.
Limites principais e incumprimentos
Os armazenamentos vetoriais são frequentemente o primeiro ponto onde os fluxos de trabalho de recuperação falham em produção, por isso ajuda conhecer os padrões e limites rígidos.
- Ficheiros por armazenamento vetorial: Cada armazenamento vetorial pode conter até 10.000 ficheiros.
- Anexos: Pode anexar no máximo um armazenamento vetorial a um agente e um armazenamento vetorial a uma conversa.
-
Definições padrão de recuperação (pesquisa de ficheiros):
- Tamanho do bloco: 800 fichas
- Sobreposição de blocos: 400 tokens
- Modelo de embedding: text-embedding-3-large com 256 dimensões
- Número máximo de blocos adicionados ao contexto: 20
Para tamanhos de ficheiros e limites de tokens, veja quotas e limites.
Conceitos-chave
| Termo | Significado |
|---|---|
| Armazenamento vetorial | Um contentor para conteúdo pesquisável de ficheiros (chunks e embeddings) usado pela ferramenta de pesquisa de ficheiros. |
| Ingestão | O processo assíncrono que analisa, fragmenta, incorpora e indexa um ficheiro para pesquisa. |
| Prontidão | Se a ingestão foi concluída e o armazenamento vetorial é pesquisável. |
| Política de expiração | Uma política de ciclo de vida que expira um armazenamento de vetores após um período de inatividade. |
Como funcionam os armazenamentos vetoriais com a pesquisa de ficheiros
A pesquisa de ficheiros aplica as melhores práticas de recuperação para ajudar o seu agente a encontrar o conteúdo certo dos seus ficheiros. Dependendo da consulta e dos seus dados, a ferramenta pode:
- Reescreva as consultas dos utilizadores para melhorar a recuperação.
- Divida consultas complexas em múltiplas pesquisas.
- Execute pesquisas tanto por palavras-chave como semânticas em armazenamentos de agentes e de vetores de conversa.
- Reclassificar os resultados antes de os adicionar ao contexto do modelo.
Para as configurações padrão de recuperação atuais (tamanho e sobreposição de blocos, modelo de embedding e o número máximo de blocos adicionados ao contexto), consulte Como funciona.
Onde vivem os seus dados (configuração básica vs padrão de agente)
Onde vivem os ficheiros e recursos de pesquisa depende da configuração do seu agente:
- Configuração básica do agente: A pesquisa de ficheiros utiliza armazenamento e recursos de pesquisa geridos por Microsoft.
- Configuração padrão do agente: A pesquisa de ficheiros usa os recursos Armazenamento de Blobs do Azure e Pesquisa de IA do Azure que ligas durante a configuração, para que os teus ficheiros permaneçam no teu armazenamento.
Para configurar o seu ambiente, veja Configuração do ambiente do Agente. Para mais detalhes, consulte Dependência na configuração do agente.
Assegure a prontidão do armazenamento vetorial antes de criar respostas
Assegura-te de que todos os ficheiros numa loja vetorial são totalmente processados antes de criares uma resposta. Este passo garante que todos os dados no seu armazenamento vetorial são pesquisáveis.
Para verificar a prontidão, use os auxiliares de sondamento do SDK (por exemplo, criar e inquirir e carregar e inquirir) ou consultar o objeto de armazenamento vetorial até que o seu estado esteja concluído. Para exemplos de código, consulte a ferramenta de pesquisa de ficheiros para agentes.
Durante a ingestão, um armazenamento vetorial pode estar com o estado in_progress. Quando a ingestão termina, o estado muda para concluído.
Como plano B, a geração de respostas inclui uma espera máxima de 60 segundos quando o armazenamento vetorial da conversa contém ficheiros que ainda estão a ser processados. Este tempo de espera de contingência não se aplica à memória vetorial do agente.
Lista de verificação de fluxo de trabalho de ponta a ponta
Use esta lista de verificação para validar um fluxo de trabalho de armazenamento vetorial funcional desde a ingestão até à gestão do ciclo de vida.
- Decide se usas configuração básica de agentes ou configuração padrão, com base em onde queres que os teus ficheiros e recursos de pesquisa fiquem. Veja onde vivem os seus dados (configuração básica vs padrão de agente).
- Carrega os teus ficheiros e cria uma loja vetorial. Para um exemplo passo a passo, consulte Carregar ficheiros e adicioná-los a uma loja vetorial.
- Espera que a ingestão termine antes de gerares respostas. Use utilitários de sondagem do SDK ou sonde a loja vetorial até que o seu estado esteja concluído e não restem ficheiros em progresso. Consulte Garantir a prontidão do armazenamento vetorial antes de criar respostas.
- Anexa o armazenamento vetorial ao agente ou conversa que usas para pesquisa de ficheiros. Tenha em mente os limites do apego. Consulte armazenamentos vetoriais.
- Crie uma resposta que use pesquisa de ficheiros e verifique se a ferramenta está a recuperar das fontes esperadas. Veja Criar resposta com pesquisa de ficheiros e Verificar resultados.
- Gerir o ciclo de vida: remover ficheiros que já não precisa e planear políticas de expiração (especialmente para lojas vetoriais criadas por ajudantes de conversa). Veja Armazenamentos vetoriais e Armazenamentos vetoriais de conversa têm políticas de expiração como padrão.
Adicionar ficheiros e gerir armazenamentos vetoriais
Adicionar ficheiros a armazenamentos vetoriais é uma operação assíncrona. Para garantir que a ingestão está concluída, utilize os auxiliares de criação e sondagem nos SDKs oficiais. Se não estiver a usar um SDK, consulte a loja vetorial até que o estado seja concluído e não restem ficheiros em progresso.
Os ficheiros também podem ser adicionados a uma loja vetorial depois de esta ser criada, criando ficheiros de armazenamento vetorial. Em alternativa, pode adicionar vários ficheiros a um armazenamento vetorial criando lotes de até 500 ficheiros.
Quando carrega um ficheiro para criar um armazenamento vetorial, o sistema automaticamente:
- Divide o teu conteúdo em partes geríveis.
- Converte cada bloco em vetores de alta dimensão usando modelos de embedding.
- Armazena estes vetores num índice de pesquisa otimizado.
- Cria associações entre os vetores e o teu conteúdo original.
Remover ficheiros dos armazenamentos vetoriais
Pode remover ficheiros de um armazenamento vetorial de duas formas diferentes:
- Apaga o objeto do ficheiro de armazenamento vetorial.
- Apaga o objeto de ficheiro subjacente. Isto remove o ficheiro de todas as configurações de armazenamento vetorial para todos os agentes e conversas da sua organização.
Gerir o ciclo de vida com apólices de expiração
As políticas de expiração ajudam a gerir o ciclo de vida da loja vetorial. Pode definir estas políticas ao criar ou atualizar o objeto de armazenamento vetorial.
As lojas de vetores de conversação possuem políticas de expiração padrão
Os armazenamentos vetoriais criados usando ajudantes de conversa têm uma política de expiração padrão de sete dias após a última atividade (definida como a última vez que o armazenamento vetorial foi usado durante a geração de respostas).
Quando um armazenamento vetorial expira, a geração de respostas para essa conversa falha. Para resolver o problema, recria um novo armazenamento vetorial com os mesmos ficheiros e volta a anexá-lo à conversa. Para mais detalhes, veja as lojas vetoriais de conversa têm políticas de expiração por defeito.
Tipos de ficheiros suportados e limites de chave
Para a lista de tipos de ficheiros suportados e os requisitos de codificação, veja Tipos de ficheiros suportados.
Principais limites a ter em conta:
- Pode associar, no máximo, um armazenamento vetorial a um agente e um armazenamento vetorial a uma conversa.
- O tamanho do ficheiro e os limites dos tokens variam consoante a funcionalidade. Ver Quotas e limites.
Resolução de problemas
- O seu armazenamento vetorial ainda não é pesquisável: Espere que a ingestão termine. Use os auxiliares de sondagem do SDK ou sonde a loja vetorial até que o seu estado esteja concluído.
- A geração de respostas falha após alguns dias: O seu armazenamento de vetores de conversa pode ter expirado. Recriar um novo armazenamento vetorial com os mesmos ficheiros e voltar a anexá-lo.
- Um ficheiro desapareceu de múltiplos agentes ou conversas: Pode ter eliminado o objeto de ficheiro subjacente, o que remove o ficheiro de todas as configurações de vector store na sua organização.
- Falhas nos carregamentos ou na ingestão: Verifique o tamanho do ficheiro e os limites dos tokens em Quotas e limites.
Próximos passos
- Saiba mais sobre a ferramenta de pesquisa de ficheiros
- Revise as melhores práticas das ferramentas para obter orientações sobre fiabilidade e segurança
- Aprenda sobre os componentes de execução do agente