Criar um índice vetorial em um fluxo de prompts do Azure Machine Learning (versão prévia)
Você pode usar o Azure Machine Learning para criar um índice vetorial a partir de arquivos ou pastas no seu computador, um local no armazenamento em nuvem, um ativo de dados do Azure Machine Learning, um repositório Git ou um banco de dados SQL. Atualmente, o Azure Machine Learning pode processar arquivos .txt, .md, .pdf, .xls e .docx. Você também pode reusar um índice existente da Pesquisa de IA do Azure (antigo Cognitive Search) em vez de criar um novo índice.
Quando um índice vetorial é criado, o Azure Machine Learning fragmenta os dados, cria inserções e armazena as inserções em um índice Faiss ou no índice do Azure Cognitive Search. Além disso, o Azure Machine Learning cria:
Dados de teste para sua fonte de dados.
Um exemplo de fluxo de prompts, que usa o índice vetorial que você criou. Os recursos do fluxo de prompts de exemplo incluem:
- Variantes de prompt geradas automaticamente.
- Avaliação de cada variante de prompt usando os dados de teste gerados.
- As métricas em relação a cada variante de prompt para ajudar você a escolher a melhor variante a ser executada.
Você pode usar esta amostra para continuar desenvolvendo seu prompt.
Importante
Esse recurso está atualmente em visualização pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos.
Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.
Pré-requisitos
Uma assinatura do Azure. Se você não tiver uma assinatura do Azure, crie uma conta gratuita.
Acesso ao Serviço OpenAI do Azure.
Os fluxos de prompts estão habilitados no seu workspace do Azure Machine Learning. Para habilitar os fluxos de prompts, ative Criar soluções de IA com fluxos de prompts no painel Gerenciar recursos de visualização.
Crie um índice vetorial usando o Machine Learning Studio
Selecione Fluxo de prompt no menu à esquerda.
Selecione a guia Índice Vetorial.
Selecione Criar.
Quando o formulário para criar um índice vetorial for aberto, forneça um nome para seu índice vetorial.
Selecione o tipo de fonte de dados.
Com base no tipo escolhido, forneça os detalhes de localização da origem. Em seguida, selecione Avançar.
Revise os detalhes do seu índice vetorial e, em seguida, selecione o botão Criar.
Na página de visão geral que aparece, você pode acompanhar e exibir o status da criação do índice vetorial. O processo pode demorar um pouco, dependendo do tamanho dos seus dados.
Adicionar um índice vetorial a um fluxo de prompts
Depois de criar um índice vetorial, você pode adicioná-lo a um fluxo de prompts na tela do fluxo de prompts.
Abre um fluxo de prompts existente.
No menu superior do designer do prompt flow, selecione Mais ferramentas e, em seguida, selecione Pesquisa de Índice.
A ferramenta Pesquisa de Índice é adicionada à tela. Se você não vir a ferramenta imediatamente, role até a parte inferior da tela.
Selecione a caixa de valor mlindex_content e selecione o índice. A ferramenta deve detectar o índice criado na seção "Criar um índice de vetor" do tutorial. Depois de preencher todas as informações necessárias, selecione salvar para fechar a gaveta de geração.
Insira as consultas e query_types a serem executadas no índice.
Um exemplo de uma cadeia de caracteres simples que você pode inserir nesse caso seria:
How to use SDK V2?'. Here is an example of an embedding as an input:
${embed_the_question.output}'. Passar uma cadeia de caracteres sem formatação só funcionará quando o índice de vetor estiver sendo usado no workspace que o criou.
Tipos de arquivo com suporte
Tipos de arquivo com suporte para criar um trabalho de índice de vetor: .txt
, .md
, .html
, .htm
, .py
, .pdf
, .ppt
, .pptx
, .doc
, .docx
, .xls
, .xlsx
. Todos os outros tipos de arquivo serão ignorados durante a criação.
Próximas etapas
Introdução ao RAG usando um exemplo de fluxo de prompts (visualização)
Usar repositórios de vetores com o Azure Machine Learning (versão prévia)