Entender bancos de dados vetoriais, geração aumentada de recuperação e inserções na IA
Bancos de dados vetoriais, inserções e geração aumentada de recuperação (RAG) são tecnologias cruciais para aprimorar aplicativos controlados por IA, especialmente no contexto do Azure Cosmos DB for MongoDB baseado em vCore. Entender esses conceitos é essencial para implementar funcionalidades avançadas, como a busca em vetores consultando seus próprios dados.
Entender as inserções em IA
Antes de discutirmos bancos de dados vetoriais ou sistemas de RAG, precisamos entender as inserções e sua função em aplicativos de IA. As inserções convertem itens como palavras, frases ou documentos inteiros em vetores numéricos que refletem seus significados. Por exemplo, um vetor que representa uma palavra "gato" pode ser representado da seguinte maneira:
[0.1, 0.2, 0.3, 0.4, 0.5]
Esses vetores, criados por meio de técnicas de aprendizado de máquina, ajudam os modelos de IA a entender e trabalhar com dados com mais eficiência. Os modelos de IA podem usar esses vetores para executar tarefas como classificação, clustering ou correspondência de similaridade. Elas desempenham um papel crucial em aplicativos que vão da análise de texto à pesquisa visual computacional, dando suporte a tarefas como classificar textos ou gerar imagens e código.
Em plataformas como o OpenAI do Azure, as inserções são fundamentais para ajudar os grandes modelos de linguagem a processarem e produzirem textos que espelham a comunicação humana. Elas transformam dados complexos em uma forma estruturada com a qual os modelos podem trabalhar, melhorando a capacidade dos modelos de gerar respostas relevantes e coerentes. As inserções também são essenciais para os bancos de dados vetoriais, que armazenam e recuperam dados com base nessas representações numéricas.
Explorar bancos de dados vetoriais
Cada valor no vetor é considerado uma dimensão dos dados que ele representa. Esse vetor então representa sua posição em um espaço altamente multidimensional em relação a todos os outros vetores. Esses vetores geralmente têm muitas dimensões, em que alguns dos modelos de inserção "menores" no OpenAI do Azure têm 1536 dimensões.
Os bancos de dados vetoriais salvam dados como esses vetores altamente multidimensionais criados por meio de transformações ou inserções de vários tipos de dados, como texto, imagens ou vídeos. Esses bancos de dados são excelentes para localizar rapidamente dados que correspondam semanticamente, não apenas por meio de consultas exatas. Essa capacidade é valiosa para aplicativos como localizar imagens, documentos ou produtos semelhantes.
Por exemplo, em um banco de dados vetoriais você pode pesquisar usando uma imagem ou um texto como uma consulta para encontrar outras pessoas que correspondam aproximadamente em estilo ou conteúdo. Esse processo envolve a localização de um vetor de consulta (inserção) para a entrada de pesquisa e o uso de medidas de similaridade, como similaridade cossina ou distância euclidiana para encontrar a distância entre vetores.
Portanto, se você pesquisar a palavra "gato", o banco de dados retornará os vetores mais semelhantes à palavra "gato" com base na medida de similaridade usada. Essas medidas de similaridade dependem das transformações ou inserções para classificar os resultados com base na proximidade com que correspondem à consulta.
Os bancos de dados vetoriais podem ser um componente essencial de um sistema de geração aumentada de recuperação (RAG), em que armazenam e recuperam dados para modelos de IA gerarem respostas. Usando bancos de dados vetoriais, você pode garantir que os modelos de IA recuperem e gerem respostas com base em seus dados relevantes e com reconhecimento de contexto, aumentando a precisão e a relevância das respostas.
Explorar a geração aumentada de recuperação (RAG)
Os sistemas de RAG melhoram os modelos de linguagem grandes adicionando um sistema de recuperação de informações. Esse sistema fundamenta respostas de IA em dados relevantes e específicos, como documentos e imagens vetorizados criados a partir dos dados em sua empresa.
Um sistema RAG que usa bancos de dados vetoriais normalmente segue estas etapas:
- Faz a inserção da pergunta ou consulta de entrada e recupera os dados relevantes de um banco de dados vetoriais.
- Gera uma solicitação, incluindo a entrada inicial e os dados recuperados para fornecer contexto.
- Consulta o modelo de IA generativa com a solicitação combinada para gerar uma resposta.

A integração de sistemas de RAG permite controlar com precisão os dados que seus modelos de linguagem usam, tornando suas respostas mais precisas e personalizadas. Quando vinculado a bancos de dados vetoriais que contêm seus dados, o modelo de IA pode usar seus dados, melhorando suas respostas e tornando-as mais aplicáveis e adaptadas ao contexto da sua empresa.
Em sistemas RAG, os aplicativos de IA são personalizados e gerenciados por seus dados e não o contrário.
Bancos de dados vetoriais, inserções e a geração aumentada de recuperação (RAG) são essenciais para aprimorar aplicativos controlados por IA, especialmente com o Azure Cosmos DB for MongoDB baseado em vCore e o OpenAI do Azure. As inserções convertem dados complexos em vetores numéricos que melhoram a compreensão de um modelo de IA, o que é crucial para tarefas como classificação de texto e recuperação de dados. Os bancos de dados vetoriais usam essas inserções para executar pesquisas rápidas e semanticamente controladas, melhorando consideravelmente a capacidade de recuperação de dados. Quando você combina essas tecnologias em um sistema de RAG, elas permitem que a IA forneça respostas não apenas precisas, mas também adaptadas aos seus dados específicos, melhorando a relevância e a eficácia dos seus aplicativos.