Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
A geração aumentada por recuperação, ou RAG, é uma das abordagens mais comuns para a construção de aplicações de IA generativas. A engenharia de recursos no Unity Catalog suporta aplicativos RAG estruturados usando tabelas on-line. Você cria uma tabela online para os dados estruturados de que a aplicação RAG precisa e hospeda-a em um endpoint de serviço de funcionalidades. A aplicação RAG utiliza o ponto de extremidade para acessar funcionalidades e procurar dados relevantes da tabela online.
As etapas típicas são as seguintes:
- Crie um ponto de extremidade de atendimento de funcionalidades.
- Crie uma LangChainTool que use o endpoint para procurar dados relevantes.
- Utilize a ferramenta no agente LangChain para recuperar dados relevantes.
- Crie um modelo de ponto de extremidade de serviço para hospedar o aplicativo LangChain.
O bloco de anotações a seguir ilustra como usar tabelas on-line Databricks e pontos de extremidade de serviço de recursos para aplicativos de geração aumentada (RAG) de recuperação.