Partilhar via


Exemplo: usar recursos com aplicativos RAG estruturados

A geração aumentada por recuperação, ou RAG, é uma das abordagens mais comuns para a construção de aplicações de IA generativas. A engenharia de recursos no Unity Catalog suporta aplicativos RAG estruturados usando tabelas on-line. Você cria uma tabela online para os dados estruturados de que a aplicação RAG precisa e hospeda-a em um endpoint de serviço de funcionalidades. A aplicação RAG utiliza o ponto de extremidade para acessar funcionalidades e procurar dados relevantes da tabela online.

As etapas típicas são as seguintes:

  1. Crie um ponto de extremidade de atendimento de funcionalidades.
  2. Crie uma LangChainTool que use o endpoint para procurar dados relevantes.
  3. Utilize a ferramenta no agente LangChain para recuperar dados relevantes.
  4. Crie um modelo de ponto de extremidade de serviço para hospedar o aplicativo LangChain.

O bloco de anotações a seguir ilustra como usar tabelas on-line Databricks e pontos de extremidade de serviço de recursos para aplicativos de geração aumentada (RAG) de recuperação.

Tabelas online com caderno de demonstração de aplicações RAG

Obter caderno