Partilhar via


Geração aumentada de recuperação de agentes (RAG)

O Microsoft Agent Framework oferece suporte à adição fácil de recursos de RAG (Geração Aumentada de Recuperação) aos agentes, adicionando Provedores de Contexto de IA ao agente.

Usando TextSearchProvider

A TextSearchProvider classe é uma implementação pronta para uso de um provedor de contexto RAG.

Ele pode ser facilmente anexado a um ChatClientAgent usando a AIContextProviderFactory opção para fornecer recursos RAG para o agente.

// Create the AI agent with the TextSearchProvider as the AI context provider.
AIAgent agent = azureOpenAIClient
    .GetChatClient(deploymentName)
    .CreateAIAgent(new ChatClientAgentOptions
    {
        Instructions = "You are a helpful support specialist for Contoso Outdoors. Answer questions using the provided context and cite the source document when available.",
        AIContextProviderFactory = ctx => new TextSearchProvider(SearchAdapter, ctx.SerializedState, ctx.JsonSerializerOptions, textSearchOptions)
    });

O TextSearchProvider requer uma função que fornece os resultados da pesquisa dada uma consulta. Isso pode ser implementado usando qualquer tecnologia de pesquisa, por exemplo, Azure AI Search ou um mecanismo de pesquisa da Web.

Aqui está um exemplo de uma função de pesquisa simulada que retorna resultados predefinidos com base na consulta. SourceName e SourceLink são opcionais, mas se fornecidos serão usados pelo agente para citar a fonte da informação ao responder à pergunta do usuário.

static Task<IEnumerable<TextSearchProvider.TextSearchResult>> SearchAdapter(string query, CancellationToken cancellationToken)
{
    // The mock search inspects the user's question and returns pre-defined snippets
    // that resemble documents stored in an external knowledge source.
    List<TextSearchProvider.TextSearchResult> results = new();

    if (query.Contains("return", StringComparison.OrdinalIgnoreCase) || query.Contains("refund", StringComparison.OrdinalIgnoreCase))
    {
        results.Add(new()
        {
            SourceName = "Contoso Outdoors Return Policy",
            SourceLink = "https://contoso.com/policies/returns",
            Text = "Customers may return any item within 30 days of delivery. Items should be unused and include original packaging. Refunds are issued to the original payment method within 5 business days of inspection."
        });
    }

    return Task.FromResult<IEnumerable<TextSearchProvider.TextSearchResult>>(results);
}

Opções de TextSearchProvider

O TextSearchProvider pode ser personalizado através da TextSearchProviderOptions classe. Aqui está um exemplo de criação de opções para executar a pesquisa antes de cada invocação de modelo e manter uma pequena janela contínua de contexto de conversa.

TextSearchProviderOptions textSearchOptions = new()
{
    // Run the search prior to every model invocation and keep a short rolling window of conversation context.
    SearchTime = TextSearchProviderOptions.TextSearchBehavior.BeforeAIInvoke,
    RecentMessageMemoryLimit = 6,
};

A TextSearchProvider classe suporta as seguintes opções através da TextSearchProviderOptions classe.

Opção Tipo Description Predefinido
SearchTime TextSearchProviderOptions.TextSearchBehavior Indica quando a pesquisa deve ser executada. Há duas opções, cada vez que o agente é invocado, ou sob demanda por meio de chamada de função. TextSearchProviderOptions.TextSearchBehavior.BeforeAIInvoke
FunctionToolName string O nome da ferramenta de pesquisa exposta ao operar no modo sob demanda. "Pesquisar"
FunctionToolDescription string A descrição da ferramenta de pesquisa exposta ao operar no modo sob demanda. "Permite pesquisar informações adicionais para ajudar a responder à pergunta do usuário."
ContextPrompt string O prompt de contexto prefixado para resultados ao operar no BeforeAIInvoke modo. "## Contexto adicional\nConsidere as seguintes informações dos documentos de origem ao responder ao usuário:"
CitaçõesPrompt string A instrução anexada após os resultados para solicitar citações ao operar no BeforeAIInvoke modo. "Inclua citações ao documento de origem com o nome do documento e o link se o nome e o link do documento estiverem disponíveis."
ContextoFormatter Func<IList<TextSearchProvider.TextSearchResult>, string> Delegado opcional para personalizar totalmente a formatação da lista de resultados ao operar no BeforeAIInvoke modo. Se fornecido, ContextPrompt e CitationsPrompt são ignorados. null
RecentMessageMemoryLimit int O número de mensagens de conversação recentes (usuário e assistente) a serem mantidas na memória e incluídas ao construir a entrada de pesquisa para BeforeAIInvoke pesquisas. 0 (deficiente)
RecentMessageRolesIncluded List<ChatRole> A lista de ChatRole tipos para filtrar mensagens recentes ao decidir quais mensagens recentes incluir ao construir a entrada de pesquisa. ChatRole.User

Usando o Semantic Kernel VectorStore com o Agent Framework

O Agent Framework suporta o uso de coleções VectorStore do Kernel Semântico para fornecer recursos RAG aos agentes. Isso é conseguido através da funcionalidade de ponte que converte as funções de pesquisa do Kernel Semântico em ferramentas do Agent Framework.

Importante

Este recurso requer a semantic-kernel versão 1.38 ou superior.

Criando uma ferramenta de pesquisa a partir do VectorStore

O create_search_function método de uma coleção Semantic Kernel VectorStore retorna um KernelFunction que pode ser convertido em uma ferramenta do Agent Framework usando .as_agent_framework_tool(). Use a documentação de conectores de armazenamento vetorial para saber como configurar diferentes coleções de armazenamento vetorial.

from semantic_kernel.connectors.ai.open_ai import OpenAITextEmbedding
from semantic_kernel.connectors.azure_ai_search import AzureAISearchCollection
from semantic_kernel.functions import KernelParameterMetadata
from agent_framework.openai import OpenAIResponsesClient

# Define your data model
class SupportArticle:
    article_id: str
    title: str
    content: str
    category: str
    # ... other fields

# Create an Azure AI Search collection
collection = AzureAISearchCollection[str, SupportArticle](
    record_type=SupportArticle,
    embedding_generator=OpenAITextEmbedding()
)

async with collection:
    await collection.ensure_collection_exists()
    # Load your knowledge base articles into the collection
    # await collection.upsert(articles)

    # Create a search function from the collection
    search_function = collection.create_search_function(
        function_name="search_knowledge_base",
        description="Search the knowledge base for support articles and product information.",
        search_type="keyword_hybrid",
        parameters=[
            KernelParameterMetadata(
                name="query",
                description="The search query to find relevant information.",
                type="str",
                is_required=True,
                type_object=str,
            ),
            KernelParameterMetadata(
                name="top",
                description="Number of results to return.",
                type="int",
                default_value=3,
                type_object=int,
            ),
        ],
        string_mapper=lambda x: f"[{x.record.category}] {x.record.title}: {x.record.content}",
    )

    # Convert the search function to an Agent Framework tool
    search_tool = search_function.as_agent_framework_tool()

    # Create an agent with the search tool
    agent = OpenAIResponsesClient(model_id="gpt-4o").create_agent(
        instructions="You are a helpful support specialist. Use the search tool to find relevant information before answering questions. Always cite your sources.",
        tools=search_tool
    )

    # Use the agent with RAG capabilities
    response = await agent.run("How do I return a product?")
    print(response.text)

Personalizando o comportamento de pesquisa

Pode personalizar a função de pesquisa com várias opções:

# Create a search function with filtering and custom formatting
search_function = collection.create_search_function(
    function_name="search_support_articles",
    description="Search for support articles in specific categories.",
    search_type="keyword_hybrid",
    # Apply filters to restrict search scope
    filter=lambda x: x.is_published == True,
    parameters=[
        KernelParameterMetadata(
            name="query",
            description="What to search for in the knowledge base.",
            type="str",
            is_required=True,
            type_object=str,
        ),
        KernelParameterMetadata(
            name="category",
            description="Filter by category: returns, shipping, products, or billing.",
            type="str",
            type_object=str,
        ),
        KernelParameterMetadata(
            name="top",
            description="Maximum number of results to return.",
            type="int",
            default_value=5,
            type_object=int,
        ),
    ],
    # Customize how results are formatted for the agent
    string_mapper=lambda x: f"Article: {x.record.title}\nCategory: {x.record.category}\nContent: {x.record.content}\nSource: {x.record.article_id}",
)

Para obter todos os detalhes sobre os parâmetros disponíveis para create_search_functiono , consulte a documentação do Kernel Semântico.

Usando várias funções de pesquisa

Você pode fornecer várias ferramentas de pesquisa a um agente para diferentes domínios de conhecimento:

# Create search functions for different knowledge bases
product_search = product_collection.create_search_function(
    function_name="search_products",
    description="Search for product information and specifications.",
    search_type="semantic_hybrid",
    string_mapper=lambda x: f"{x.record.name}: {x.record.description}",
).as_agent_framework_tool()

policy_search = policy_collection.create_search_function(
    function_name="search_policies",
    description="Search for company policies and procedures.",
    search_type="keyword_hybrid",
    string_mapper=lambda x: f"Policy: {x.record.title}\n{x.record.content}",
).as_agent_framework_tool()

# Create an agent with multiple search tools
agent = chat_client.create_agent(
    instructions="You are a support agent. Use the appropriate search tool to find information before answering. Cite your sources.",
    tools=[product_search, policy_search]
)

Você também pode criar várias funções de pesquisa a partir da mesma coleção com diferentes descrições e parâmetros para fornecer recursos de pesquisa especializados:

# Create multiple search functions from the same collection
# Generic search for broad queries
general_search = support_collection.create_search_function(
    function_name="search_all_articles",
    description="Search all support articles for general information.",
    search_type="semantic_hybrid",
    parameters=[
        KernelParameterMetadata(
            name="query",
            description="The search query.",
            type="str",
            is_required=True,
            type_object=str,
        ),
    ],
    string_mapper=lambda x: f"{x.record.title}: {x.record.content}",
).as_agent_framework_tool()

# Detailed lookup for specific article IDs
detail_lookup = support_collection.create_search_function(
    function_name="get_article_details",
    description="Get detailed information for a specific article by its ID.",
    search_type="keyword",
    top=1,
    parameters=[
        KernelParameterMetadata(
            name="article_id",
            description="The specific article ID to retrieve.",
            type="str",
            is_required=True,
            type_object=str,
        ),
    ],
    string_mapper=lambda x: f"Title: {x.record.title}\nFull Content: {x.record.content}\nLast Updated: {x.record.updated_date}",
).as_agent_framework_tool()

# Create an agent with both search functions
agent = chat_client.create_agent(
    instructions="You are a support agent. Use search_all_articles for general queries and get_article_details when you need full details about a specific article.",
    tools=[general_search, detail_lookup]
)

Essa abordagem permite que o agente escolha a estratégia de pesquisa mais apropriada com base na consulta do usuário.

Conectores VectorStore suportados

Este padrão funciona com qualquer conector VectorStore do Kernel Semântico, incluindo:

  • Azure AI Search (AzureAISearchCollection)
  • Qdrant (QdrantCollection)
  • Pinha (PineconeCollection)
  • Redis (RedisCollection)
  • Tecelagem (WeaviateCollection)
  • In-Memory (InMemoryVectorStoreCollection)
  • E muito mais

Cada conector fornece o mesmo create_search_function método que pode ser conectado às ferramentas do Agent Framework, permitindo que você escolha o banco de dados vetorial que melhor atende às suas necessidades. Veja a lista completa aqui.

Próximos passos