Detecção de fundamentação

Artigo
10/22/2024

A API de detecção de fundamentação detecta se as respostas de texto de grandes modelos de linguagem (LLMs) são baseadas nos materiais de origem fornecidos pelos usuários. A falta de fundamentação refere-se a casos em que os LLMs produzem informações que não são factuais ou são imprecisas em relação ao que estava presente nos materiais de origem.

Principais termos

Geração Aumentada de Recuperação (RAG): RAG é uma técnica para aumentar o conhecimento LLM com outros dados. Os LLMs podem raciocinar sobre tópicos variados, mas o seu conhecimento é limitado aos dados públicos que estavam disponíveis no momento em que foram treinados. Se você deseja construir aplicativos de IA que possam raciocinar sobre dados privados ou dados introduzidos após a data limite de um modelo, você precisa fornecer ao modelo essas informações específicas. O processo de trazer as informações apropriadas e inseri-las no prompt do modelo é conhecido como Retrieval Augmented Generation (RAG). Para obter mais informações, veja Geração aumentada por recuperação (RAG).
Fundamentação e não fundamentação em LLMs: refere-se à medida em que os resultados do modelo são baseados em informações fornecidas ou refletem fontes confiáveis com precisão. Uma resposta fundamentada adere estreitamente às informações fornecidas, evitando especulação ou fabricação. Nas medições de fundamentação, as informações da fonte são cruciais e servem como fonte de aterramento.

Opções de detecção de fundamentação

Confira a seguir as opções disponíveis para a detecção de Fundamentação na Segurança de Conteúdo de IA do Azure:

Seleção de domínio: os usuários podem escolher um domínio estabelecido para garantir uma detecção mais personalizada que se alinhe às necessidades específicas de sua área. Os domínios disponíveis atualmente são MEDICAL e GENERIC.
Especificação de tarefa: Esse recurso permite selecionar a tarefa que você está realizando, como QnA (perguntas e respostas) e Resumo, com configurações ajustáveis de acordo com o tipo de tarefa.
Velocidade versus interpretabilidade: Existem dois modos que negociam velocidade com interpretabilidade de resultados.
- Modo sem raciocínio: oferece capacidade de detecção rápida; fácil de incorporar em aplicativos online.
- Modo de raciocínio: Oferece explicações detalhadas para segmentos não aterrados detectados; melhor para compreensão e mitigação.

Casos de uso

A detecção de fundamentação oferece suporte a tarefas de resumo e QnA baseadas em texto para garantir que os resumos ou respostas gerados sejam precisos e confiáveis. Aqui estão alguns exemplos de cada caso de uso:

Tarefas de resumo:

Resumo médico: No contexto de artigos de notícias médicas, a detecção de fundamentação pode ser usada para garantir que o resumo não contenha informações fabricadas ou enganosas, garantindo que os leitores obtenham informações médicas precisas e confiáveis.
Resumo de artigos acadêmicos: quando o modelo gera resumos de trabalhos acadêmicos ou artigos de pesquisa, a função pode ajudar a garantir que o conteúdo resumido represente com precisão as principais descobertas e contribuições, sem introduzir afirmações falsas.

tarefas QnA:

Chatbots de suporte ao cliente: No suporte ao cliente, a função pode ser utilizada para validar as respostas fornecidas pelos chatbots de IA, garantindo que os clientes recebam informações precisas e confiáveis quando fizerem perguntas sobre produtos ou serviços.
QnA médica: Para QnA médica, a função ajuda a verificar a precisão das respostas médicas e dos conselhos fornecidos pelos sistemas de IA aos profissionais de saúde e pacientes, reduzindo o risco de erros médicos.
QnA educacional: em ambientes educacionais, a função pode ser aplicada a tarefas de QnA para confirmar se as respostas a perguntas acadêmicas ou consultas de preparação para testes são factualmente precisas, apoiando o processo de aprendizagem.

Correção de fundamentação

A API de detecção de fundamentação possui um recurso de correção que ajusta automaticamente qualquer ausência de fundamento detectada no texto, com base nas fontes de fundamentação fornecidas. Quando esse recurso está habilitado, a resposta inclui um campo corrected Text que apresenta o texto corrigido de acordo com essas mesmas fontes.

Casos de uso

Aqui estão alguns cenários comuns que mostram como e quando aplicar esses recursos para obter os melhores resultados.

Resumo em contextos médicos

Você está resumindo documentos médicos e precisa garantir que os nomes dos pacientes sejam precisos e estejam de acordo com as fontes de fundamentação fornecidas.

Exemplo de solicitação de API:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Resultado esperado:

O recurso de correção detecta que o Kevin está desprotegido porque conflita com a fonte de fundamentação Jane. A API retorna o texto corrigido: "The patient name is Jane."

Tarefa perguntas e respostas (P&R) com dados de atendimento ao cliente

Se você está implementando um sistema de P&R para um chatbot de atendimento ao cliente. É essencial que as respostas da IA estejam sempre alinhadas com as informações mais recentes e precisas.

Exemplo de solicitação de API:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Resultado esperado:

A API detecta que 5% está sem fundamentação porque não corresponde à fonte de fundamentação fornecida, que é 4.5%. A resposta inclui o texto corrigido: "The interest rate is 4.5%."

Criação de conteúdo com dados históricos

Você está criando conteúdo que envolve dados históricos ou eventos, em que a precisão é fundamental para manter a credibilidade e evitar a desinformação.

Exemplo de solicitação de API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Resultado esperado:

A API detecta os dados sem fundamentação 1065 e os corrige para 1066 com base na fonte de fundamentação. A resposta inclui o texto corrigido: "The Battle of Hastings occurred in 1066."

Resumo da documentação interna

Você está resumindo documentos internos onde nomes de produtos, números de versão ou outros dados específicos devem permanecer padronizados.

Exemplo de solicitação de API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Resultado esperado:

O recurso de correção identifica SuperWidget v2.1 como sem fundamentação e o atualiza como SuperWidget v2.2 na resposta. A resposta retorna o texto corrigido: "Our latest product is SuperWidget v2.2."

Práticas recomendadas

Siga essas práticas recomendadas ao configurar sistemas RAG para obter o melhor desempenho da API de detecção de fundamentação:

Quando lidar com nomes de produtos ou números de versão, use fontes de fundamentação de notas sobre a versão interna ou da documentação oficial do produto para garantir a exatidão.
Para conteúdos históricos, verifique suas fontes de fundamentação com bancos de dados acadêmicos ou históricos confiáveis, garantindo assim um nível alto de precisão.
Em ambientes dinâmicos, como na área financeira, sempre use as fontes de fundamentação mais recentes e confiáveis, garantindo que seu sistema de IA forneça informações precisas e oportunas.
Sempre tenha certeza de que suas fontes de fundamentação são precisas e estão atualizadas, especialmente em áreas sensíveis como a saúde. Isso minimiza o risco de erros no processo de resumo.

Limitações

Disponibilidade do idioma

Atualmente, a API de detecção de fundamentação oferece suporte a conteúdo em inglês. Embora nossa API não restrinja o envio de conteúdo em outro idioma, não podemos garantir o mesmo nível de qualidade e precisão na análise de conteúdo em outros idiomas. Recomendamos que os usuários enviem conteúdo principalmente em inglês para garantir resultados mais confiáveis e precisos da API.

Limitações de comprimento de texto

Confira os requisitos de entrada para ver as limitações de comprimento máximo de texto.

Disponibilidade de região

Para utilizar essa API, deve criar o seu recurso IA do Azure Content Safety nas regiões suportadas. Confira a Disponibilidade de região.

Limitações de taxa

Consulte as Taxas de consulta.

Caso necessite de uma tarifa maior, entre em contato conosco para solicitá-la.

Próximas etapas

Siga o início rápido para começar a usar o IA do Azure Content Safety para detectar fundamento.

Início rápido da detecção de fundamentação

Compartilhar via

Detecção de fundamentação

Principais termos

Opções de detecção de fundamentação

Casos de uso

Correção de fundamentação

Casos de uso

Resumo em contextos médicos

Tarefa perguntas e respostas (P&R) com dados de atendimento ao cliente

Criação de conteúdo com dados históricos

Resumo da documentação interna

Práticas recomendadas

Limitações

Disponibilidade do idioma

Limitações de comprimento de texto

Disponibilidade de região

Limitações de taxa

Próximas etapas

Comentários

Recursos adicionais