Explicar a sumarização extrativa

Concluído

A sumarização extrativa produz um resumo extraindo frases essenciais diretamente do texto original. Em vez de gerar novo texto, ele usa técnicas de processamento de linguagem natural para localizar as frases que transmitem coletivamente a ideia ou o contexto principal de um documento.

A sumarização extrativa é realizada usando a summarize_extractive() função encontrada no azure_cognitive esquema da azure_ai extensão. O azure_cognitive esquema contém três sobrecargas da summarize_extractive() função. A lista de argumentos que as três sobrecargas de função esperam incluem:

Argumento Type Predefinido Description
texto text ou text[] O(s) texto(s) para o(s) qual(is) devem ser elaborados resumos.
language_text text ou text[] Código de idioma (ou matriz de códigos de idioma) representando o idioma do texto a ser resumido. Analise a lista de idiomas suportados para recuperar os códigos de idioma necessários.
sentence_count integer 3 O número de frases sumárias a gerar.
sort_by text 'Compensação' A ordem de classificação para as frases sumárias geradas. Os valores aceitáveis são "offset" e "rank", com offset representando a posição inicial de cada frase extraída dentro do conteúdo original e classificação sendo um indicador gerado por IA de quão relevante uma frase é para a ideia principal do conteúdo.
batch_size integer 25 Apenas para as duas sobrecargas esperando uma entrada de text[]. Especifica o número de registros a serem processados por vez.
disable_service_logs boolean false Sinalizador que indica se os logs de serviço devem ser desativados.
timeout_ms integer NULL Tempo limite em milissegundos após o qual a operação é interrompida.
throw_on_error boolean verdadeiro Sinalizador que indica se a função deve, em caso de erro, lançar uma exceção resultando em uma reversão da transação de encapsulamento.
max_attempts integer 1 Número de vezes para repetir a chamada para os Serviços de IA do Azure em caso de falha.
retry_delay_ms integer 1000 Quantidade de tempo, em milissegundos, para aguardar antes de tentar chamar novamente o ponto de extremidade dos Serviços de IA do Azure.

Cada função retorna uma matriz de frases extraídas e uma pontuação de classificação para cada uma, usando o azure_cognitive.sentence tipo composto, conforme mostrado na tabela abaixo:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

O azure_cognitive.sentence é um tipo composto que contém o texto de uma frase extrativa e uma pontuação de classificação para cada frase. A pontuação de classificação, um valor entre 0 e 1 (inclusive), indica o quão relevante uma frase é para a ideia principal do documento original. O resumo de documentos classifica as frases extraídas, e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com sua classificação usando o sort_by parâmetro da função.

Gerar resumos extrativos para descrições de propriedades

Como desenvolvedor do Margie's Travel, você deseja avaliar a técnica de sumarização extrativa acessível por meio da extensão e dos azure_ai Serviços de IA do Azure e avaliar a capacidade do método de gerar resumos concisos em linguagem natural de longas descrições de propriedades, como esta descrição da primeira listagem no banco de dados:

"Sinta-se em casa neste encantador apartamento de um quarto, centralmente localizado no lado oeste da Queen Anne Hill. Este apartamento privado elegantemente decorado (unidade inferior de um duplex) tem uma planta aberta, pisos de bambu, uma cozinha totalmente equipada, uma TV, leitor de DVD, cabo básico e um quarto acolhedor com uma cama queen-size. A unidade acomoda até quatro pessoas (duas no quarto e duas no confortável sofá dobrável, roupa de cama incluída) e inclui acesso Wi-Fi gratuito e lavandaria. O apartamento abre para um deck privado, completo com seu próprio churrasco, com vista para um jardim e uma floresta de bambu preto. O apartamento está perfeitamente localizado a apenas um quarteirão das linhas de ônibus, onde você pode pegar um ônibus e estar no centro de Seattle em 15 minutos ou Ballard histórico em 10. Uma rápida caminhada de cinco minutos leva você a uma mercearia natural e cafés. Ou simplesmente faça uma caminhada de quinze minutos até o topo da Queen Anne Hill, onde você encontrará várias lojas, bares e restaurantes ecléticos."

Você solicita um resumo de duas frases da descrição da propriedade acima usando a seguinte consulta:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

A sumarização extrativa retorna as duas frases mais bem pontuadas do texto original, juntamente com a pontuação de classificação de cada uma:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}