Explicar a sumarização extrativa
A sumarização extrativa produz um resumo extraindo frases essenciais diretamente do texto original. Em vez de gerar novo texto, ele usa técnicas de processamento de linguagem natural para localizar as frases que transmitem coletivamente a ideia ou o contexto principal de um documento.
A sumarização extrativa é realizada usando a summarize_extractive()
função encontrada no azure_cognitive
esquema da azure_ai
extensão. O azure_cognitive
esquema contém três sobrecargas da summarize_extractive()
função. A lista de argumentos que as três sobrecargas de função esperam incluem:
Argumento | Type | Predefinido | Description |
---|---|---|---|
texto | text ou text[] |
O(s) texto(s) para o(s) qual(is) devem ser elaborados resumos. | |
language_text | text ou text[] |
Código de idioma (ou matriz de códigos de idioma) representando o idioma do texto a ser resumido. Analise a lista de idiomas suportados para recuperar os códigos de idioma necessários. | |
sentence_count | integer |
3 | O número de frases sumárias a gerar. |
sort_by | text |
'Compensação' | A ordem de classificação para as frases sumárias geradas. Os valores aceitáveis são "offset" e "rank", com offset representando a posição inicial de cada frase extraída dentro do conteúdo original e classificação sendo um indicador gerado por IA de quão relevante uma frase é para a ideia principal do conteúdo. |
batch_size | integer |
25 | Apenas para as duas sobrecargas esperando uma entrada de text[] . Especifica o número de registros a serem processados por vez. |
disable_service_logs | boolean |
false | Sinalizador que indica se os logs de serviço devem ser desativados. |
timeout_ms | integer |
NULL | Tempo limite em milissegundos após o qual a operação é interrompida. |
throw_on_error | boolean |
verdadeiro | Sinalizador que indica se a função deve, em caso de erro, lançar uma exceção resultando em uma reversão da transação de encapsulamento. |
max_attempts | integer |
1 | Número de vezes para repetir a chamada para os Serviços de IA do Azure em caso de falha. |
retry_delay_ms | integer |
1000 | Quantidade de tempo, em milissegundos, para aguardar antes de tentar chamar novamente o ponto de extremidade dos Serviços de IA do Azure. |
Cada função retorna uma matriz de frases extraídas e uma pontuação de classificação para cada uma, usando o azure_cognitive.sentence
tipo composto, conforme mostrado na tabela abaixo:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
O azure_cognitive.sentence
é um tipo composto que contém o texto de uma frase extrativa e uma pontuação de classificação para cada frase. A pontuação de classificação, um valor entre 0 e 1 (inclusive), indica o quão relevante uma frase é para a ideia principal do documento original. O resumo de documentos classifica as frases extraídas, e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com sua classificação usando o sort_by
parâmetro da função.
Gerar resumos extrativos para descrições de propriedades
Como desenvolvedor do Margie's Travel, você deseja avaliar a técnica de sumarização extrativa acessível por meio da extensão e dos azure_ai
Serviços de IA do Azure e avaliar a capacidade do método de gerar resumos concisos em linguagem natural de longas descrições de propriedades, como esta descrição da primeira listagem no banco de dados:
"Sinta-se em casa neste encantador apartamento de um quarto, centralmente localizado no lado oeste da Queen Anne Hill. Este apartamento privado elegantemente decorado (unidade inferior de um duplex) tem uma planta aberta, pisos de bambu, uma cozinha totalmente equipada, uma TV, leitor de DVD, cabo básico e um quarto acolhedor com uma cama queen-size. A unidade acomoda até quatro pessoas (duas no quarto e duas no confortável sofá dobrável, roupa de cama incluída) e inclui acesso Wi-Fi gratuito e lavandaria. O apartamento abre para um deck privado, completo com seu próprio churrasco, com vista para um jardim e uma floresta de bambu preto. O apartamento está perfeitamente localizado a apenas um quarteirão das linhas de ônibus, onde você pode pegar um ônibus e estar no centro de Seattle em 15 minutos ou Ballard histórico em 10. Uma rápida caminhada de cinco minutos leva você a uma mercearia natural e cafés. Ou simplesmente faça uma caminhada de quinze minutos até o topo da Queen Anne Hill, onde você encontrará várias lojas, bares e restaurantes ecléticos."
Você solicita um resumo de duas frases da descrição da propriedade acima usando a seguinte consulta:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
A sumarização extrativa retorna as duas frases mais bem pontuadas do texto original, juntamente com a pontuação de classificação de cada uma:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}