Explicar a sumarização extrativa
de resumo extrativo produz um resumo extraindo frases essenciais diretamente do texto original. Em vez de gerar novo texto, ele usa técnicas de processamento de linguagem natural para localizar as frases que transmitem coletivamente a ideia ou o contexto principal de um documento.
A sumarização extrativa é realizada usando a função summarize_extractive() encontrada no esquema azure_cognitive da extensão azure_ai. O esquema azure_cognitive contém três sobrecargas da função summarize_extractive(). A lista de argumentos que as três sobrecargas de função esperam incluem:
| Argumento | Tipo | Predefinido | Descrição |
|---|---|---|---|
| enviar SMS |
text ou text[] |
O(s) texto(s) para o(s) qual(is) devem ser elaborados resumos. | |
| language_text |
text ou text[] |
Código de idioma (ou matriz de códigos de idioma) representando o idioma do texto a ser resumido. Analise a lista de idiomas suportados para recuperar os códigos de idioma necessários. | |
| contagem_de_frases | integer |
3 | O número de frases sumárias a gerar. |
| ordenar por | text |
'Compensação' | A ordem de classificação para as frases sumárias geradas. Os valores aceitáveis são "offset" e "rank", com offset representando a posição inicial de cada frase extraída dentro do conteúdo original e classificação sendo um indicador gerado por IA de quão relevante uma frase é para a ideia principal do conteúdo. |
| tamanho do lote | integer |
25 | Apenas para as duas sobrecargas esperando uma entrada de text[]. Especifica o número de registros a serem processados por vez. |
| desativar_logs_de_serviço | boolean |
falso | Sinalizador que indica se os logs de serviço devem ser desativados. |
| timeout_ms (tempo limite em milissegundos) | integer |
NULO | Tempo limite em milissegundos após o qual a operação é interrompida. |
| lançar_em_erro | boolean |
verdadeiro | Sinalizador que indica se a função deve, em caso de erro, lançar uma exceção resultando em uma reversão da transação de encapsulamento. |
| tentativas_máximas | integer |
1 | Número de vezes para tentar novamente a chamada para a Foundry Tools em caso de falha. |
| atraso_retentativa_ms | integer |
1000 | Quantidade de tempo, em milissegundos, para esperar antes de tentar voltar a chamar o endpoint das Foundry Tools. |
Cada função retorna uma matriz de frases extraídas e uma pontuação de classificação para cada uma, usando o tipo composto azure_cognitive.sentence, conforme mostrado na tabela abaixo:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
O azure_cognitive.sentence é um tipo composto que contém o texto de uma frase extrativa e uma pontuação de classificação para cada frase. A pontuação de classificação, um valor entre 0 e 1 (inclusive), indica o quão relevante uma frase é para a ideia principal do documento original. O resumo do documento classifica as frases extraídas, e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com sua classificação usando o parâmetro sort_by da função.
Gerar resumos extrativos para descrições de propriedades
Como programador da Margie's Travel, deve avaliar a técnica de sumarização extrativa acessível através da extensão azure_ai e das Ferramentas do Foundry e avaliar a capacidade do método para gerar resumos concisos em linguagem natural de descrições extensas de propriedades, como esta descrição da primeira entrada na base de dados.
"Sinta-se em casa neste encantador apartamento de um quarto, centralmente localizado no lado oeste da Queen Anne Hill. Este apartamento privado elegantemente decorado (unidade inferior de um duplex) tem uma planta aberta, pisos de bambu, uma cozinha totalmente equipada, uma TV, leitor de DVD, cabo básico e um quarto acolhedor com uma cama queen-size. A unidade acomoda até quatro pessoas (duas no quarto e duas no confortável sofá dobrável, roupa de cama incluída) e inclui Wi-Fi e lavanderia gratuitas. O apartamento abre para um deck privado, completo com seu próprio churrasco, com vista para um jardim e uma floresta de bambu preto. O apartamento está perfeitamente localizado a apenas um quarteirão das linhas de ônibus, onde você pode pegar um ônibus e estar no centro de Seattle em 15 minutos ou Ballard histórico em 10. Uma rápida caminhada de cinco minutos leva você a uma mercearia natural e cafés. Ou simplesmente faça uma caminhada de quinze minutos até o topo da Queen Anne Hill, onde você encontrará várias lojas, bares e restaurantes ecléticos."
Você solicita um resumo de duas frases da descrição da propriedade acima usando a seguinte consulta:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
A sumarização extrativa retorna as duas frases mais bem pontuadas do texto original, juntamente com a pontuação de classificação de cada uma:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}