Explique o resumo extrativo
resumo extrativo produz um resumo extraindo frases essenciais diretamente do texto original. Em vez de gerar um novo texto, ele usa técnicas de processamento de linguagem natural para localizar as frases que transmitem coletivamente a ideia ou contexto principal de um documento.
O resumo extrativo é realizado usando a função summarize_extractive() encontrada no esquema azure_cognitive da extensão azure_ai. O esquema azure_cognitive contém três sobrecargas da função summarize_extractive(). A lista de argumentos que as três sobrecargas de função esperam incluem:
| Argumento | Tipo | Padrão | Descrição |
|---|---|---|---|
| enviar SMS |
text ou text[] |
Os textos para os quais os resumos devem ser gerados. | |
| language_text |
text ou text[] |
Código de idioma (ou matriz de códigos de idioma) que representa o idioma do texto a ser resumido. Revise a lista de idiomas com suporte para obter os códigos de idioma necessários. | |
| contagem de frases | integer |
3 | O número de frases resumidas a serem geradas. |
| sort_by | text |
'offset' | A ordem de classificação para as frases resumidas geradas. Os valores aceitáveis são "deslocamento" e "classificação", onde deslocamento indica a posição inicial de cada frase extraída no conteúdo original, e classificação é um indicador gerado por IA que mostra o grau de relevância de uma frase para a ideia principal do conteúdo. |
| batch_size | integer |
25 | Somente para as duas sobrecargas que esperam uma entrada de text[]. Especifica o número de registros a serem processados por vez. |
| disable_service_logs | boolean |
falso | Sinalizador que indica se os logs de serviço devem ser desativados. |
| timeout_ms | integer |
NULL | Tempo limite em milissegundos após o qual a operação é interrompida. |
| throw_on_error | boolean |
verdadeiro | Sinalizador que indica se a função deve, em caso de erro, gerar uma exceção que resulte em uma reversão das transações de encapsulamento. |
| tentativas_máximas | integer |
1 | Número de vezes para tentar novamente a chamada para o Foundry Tools em caso de falha. |
| retry_delay_ms | integer |
1000 | Tempo de espera, em milissegundos, antes de tentar chamar novamente o ponto de extremidade do Foundry Tools. |
Cada função retorna uma matriz de frases extraídas e uma pontuação de classificação para cada uma delas, usando o tipo composto azure_cognitive.sentence, conforme mostrado na tabela abaixo:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
O azure_cognitive.sentence é um tipo composto que contém o texto de uma frase extrativa e uma pontuação de classificação para cada frase. A pontuação de classificação, um valor entre 0 e 1 (inclusive), indica o grau de relevância de uma frase para a ideia principal do documento original. O resumo do documento classifica as frases extraídas e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com a classificação usando o parâmetro sort_by da função.
Gerar sumarizações extrativas para descrições de propriedade
Como desenvolvedor da Margie's Travel, você deseja avaliar a técnica de sumarização extrativa acessível por meio da extensão azure_ai e do Foundry Tools e avaliar a capacidade do método de gerar resumos concisos e em linguagem natural de descrições de propriedades extensas, como essa descrição da primeira listagem no banco de dados:
"Faça-se em casa neste charmoso apartamento de um quarto, localizado centralmente no lado oeste da Rainha Anne Hill. Este apartamento elegantemente decorado e privado (unidade inferior de um duplex) tem um plano de piso aberto, pisos de bambu, uma cozinha totalmente equipada, uma TV, dvd player, cabo básico e um quarto aconchegante com uma cama queen-size. A unidade dorme até quatro (dois no quarto e dois no confortável sofá dobrável, linho incluído) e inclui Wi-Fi gratuitos e lavanderia. O apartamento abre em um deck privado, completo com seu próprio churrasco, com vista para um jardim e uma floresta de bambu preto. O apartamento está perfeitamente localizado a apenas uma quadra das linhas de ônibus, onde você pode pegar um ônibus e chegar ao centro de Seattle em 15 minutos ou à histórica Ballard em 10 minutos. Uma rápida caminhada de cinco minutos leva você a um supermercado natural e cafeterias. Ou basta fazer uma caminhada de 15 minutos até o topo da Rainha Anne Hill, onde você encontra várias lojas ecléticas, bares e restaurantes."
Você solicita um resumo de duas frases da descrição da propriedade acima usando a seguinte consulta:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
O resumo extrativo retorna as duas frases com pontuação mais alta do texto original, juntamente com a pontuação de classificação para cada:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}