Vysvětlit extrahový souhrn
Extraktivní sumarizace vytvoří souhrn extrahováním důležitých vět přímo z původního textu. Místo generování nového textu používá techniky zpracování přirozeného jazyka k vyhledání vět, které souhrnně vyjadřují primární myšlenku nebo kontext dokumentu.
Extrakce souhrnu se provádí pomocí funkce summarize_extractive() nalezené ve schématu azure_cognitive rozšíření azure_ai. Schéma azure_cognitive obsahuje tři přetížení summarize_extractive() funkce. Seznam argumentů, které tři přetížení funkce očekávají, zahrnují:
| Důvod | Typ | Výchozí | Popis |
|---|---|---|---|
| poslat SMS |
text nebo text[] |
Texty, pro které se mají vygenerovat souhrny. | |
| jazykový_text |
text nebo text[] |
Kód jazyka (nebo pole kódů jazyka) představující jazyk textu, který se má sumarizovat. Projděte si seznam podporovaných jazyků a načtěte potřebné kódy jazyka. | |
| sentence_count | integer |
3 | Počet souhrnných vět, které se mají vygenerovat. |
| seřadit_podle | text |
"posun" | Pořadí řazení vygenerovaných souhrnných vět Přijatelné hodnoty jsou "posun" a "pořadí", přičemž posun představuje počáteční pozici každé extrahované věty v původním obsahu a pořadí je indikátorem toho, jak je věta relevantní pro hlavní myšlenku obsahu. |
| velikost dávky | integer |
25 | Pouze pro dvě přetížení očekává vstup text[]. Určuje počet záznamů, které se mají zpracovat najednou. |
| zakázat_protokoly_služby | boolean |
Nepravda | Příznak označující, jestli se mají vypnout protokoly služeb. |
| timeout_ms | integer |
NULA | Časový limit v milisekundách, po kterém je operace zastavena. |
| vyvolat_při_chybě | boolean |
pravda | Příznak označující, zda má funkce při chybě vyvolat výjimku, která vede k vrácení zpět zabalené transakce. |
| maximální_počet_pokusů | integer |
1 | Počet pokusů o opakování volání Foundry Tools v případě selhání. |
| retry_delay_ms | integer |
1 000 | Doba čekání v milisekundách, než se pokusíte znovu volat koncový bod Foundry Tools. |
Každá funkce vrátí pole extrahovaných vět a skóre pořadí pro každou z nich pomocí azure_cognitive.sentence složeného typu, jak je znázorněno v následující tabulce:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
azure_cognitive.sentence je složený typ obsahující text extrahující věty a skóre pořadí pro každou větu. Skóre pořadí, hodnota mezi 0 a 1 (včetně), označuje, jak relevantní je věta pro hlavní myšlenku původního dokumentu. Shrnutí dokumentu řadí extrahované věty a pomocí parametru sort_by funkce můžete určit, jestli se vrátí v pořadí, ve kterém se zobrazují, nebo podle jejich pořadí.
Generování extrahovaných souhrnů pro popisy vlastností
Jako vývojář pro Margie's Travel chcete vyhodnotit metodu extrahování souhrnů přístupnou prostřednictvím azure_ai rozšíření a Foundry Tools a vyhodnotit schopnost metody generovat stručné souhrny dlouhých popisů vlastností v přirozeném jazyce, jako je tento popis z prvního výpisu v databázi:
"Udělejte si doma v tomto okouzlujícím apartmánu s 1 ložnicí, centrálně umístěným na západní straně Queen Anne Hill. Tento elegantně zařízený soukromý apartmán (spodní jednotka duplexu) má otevřený prostorový plán, bamboo podlahy, plně vybavenou kuchyň, TV, DVD přehrávač, základní kabel a útulnou ložnici s manželskou postelí velikosti Queen. Jednotka spí až čtyři (dva v ložnici a dva na pohodlném rozkládacím gauči, ložní prádlo) a zahrnuje bezplatné Wi-Fi a prádelnu. Apartmán se nachází na soukromé palubě s vlastním grilem, s výhledem do zahrady a lesa černého bamboou. Apartmán je dokonale umístěn jen jeden blok od autobusových linek, kde můžete chytit autobus a být v centru Seattlu za 15 minut nebo historické Ballard v 10. Rychlá pětiminutová procházka vás zavede do přirozeného obchodu s potravinami a kávovarů. Nebo jen 15 minut chůze od vrcholu Queen Anne Hill, kde najdete různé eclektické obchody, bary a restaurace."
Pomocí následujícího dotazu si vyžádáte dvousouvětý souhrn výše uvedeného popisu vlastnosti:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
Extrakce souhrnu vrátí dvě věty s nejvyšším skóre z původního textu a skóre pořadí pro každý z nich:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}