說明擷取式摘要

已完成

擷取摘要 直接從原始文字擷取基本句子來產生摘要。 它不會產生新的文字,而是使用自然語言處理技術來找出共同傳達檔主要概念或內容的句子。

擷取摘要是使用在 summarize_extractive() 延伸模組 azure_cognitive 架構中找到的 azure_ai 函式來完成。 azure_cognitive 架構包含三個 summarize_extractive() 函式的多載。 三個函式多載預期的引數清單包括:

論點 類型 預設 說明
收發簡訊 texttext[] 應該產生摘要的文字。
language_text texttext[] 語言代碼(或語言代碼數位列)代表要摘要之文字的語言。 檢閱 支援的語言清單, 擷取必要的語言代碼。
sentence_count integer 3 要產生的摘要句子數目。
sort_by text 'offset' 產生的摘要句子的排序順序。 可接受的值為「位移」和「排名」,位移代表每個擷取句子在原始內容內的開始位置,而排名則是 AI 產生的指標,指出句子與內容主要概念的關聯程度。
批次大小 integer 25 僅適用於預期輸入為 text[] 的兩個多載。 指定要一次處理的記錄數目。
disable_service_logs boolean 假的 指出是否關閉服務記錄的旗標。
timeout_ms integer 逾時 (以毫秒為單位),此時間後停止作業。
throw_on_error boolean 指出函式是否應該在錯誤時擲回例外狀況從而導致包裝交易復原的旗標。
最大嘗試次數 integer 1 發生故障時,重試呼叫 Foundry Tools 的次數。
retry_delay_ms integer 1000 嘗試重試呼叫 Foundry Tools 端點之前要等待的時間量 (以毫秒為單位)。

每個函式都會傳回一個擷取句子的陣列,以及每個句子的排名分數,使用 azure_cognitive.sentence 復合類型,如下表所示:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

azure_cognitive.sentence 是複合類型,其中包含擷取句子的文字,以及每個句子的排名分數。 排名分數是一個 0 到 1 (含) 之間的值,表示句子與原始文件主要意思相關的程度。 文件摘要會對擷取出來的句子進行排名,您可以使用函式的 sort_by 參數來決定它們是按照出現的順序傳回,還是根據排名傳回。

產生屬性描述的擷取式摘要

作為 Margie's Travel 的開發者,你想評估透過 azure_ai 擴充套件和 Foundry 工具所取得的擷取摘要技術,並評估該方法產生簡潔自然語言的長篇屬性描述摘要的能力,例如資料庫中首個列表中的以下描述:

"Make yourself at home in this charming one-bedroom apartment, centrally located on the west side of Queen Anne Hill. 這座裝飾優雅的私人公寓(雙併的底層)具有開放式設計、竹地板、設備齊全的廚房、一台電視、DVD播放機、基本有線電視,以及一間配有加大雙人床的舒適臥室。 該單元最多可睡四個(兩個在臥室和兩個舒適的摺疊沙發上,包括床單),包括免費 Wi-Fi 和洗衣。 公寓通向私人露台,配有自己的燒烤設備,可以俯瞰花園和一片黑竹森林。 公寓完美地位於僅一個街區之外的公交線路,從這裡你可以乘坐公共汽車,15分鐘內到達西雅圖市中心,或10分鐘內抵達歷史悠久的巴拉德。 五分鐘的步行就能走到一家健康食品店和幾家咖啡店。 或者,只需15分鐘步行到安妮山女王的頂部,在那裡你會發現各種不拘一格的商店,酒吧和餐館。

您可以使用下列查詢,要求上述屬性描述的兩個句子摘要:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

擷取摘要會從原始文字傳回兩個最高分的句子,以及每個句子的排名分數:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}