Jak používat souhrn dokumentů

Shrnutí dokumentů je navržené tak, aby zkrátilo obsah, který uživatelé považují za příliš dlouhý na čtení. Jak extrahový, tak abstraktní souhrn zhušťuje články, dokumenty nebo dokumenty na klíčové věty.

Extrahované shrnutí: Vytvoří souhrn extrahováním vět, které souhrnně představují nejdůležitější nebo relevantní informace v původním obsahu.

Abstrakce shrnutí: Vytvoří souhrn generováním souhrnných vět z dokumentu, které zachycují hlavní myšlenku.

Modely AI používané rozhraním API poskytuje služba, stačí odeslat obsah k analýze.

Funkce

Tip

Pokud chcete tyto funkce začít používat, můžete začít postupovat podle článku Rychlý start . Můžete také vytvářet ukázkové požadavky pomocí nástroje Language Studio , aniž byste museli psát kód.

Rozhraní API pro extrahování souhrnů používá techniky zpracování přirozeného jazyka k vyhledání klíčových vět v nestrukturovaném textovém dokumentu. Tyto věty souhrnně vyjadřují hlavní myšlenku dokumentu.

Extrahovaná sumarizace vrátí skóre pořadí jako součást systémové odpovědi spolu s extrahovanými větami a jejich umístěním v původních dokumentech. Skóre pořadí je indikátorem toho, jak důležitá je věta určená pro hlavní myšlenku dokumentu. Model dává každé větě skóre mezi 0 a 1 (včetně) a vrátí věty s nejvyšším skóre na žádost. Pokud například požádáte o souhrn se třemi větami, služba vrátí tři věty s nejvyšším skóre.

V jazyce Azure AI existuje další funkce , extrakce klíčových frází, která dokáže extrahovat klíčové informace. Při rozhodování mezi extrakcí klíčových frází a extrahovaným shrnutím zvažte následující:

  • Extrakce klíčových frází vrací fráze, zatímco extrahová sumarizace vrací věty.
  • Extrahovaná sumarizace vrátí věty společně se skóre pořadí a věty s nejvyšším pořadím se vrátí pro každý požadavek.
  • Extrahovaná sumarizace také vrátí následující poziční informace:
    • Posun: Počáteční pozice každé extrahované věty.
    • Délka: Délka každé extrahované věty.

Určení způsobu zpracování dat (volitelné)

Odesílání dat

Dokumenty odešlete do rozhraní API jako textové řetězce. Analýza se provede po přijetí žádosti. Vzhledem k tomu, že je rozhraní API asynchronní, může dojít ke zpoždění mezi odesláním požadavku rozhraní API a přijetím výsledků.

Při použití této funkce jsou výsledky rozhraní API k dispozici po dobu 24 hodin od přijetí požadavku a jsou uvedeny v odpovědi. Po uplynutí tohoto časového období se výsledky vyprázdní a už nejsou k dispozici pro načtení.

Získání výsledků souhrnu dokumentů

Když získáte výsledky z rozpoznávání jazyka, můžete je streamovat do aplikace nebo uložit výstup do souboru v místním systému.

Následuje příklad obsahu, který můžete odeslat ke shrnutí, který se extrahuje pomocí článku blogu Microsoftu Holistické znázornění integrační AI. Tento článek je pouze příkladem, rozhraní API může přijímat mnohem delší vstupní text. Další informace najdete v části Věnované datovým limitům.

"V Microsoftu se snažíme posunout AI nad rámec stávajících technik tím, že k učení a porozumění přistupujeme komplexněji a na člověka. Jako technologický ředitel služeb Azure AI spolupracuji s týmem úžasných vědců a techniků, abych tento úkol přetáčel do reality. Ve své roli mám jedinečný pohled na vztah mezi třemi atributy lidského poznání: monolingvální text (X), zvukové nebo vizuální smyslové signály (Y) a vícejazyčné (Z). V průsečíku všech tří je kouzlo – to, čemu říkáme XYZ-code, jak je znázorněno na obrázku 1 – společné znázornění, které vytvoří výkonnější AI, která dokáže lépe mluvit, slyšet, vidět a rozumět lidem. Věříme, že XYZ-code nám umožní naplnit naši dlouhodobou vizi: učení o přenosu mezi doménami, které se zasahuje do různých způsobů a jazyků. Cílem je mít předem vytrénované modely, které se mohou společně učit reprezentacím pro podporu široké škály podřízených úloh umělé inteligence, podobně jako to dnes dělají lidé. Za posledních pět let jsme dosáhli lidského výkonu v oblasti rozpoznávání konverzační řeči, strojového překladu, odpovědí na konverzační otázky, strojového čtení a titulkování obrázků. Těchto pět průlomů nám poskytlo silné signály směrem k naší ambicióznější snaze vytvořit skok ve schopnostech AI a dosáhnout vícesním a vícejazyčného učení, které je blíže v souladu s tím, jak se lidé učí a chápou. Domnívám se, že společný kód XYZ je základní součástí tohoto úsilí, pokud je založený na externích zdrojích znalostí v podřízených úkolech AI."

Požadavek rozhraní API pro souhrn dokumentů se po přijetí žádosti zpracuje vytvořením úlohy pro back-end rozhraní API. Pokud úloha byla úspěšná, vrátí se výstup rozhraní API. Výstup bude k dispozici pro načtení po dobu 24 hodin. Po uplynutí této doby se výstup vyprázdní. Vzhledem k podpoře více jazyků a emoji může odpověď obsahovat posuny textu. Další informace najdete v tématu Zpracování posunů .

Při použití výše uvedeného příkladu může rozhraní API vrátit následující souhrnné věty:

Extrahované shrnutí:

  • "V Microsoftu se snažíme posunout AI nad rámec stávajících technik tím, že k učení a porozumění přistupujeme komplexněji a na člověka se zaměřujeme."
  • "Věříme, že XYZ-code nám umožní naplnit naši dlouhodobou vizi: učení o přenosu mezi doménami, přes různé způsoby a jazyky."
  • "Cílem je mít předem vytrénované modely, které se společně naučí reprezentaci, aby podporovaly širokou škálu podřízených úloh umělé inteligence, podobně jako to dělají lidé dnes."

Abstraktní shrnutí:

  • "Microsoft používá k učení a porozumění komplexnější přístup zaměřený na člověka. Věříme, že XYZ-code nám umožní naplnit naši dlouhodobou vizi: učení o přenosu mezi doménami, které se zasahuje do různých způsobů a jazyků. V posledních pěti letech jsme dosáhli lidského výkonu v rámci srovnávacích testů."

Vyzkoušejte extrahované shrnutí dokumentu.

K získání souhrnů článků, dokumentů nebo dokumentů můžete použít extrahový souhrn dokumentů. Příklad najdete v článku Rychlý start.

Pomocí parametru sentenceCount můžete zjistit, kolik vět se vrátí, 3 přičemž výchozí hodnota je. Rozsah je od 1 do 20.

Pomocí parametru sortby můžete také určit, v jakém pořadí se extrahované věty budou vracet – buď Offset nebo Rank, přičemž Offset výchozí hodnota je.

hodnota parametru Popis
Rank Seřadit věty podle jejich relevance pro vstupní dokument podle rozhodnutí služby.
Posun Zachová původní pořadí, ve kterém se věty zobrazují ve vstupním dokumentu.

Vyzkoušejte abstrakční shrnutí dokumentu.

Referenční dokumentace

Následující příklad vám pomůže začít s abstraktním shrnutím dokumentu:

  1. Zkopírujte následující příkaz do textového editoru. Příklad BASH používá \ znak pokračování řádku. Pokud konzola nebo terminál používá jiný znak pokračování řádku, použijte místo toho tento znak.
curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
' 
{
  "displayName": "Document Abstractive Summarization Task Example",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "en",
        "text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code will enable us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pre-trained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
      }
    ]
  },
  "tasks": [
    {
      "kind": "AbstractiveSummarization",
      "taskName": "Document Abstractive Summarization Task 1",
      "parameters": {
        "sentenceCount": 1
      }
    }
  ]
}
'

Pokud nezadáte sentenceCount, určí se souhrnná délka modelu. Všimněte si, že sentenceCount je aproximace počtu vět ve výstupním souhrnu v rozsahu 1 až 20.

  1. Proveďte v příkazu na příslušných místech následující změny:
  • your-language-resource-key Hodnotu nahraďte klíčem.
  • První část adresy URL požadavku nahraďte adresou URL your-language-resource-endpoint vašeho koncového bodu.
  1. Otevřete okno příkazového řádku (například BASH).

  2. Vložte příkaz z textového editoru do okna příkazového řádku a pak příkaz spusťte.

  3. Získejte kód operation-location z hlavičky odpovědi. Hodnota bude vypadat podobně jako následující adresa URL:

https://<your-language-resource-endpoint>/language/analyze-text/jobs/12345678-1234-1234-1234-12345678?api-version=2022-10-01-preview
  1. Pokud chcete získat výsledky požadavku, použijte následující příkaz cURL. Nezapomeňte nahradit <my-job-id> číselnou hodnotou ID, kterou jste získali z předchozí operation-location hlavičky odpovědi:
curl -X GET https://<your-language-resource-endpoint>/language/analyze-text/jobs/<my-job-id>?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>"

Příklad odpovědi JSON pro shrnutí abstraktního dokumentu

{
    "jobId": "cd6418fe-db86-4350-aec1-f0d7c91442a6",
    "lastUpdateDateTime": "2022-09-08T16:45:14Z",
    "createdDateTime": "2022-09-08T16:44:53Z",
    "expirationDateTime": "2022-09-09T16:44:53Z",
    "status": "succeeded",
    "errors": [],
    "displayName": "Document Abstractive Summarization Task Example",
    "tasks": {
        "completed": 1,
        "failed": 0,
        "inProgress": 0,
        "total": 1,
        "items": [
            {
                "kind": "AbstractiveSummarizationLROResults",
                "taskName": "Document Abstractive Summarization Task 1",
                "lastUpdateDateTime": "2022-09-08T16:45:14.0717206Z",
                "status": "succeeded",
                "results": {
                    "documents": [
                        {
                            "summaries": [
                                {
                                    "text": "Microsoft is taking a more holistic, human-centric approach to AI. We've developed a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We've achieved human performance on benchmarks in conversational speech recognition, machine translation, ...... and image captions.",
                                    "contexts": [
                                        {
                                            "offset": 0,
                                            "length": 247
                                        }
                                    ]
                                }
                            ],
                            "id": "1"
                        }
                    ],
                    "errors": [],
                    "modelVersion": "latest"
                }
            }
        ]
    }
}
parameter Popis
-X POST <endpoint> Určuje koncový bod pro přístup k rozhraní API.
-H Content-Type: application/json Typ obsahu pro odesílání dat JSON.
-H "Ocp-Apim-Subscription-Key:<key> Určuje klíč pro přístup k rozhraní API.
-d <documents> Json obsahující dokumenty, které chcete odeslat.

Následující příkazy cURL se spouštějí z prostředí BASH. Upravte tyto příkazy pomocí vlastního názvu prostředku, klíče prostředku a hodnot JSON.

Limity služeb a dat

Informace o velikosti a počtu požadavků, které můžete posílat za minutu a sekundu, najdete v článku o omezeních služby .

Viz také