Sdílet prostřednictvím


Co je sumarizace?

Důležité

Naše oblast Preview, Švédsko – střed, představuje naše nejnovější a neustále se vyvíjející techniky ladění LLM založené na modelech GPT. Můžete si je vyzkoušet s prostředkem jazyka ve Švédsku – střed.

Shrnutí konverzací je k dispozici pouze pomocí:

  • REST API
  • Python
  • C#

Shrnutí je jednou z funkcí nabízených jazykem Azure AI, což je kombinace modelů generování velkých jazyků a modelů kodéru optimalizovaných pro úlohy, které nabízejí řešení souhrnů s vyšší kvalitou, nákladovou efektivitou a nižší latencí. V tomto článku najdete další informace o této funkci a o tom, jak ji používat ve vašich aplikacích.

Služba poskytuje řešení souhrnu pro tři typy žánrů, prostých textů, konverzací a nativních dokumentů. Shrnutí textu přijímá pouze bloky prostého textu a sumarizace konverzací přijímá konverzační vstup, včetně různých hlasových zvukových signálů, aby model efektivně segmentovaly a sumarizovat, a nativní dokument může přímo shrnout dokumenty v jejich nativních formátech, jako jsou Slova, PDF atd.

Tato dokumentace obsahuje následující typy článků:

  • Rychlé starty jsou úvodní pokyny, které vás provedou prováděním požadavků na službu.
  • Návody obsahují pokyny pro používání služby konkrétnějšími nebo přizpůsobenými způsoby.

Tyto funkce jsou navržené tak, aby zkrátily obsah, který by se dal považovat za příliš dlouhý na čtení.

Klíčové funkce pro sumarizaci textu

Shrnutí textu používá techniky zpracování přirozeného jazyka k vygenerování souhrnu pro prosté texty, které můžou být z dokumentu nebo konverzace nebo jakéhokoli textu. Toto rozhraní API nabízí dva přístupy k sumarizaci:

  • Extrakce souhrnu: Vytvoří souhrn extrahováním odsazením odsazením vět v dokumentu a umístěním informací o těchto větách.

    • Více extrahovaných vět: Tyto věty souhrnně vyjadřují hlavní myšlenku dokumentu. Jedná se o původní věty extrahované z obsahu vstupního dokumentu.
    • Skóre pořadí: Skóre pořadí označuje, jak je věta relevantní pro hlavní téma. Shrnutí textu řadí extrahované věty a můžete určit, jestli se vrátí v pořadí, v jakém se zobrazují, nebo podle jejich pořadí. Pokud například požadujete souhrnný souhrn se třemi větami, vrátí tři věty s nejvyšším skóre.
    • Poziční informace: Počáteční pozice a délka extrahovaných vět.
  • Abstraktní shrnutí: Generuje souhrn s stručnými, koherentní větami nebo slovy, které nejsou doslovným extrahováním vět z původního dokumentu.

    • Souhrnné texty: Abstraktní souhrn vrátí souhrn pro každý kontextový vstupní rozsah. Dlouhý vstup je možné segmentovat, aby bylo možné vrátit více skupin souhrnných textů s kontextovým vstupním rozsahem.
    • Kontextový vstupní rozsah: Oblast uvnitř vstupu použitého k vygenerování souhrnného textu.

Představte si například následující odstavec textu:

"V Microsoftu se snažíme posunout AI nad rámec stávajících technik, a to tím, že vezmeme komplexnější přístup zaměřený na člověka k učení a porozumění. Jako technický ředitel služeb Azure AI jsem pracoval s týmem úžasných vědců a inženýrů, aby tento úkol přeměnili na realitu. V mé roli si užívám jedinečnou perspektivu při prohlížení vztahu mezi třemi atributy lidského poznání: monolinguální text (X), zvukové nebo vizuální smyslové signály, (Y) a vícejazyčné (Z). V průsečíku všech tří je magie – co nazýváme XYZ-code, jak je znázorněno na obrázku 1 – společná reprezentace pro vytvoření výkonnější umělé inteligence, která umí mluvit, slyšet, vidět a lépe porozumět lidem. Věříme, že XYZ-code nám umožňuje plnit naši dlouhodobou vizi: výuku přenosu mezi doménami, různé způsoby a jazyky. Cílem je mít předem natrénované modely, které se společně učí reprezentace, aby podporovaly širokou škálu podřízených úkolů AI, a to způsobem, jakým dnes lidé dělají. Za posledních pět let jsme dosáhli lidského výkonu při rozpoznávání konverzační řeči, strojovém překladu, odpovídání na konverzační otázky, porozumění strojovému čtení a titulkování obrázků. Tyto pět převratů nám poskytlo silné signály směrem k naší ambicióznější snaze o dosažení schopností umělé inteligence, dosažení vícesměrového a vícejazyčného učení, které je blíže v souladu s tím, jak se lidé učí a chápou. Domnívám se, že společný kód XYZ-code je základní součástí této aspirace, pokud je založený na externích zdrojích znalostí v podřízených úkolech umělé inteligence."

Požadavek rozhraní API souhrnu textu se zpracuje po přijetí požadavku vytvořením úlohy pro back-end rozhraní API. Pokud úloha proběhla úspěšně, vrátí se výstup rozhraní API. Výstup je k dispozici pro načtení po dobu 24 hodin. Po této době se výstup vyprázdní. Vzhledem k podpoře vícejazyčných a emoji může odpověď obsahovat posuny textu. Další informace najdete v tématu zpracování posunů.

Pokud použijeme výše uvedený příklad, rozhraní API může vrátit tyto souhrny:

Extrakce souhrnu:

  • "V Microsoftu se snažíme posunout AI nad rámec stávajících technik, a to tím, že vezmeme komplexnější přístup zaměřený na člověka k učení a porozumění."
  • "Věříme, že XYZ-code nám umožňuje plnit naši dlouhodobou vizi: učení se přenosem mezi doménami, přes různé způsoby a jazyky."
  • "Cílem je mít předem natrénované modely, které se společně učí reprezentace, aby podporovaly širokou škálu podřízených úkolů umělé inteligence, mnohem způsobem, jakým lidé dnes dělají."

Shrnutí abstrakce:

  • "Microsoft přistupuje k učení a porozumění komplexnějšímu přístupu zaměřenému na člověka. Věříme, že XYZ-code nám umožňuje plnit naši dlouhodobou vizi: výuku přenosu mezi doménami, různé způsoby a jazyky. Za posledních pět let jsme dosáhli lidského výkonu na srovnávacích testech v konverzačním rozpoznávání řeči."

Začínáme se souhrnem

Pokud chcete použít sumarizaci, odešlete k analýze a zpracujete výstup rozhraní API ve vaší aplikaci. Analýza se provádí tak, jak je, bez přidaného přizpůsobení modelu používaného na vašich datech. Souhrn můžete použít dvěma způsoby:

Možnost vývoje Popis
Language Studio Language Studio je webová platforma, která umožňuje vyzkoušet propojení entit s textovými příklady bez účtu Azure a vlastní data při registraci. Další informace najdete na webu language Studio nebo v rychlém startu language studio.
ROZHRANÍ REST API nebo klientská knihovna (Azure SDK) Integrujte sumarizaci textu do svých aplikací pomocí rozhraní REST API nebo klientské knihovny dostupné v různých jazycích. Další informace najdete v rychlém startu souhrnu.

Požadavky na vstup a limity služeb

  • Shrnutí přebírá text pro analýzu. Další informace najdete v tématu Omezení dat a služeb v průvodci postupy.
  • Shrnutí funguje s různými napsanými jazyky. Další informace najdete v tématu podpora jazyků.

Referenční dokumentace a ukázky kódu

Při používání sumarizace textu v aplikacích si projděte následující referenční dokumentaci a ukázky pro jazyk Azure AI:

Možnost vývoje / jazyk Referenční dokumentace Ukázky
C# Dokumentace k jazyku C# Ukázky jazyka C#
Java Dokumentace k Javě Ukázky v Javě
JavaScript Dokumentace k JavaScriptu Ukázky JavaScriptu
Python Dokumentace k Pythonu Ukázky Pythonu

Zodpovědná AI

Systém AI zahrnuje nejen technologii, ale také uživatele, kteří ho používají, osoby, které ho mají vliv, a prostředí nasazení. Přečtěte si poznámku k transparentnosti pro shrnutí , kde se dozvíte o zodpovědném používání a nasazení umělé inteligence ve vašich systémech. Další informace najdete v následujících článcích: