Co to jest podsumowanie?

2025-04-30

Ważne

Nasz region wersji zapoznawczej, Szwecja Środkowa, prezentuje najnowsze i ciągle rozwijające się techniki dostrajania LLM oparte na modelach GPT. Zapraszamy do wypróbowania ich z zasobem Język w regionie Centralnym Szwecji.

Podsumowanie konwersacji jest dostępne tylko przy użyciu:

Interfejs programistyczny REST
Pyton
C#

Podsumowanie to funkcja oferowana przez Azure AI Language, kombinację generatywnych dużych modeli językowych i modeli koderów zoptymalizowanych pod kątem zadań, które oferują rozwiązania podsumowania o wyższej jakości, większej efektywności kosztowej i niższych opóźnieniach. Skorzystaj z tego artykułu, aby dowiedzieć się więcej o tej funkcji i sposobie jej używania w aplikacjach.

Usługa oferuje rozwiązania podsumowania dla trzech typów gatunków, zwykłych tekstów, konwersacji i dokumentów natywnych. Podsumowanie tekstu akceptuje tylko bloki zwykłego tekstu. Podsumowanie konwersacji akceptuje dane wejściowe konwersacyjne, w tym różne sygnały audio mowy. Podsumowanie dokumentów natywnych akceptuje dokumenty w swoich natywnych formatach, takich jak Word, PDF lub zwykły tekst. Aby uzyskać więcej informacji, zobaczObsługiwane formaty dokumentów.

Wskazówka

Wypróbuj podsumowanie w portalu usługi Azure AI Foundry. W tym miejscu możesz użyć obecnie istniejącego zasobu language Studio lub utworzyć nowy zasób usługi Azure AI Foundry w celu korzystania z tej usługi.

Możliwości

Ta dokumentacja zawiera następujące typy artykułów:

Szybki start to instrukcje wprowadzające, które pomagają w wysyłaniu żądań do usługi.
Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.

Typowy przepływ pracy

Aby użyć tej funkcji, przesyłasz dane do analizy i obsługujesz dane wyjściowe interfejsu API w aplikacji. Analiza jest wykonywana w stanie niezmienionym, bez dodatkowego dostosowania do modelu używanego do analizy Twoich danych.

Utwórz zasób języka sztucznej inteligencji platformy Azure, który zapewnia dostęp do funkcji oferowanych przez język azure AI. Generuje hasło (nazywane kluczem) i adres URL punktu końcowego używany do uwierzytelniania żądań interfejsu API.
Utwórz żądanie przy użyciu interfejsu API REST lub biblioteki klienta dla języków C#, Java, JavaScript i Python. Możesz również wysyłać wywołania asynchroniczne z żądaniem wsadowym, aby połączyć żądania interfejsu API dla wielu funkcji w jedno wywołanie.
Wyślij żądanie zawierające dane tekstowe. Twój klucz i punkt dostępu są używane do uwierzytelniania.
Prześlij odpowiedź strumieniowo lub przechowaj ją lokalnie.

Kluczowe funkcje podsumowywania tekstu

Podsumowywanie tekstu używa technik przetwarzania języka naturalnego do generowania podsumowania zwykłych tekstów, które mogą pochodzić z dokumentu, konwersacji lub dowolnych tekstów. Istnieją dwa podejścia do podsumowania tego interfejsu API:

Podsumowanie wyodrębniające: tworzy podsumowanie, wyodrębniając ważne zdania w tekście źródłowym, a następnie umieszczając informacje o pozycjonowaniu tych zdań.
- Wiele wyodrębnionych zdań: te zdania łącznie przekazują główną ideę tekstu wejściowego. Są to oryginalne zdania wyodrębnione z zawartości tekstu wejściowego.
- Wynik klasyfikacji: wynik rangi wskazuje, jak istotne jest zdanie do głównego tematu. Podsumowanie tekstu klasyfikuje wyodrębnione zdania i możesz określić, czy są zwracane w kolejności, w której się pojawiają, czy według ich rangi. Jeśli na przykład zażądasz podsumowania wyodrębniającego z trzema zdaniami, zwróci trzy najwyżej oceniane zdania.
- Informacje pozycyjne: pozycja początkowa i długość wyodrębnionych zdań.
Podsumowanie abstrakcyjne: generuje podsumowanie z zwięzłymi, spójnymi zdaniami lub wyrazami, które nie są dosłownym wyodrębnieniem zdań z oryginalnego źródła.
- Teksty podsumowujące: podsumowanie abstrakcyjne zwraca podsumowanie dla każdego kontekstowego zakresu danych wejściowych. Długie dane wejściowe można podzielić na segmenty, aby można było zwracać wiele grup tekstów podsumowujących z ich kontekstowym zakresem danych wejściowych.
- Kontekstowy zakres danych wejściowych: zakres danych wejściowych, który został użyty do wygenerowania tekstu podsumowania.

Rozważmy na przykład następujący akapit tekstu:

"W firmie Microsoft dążymy do rozwoju sztucznej inteligencji poza istniejącymi technikami, przyjmując bardziej całościowe, skoncentrowane na człowieku podejście do uczenia się i zrozumienia. Jako dyrektor ds. technologii usług Azure AI pracuję z zespołem niesamowitych naukowców i inżynierów, aby przekształcić to zadanie w rzeczywistość. W mojej roli lubię wyjątkową perspektywę w dostrzeganiu relacji między trzema atrybutami poznania ludzkiego: tekstem monolingwalnym (X), sygnałami sensorycznymi audio lub wizualnymi (Y) i treściami wielojęzycznymi (Z). Na skrzyżowaniu wszystkich trzech elementów istnieje magia — to, co nazywamy kodem XYZ, jak pokazano na rysunku 1 — wspólną reprezentacją umożliwiającą tworzenie bardziej wydajnej sztucznej inteligencji, która może mówić, słyszeć, widzieć i lepiej rozumieć ludzi. Uważamy, że kod XYZ umożliwia nam spełnienie naszej długoterminowej wizji: uczenie się transferu między domenami, obejmujące modalizacje i języki. Celem jest posiadanie wstępnie wytrenowanych modeli, które mogą razem uczyć się reprezentacji w celu wspierania szerokiej gamy podrzędnych zadań sztucznej inteligencji, podobnie jak ludzie to robią dzisiaj. W ciągu ostatnich pięciu lat osiągamy ludzką wydajność w testach porównawczych rozpoznawania mowy konwersacyjnej, tłumaczenia maszynowego, odpowiadania na pytania konwersacyjne, odczytywania tekstu maszynowego i podpisów obrazów. Te pięć przełomów dało nam silne sygnały w kierunku naszych bardziej ambitnych dążeń do osiągnięcia przełomu w możliwościach sztucznej inteligencji, umożliwiającego naukę wielozmysłową i wielojęzyczną, która jest bliższa temu, jak ludzie się uczą i rozumieją. Wierzę, że wspólny kod XYZ jest podstawowym składnikiem tego dążenia, o ile jest oparty na zewnętrznych źródłach wiedzy w końcowych zadaniach sztucznej inteligencji.

Żądanie podsumowania tekstu przez interfejs API jest przetwarzane po jego otrzymaniu poprzez utworzenie zadania na zapleczu API. Jeśli zadanie zakończyło się pomyślnie, zwracane są dane wyjściowe interfejsu API. Dane wyjściowe są dostępne do pobierania przez 24 godziny. Po tym czasie dane wyjściowe są usuwane. Ze względu na obsługę wielojęzycznych tekstów i emoji, odpowiedź może zawierać przesunięcia tekstu. Aby uzyskać więcej informacji, zapoznaj się z jak przetwarzać przesunięcia.

Jeśli użyjemy powyższego przykładu, interfejs API może zwrócić następujące podsumowania:

Podsumowanie wyodrębnione:

"W firmie Microsoft dążymy do rozwoju sztucznej inteligencji poza istniejącymi technikami, przyjmując bardziej całościowe, skoncentrowane na człowieku podejście do uczenia się i zrozumienia".
"Uważamy, że XYZ-code umożliwia nam spełnienie naszej długoterminowej wizji: uczenie transferowe między domenami, obejmujące modalizacje i języki."
Celem jest opracowanie wstępnie wytrenowanych modeli, które mogą wspólnie uczyć się reprezentacji, aby wspierać szeroką gamę dalszych zastosowań AI, podobnie jak robią to ludzie dziś.

Podsumowanie abstrakcyjne:

"Firma Microsoft przyjmuje bardziej całościowe, skoncentrowane na człowieku podejście do uczenia się i zrozumienia. Uważamy, że kod XYZ umożliwia nam spełnienie naszej długoterminowej wizji: uczenie się transferu między domenami, obejmujące modalizacje i języki. W ciągu ostatnich pięciu lat osiągnęliśmy ludzką wydajność w zakresie testów porównawczych w rozpoznawaniu mowy konwersacyjnej.

Ta dokumentacja zawiera następujące typy artykułów:

Szybki start to instrukcje wprowadzające, które pomagają w wysyłaniu żądań do usługi.
Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.

Najważniejsze funkcje podsumowania konwersacji

Podsumowanie konwersacji obsługuje następujące funkcje:

Podsumowanie: podsumowuje konwersację w krótkim akapicie.
Podsumowanie problemu/rozwiązania: Funkcje specyficzne dla centrum telefonicznego, które dają podsumowanie problemów i rozwiązań w rozmowach między agentami obsługi klienta i klientami.
Podsumowanie tytułu rozdziału: Dzieli konwersację na rozdziały na podstawie tematów omówionych w konwersacji i zawiera sugerowane tytuły rozdziałów konwersacji wejściowej.
Podsumowanie narracyjne: generuje szczegółowe notatki z rozmów telefonicznych, notatki ze spotkań lub podsumowania czatów z wprowadzonej konwersacji.

Rozważmy na przykład następującą przykładową konwersację:

Agent: "Witaj, rozmawiasz z Rene. Jak mogę Ci pomóc?"

Klient: "Cześć, próbowałem skonfigurować połączenie wi-fi dla ekspresu do kawy Smart Brew 300, ale to nie zadziałało."

Agent: "Przykro mi to słyszeć. Zobaczmy, co możemy zrobić, aby rozwiązać ten problem. Czy możesz nacisnąć przycisk połączenia Wi-Fi, przytrzymać przez 3 sekundy, a następnie daj znać, czy dioda zasilania powoli miga?"

Klient: "Tak, nacisnąłem przycisk połączenia wi-fi, a teraz światło zasilania miga powoli."

Agent: "Świetnie. Dziękuję! Teraz otwórz aplikację Contoso Coffee. Czy prosi o nawiązanie połączenia z maszyną?"

Klient: "Nie. Nic się nie stało.

Agent: "Widzę. Dzięki. Spróbujmy, jeśli zresetowanie do ustawień fabrycznych może rozwiązać ten problem. Czy możesz nacisnąć i trzymać przycisk środkowy przez 5 sekund, aby uruchomić resetowanie do ustawień fabrycznych."

Klient: "Próbowałem zresetować do ustawień fabrycznych i ponownie wykonałem powyższe kroki, ale nadal nie zadziałało".

Agent: "Bardzo mi przykro to słyszeć. Pozwól, że sprawdzę, czy istnieje inny sposób rozwiązania problemu. Proszę poczekać chwilę."

Funkcja podsumowania konwersacji uprościłaby tekst w następujący sposób:

Przykładowe podsumowanie	Uwaga	Aspekt konwersacji
Klient nie może skonfigurować połączenia wi-fi dla ekspresu smart brew 300 espresso	problem klienta w rozmowie między klientem a agentem	kwestia
Agent zasugerował kilka kroków rozwiązywania problemów, w tym sprawdzenie połączenia wi-fi, sprawdzenie aplikacji Contoso Coffee i przeprowadzenie resetowania do ustawień fabrycznych. Jednak żaden z tych kroków nie rozwiązał problemu. Następnie agent wstrzymał klienta, aby wyszukać inne rozwiązanie.	rozwiązania wypróbowane w konwersacji z klientem i agentem	rozwiązanie
Klient skontaktował się z agentem w celu uzyskania pomocy przy konfigurowaniu połączenia wi-fi dla swojego ekspresu do kawy Smart Brew 300. Agent prowadził klienta przez kilka kroków rozwiązywania problemów, w tym sprawdzanie połączenia wi-fi, sprawdzanie światła zasilania i resetowanie do ustawień fabrycznych. Pomimo wykonania tych kroków problem nadal występował. Następnie agent postanowił zbadać inne potencjalne rozwiązania	Podsumowuje konwersację w jednym akapicie	Podsumowanie
Rozwiązywanie problemów z maszyną SmartBrew 300 Espresso	Segmentuje konwersację i generuje tytuł dla każdego segmentu; zazwyczaj współpracuje z aspektem `narrative`	rozdziałTitle
Klient ma problemy z skonfigurowaniem połączenia wi-fi dla swojego ekspresu Smart Brew 300 espresso. Agent sugeruje kilka rozwiązań, w tym resetowanie do ustawień fabrycznych, ale problem nadal występuje.	Segmentuje konwersację i generuje podsumowanie dla każdego segmentu, zwykle współpracuje z aspektem `chapterTitle`.	narracja

Ta dokumentacja zawiera następujące typy artykułów:

Szybki start to instrukcje wprowadzające, które pomagają w wysyłaniu żądań do usługi.
Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.

Podsumowanie dokumentów natywnych używa technik przetwarzania języka naturalnego do generowania podsumowania dokumentów natywnych. Dokument natywny odnosi się do formatu pliku używanego do tworzenia oryginalnego dokumentu, takiego jak Microsoft Word (docx) lub przenośny plik dokumentu (pdf). Obsługa dokumentów natywnych eliminuje konieczność wstępnego przetwarzania tekstu przed użyciem funkcji zasobów języka sztucznej inteligencji platformy Azure. Obecnie obsługa dokumentów natywnych jest dostępna dla dwóch typów podsumowań:

Podsumowanie wyodrębniające: tworzy podsumowanie, wyodrębniając ważne zdania w dokumencie, a następnie umieszczając informacje o pozycjonowaniu tych zdań.
- Wiele wyodrębnionych zdań: zdania te łącznie przekazują główną ideę dokumentu. Są to oryginalne zdania wyodrębnione z zawartości dokumentu wejściowego.
- Wynik klasyfikacji: wynik rangi wskazuje, jak istotne jest zdanie do głównego tematu. Podsumowanie tekstu klasyfikuje wyodrębnione zdania i możesz określić, czy są zwracane w kolejności, w której się pojawiają, czy według ich rangi. Jeśli na przykład zażądasz podsumowania wyodrębniającego z trzema zdaniami, zwróci trzy najwyżej oceniane zdania.
- Informacje pozycyjne: pozycja początkowa i długość wyodrębnionych zdań.
Podsumowanie abstrakcyjne: tworzy podsumowanie składające się z zwięzłych i spójnych zdań lub wyrazów, które nie są dosłownie wyjęte z oryginalnego dokumentu.
- Teksty podsumowujące: podsumowanie abstrakcyjne zwraca podsumowanie dla każdego kontekstowego zakresu danych wejściowych. Długie dane wejściowe można podzielić na segmenty, aby można było zwracać wiele grup tekstów podsumowujących z ich kontekstowym zakresem danych wejściowych.
- Kontekstowy zakres danych wejściowych: zakres danych wejściowych, który został użyty do wygenerowania tekstu podsumowania.

Obecnie podsumowanie dokumentów obsługuje następujące natywne formaty dokumentów:

Typ pliku	Rozszerzenie pliku	Opis
Tekst	`.txt`	Niesformatowany dokument tekstowy.
Adobe PDF	`.pdf`	Przenośny plik dokumentu sformatowany.
Microsoft Word	`.docx`	Plik dokumentu programu Microsoft Word.

Aby uzyskać więcej informacji, zobaczPodsumowanie dokumentów natywnych

Rozpocznij podsumowywanie

Aby użyć podsumowania, należy przesłać dane wyjściowe interfejsu API do analizy i obsługiwać je w aplikacji. Analiza jest wykonywana w stanie niezmienionym, bez dodatkowego dostosowania do modelu używanego do analizy Twoich danych. Istnieją dwa sposoby użycia podsumowania:

Opcja programowania	Opis
Azure AI Foundry	Azure AI Foundry to platforma internetowa, która umożliwia łączenie jednostek przy użyciu przykładów tekstowych z własnymi danymi przy rejestracji. Aby uzyskać więcej informacji, zobacz witrynę internetową usługi Azure AI Foundry lub dokumentację usługi Azure AI Foundry.
Interfejs REST API lub biblioteka klienta (Azure SDK)	Integrowanie podsumowania tekstu z aplikacjami przy użyciu interfejsu API REST lub biblioteki klienta dostępnej w różnych językach. Aby uzyskać więcej informacji, zobacz przewodnik szybkiego rozpoczęcia podsumowania.

Opcja programowania	Opis	Linki
Interfejs programistyczny REST	Zintegruj podsumowanie konwersacji z aplikacjami przy użyciu API REST.	Szybki start: używanie podsumowania konwersacji

Opcja programowania	Opis
Azure AI Foundry	Azure AI Foundry to platforma internetowa, która umożliwia łączenie jednostek przy użyciu przykładów tekstowych z własnymi danymi przy rejestracji. Aby uzyskać więcej informacji, zobacz witrynę internetową usługi Azure AI Foundry lub dokumentację usługi Azure AI Foundry.
Interfejs REST API lub biblioteka klienta (Azure SDK)	Integrowanie podsumowania tekstu z aplikacjami przy użyciu interfejsu API REST lub biblioteki klienta dostępnej w różnych językach. Aby uzyskać więcej informacji, zobacz przewodnik szybkiego rozpoczęcia podsumowania.

Wymagania dotyczące danych wejściowych i limity usług

Proces podsumowywania pobiera tekst do analizy. Aby uzyskać więcej informacji, zobacz Limity danych i usług w przewodniku z instrukcjami .
Podsumowywanie działa z różnymi językami pisanymi. Aby uzyskać więcej informacji, zobacz obsługa języków.

Dokumentacja referencyjna i przykłady kodu

Podczas korzystania z podsumowania tekstu w aplikacjach zapoznaj się z następującą dokumentacją referencyjną i przykładami dla języka AI platformy Azure:

Opcja/język programowania	Dokumentacja referencyjna	Przykłady
C#	Dokumentacja języka C#	Przykłady języka C#
Jawa	Dokumentacja języka Java	Przykłady języka Java
JavaScript	Dokumentacja języka JavaScript	Przykłady języka JavaScript
Pyton	Dokumentacja języka Python	Przykłady w języku Python

Odpowiedzialne AI

System sztucznej inteligencji obejmuje nie tylko technologię, ale także osoby, które go używają, osoby, których to dotyczy, oraz środowisko wdrażania. Przeczytaj notatkę dotyczącą przejrzystości podsumowania , aby dowiedzieć się więcej na temat odpowiedzialnego używania i wdrażania sztucznej inteligencji w systemach. Aby uzyskać więcej informacji, zobacz następujące artykuły:

Udostępnij za pośrednictwem

Co to jest podsumowanie?

Możliwości

Typowy przepływ pracy

Kluczowe funkcje podsumowywania tekstu

Rozpocznij podsumowywanie

Wymagania dotyczące danych wejściowych i limity usług

Dokumentacja referencyjna i przykłady kodu

Odpowiedzialne AI

Opinia

Dodatkowe zasoby