Co to jest podsumowanie?
Ważne
Nasz region wersji zapoznawczej, Szwecja Środkowa, prezentuje nasze najnowsze i stale ewoluujące techniki dostrajania LLM oparte na modelach GPT. Zapraszamy do wypróbowania ich z zasobem Język w regionie Centralnym Szwecji.
Podsumowanie konwersacji jest dostępne tylko przy użyciu:
- Interfejs API REST
- Python
- C#
Podsumowanie to jedna z funkcji oferowanych przez język AI platformy Azure, która jest kombinacją generowania modeli dużych języków i modeli koderów zoptymalizowanych pod kątem zadań, które oferują rozwiązania podsumowania z wyższą jakością, wydajnością kosztów i niższym opóźnieniem. Skorzystaj z tego artykułu, aby dowiedzieć się więcej o tej funkcji i sposobie jej używania w aplikacjach.
Usługa oferuje rozwiązania podsumowania dla trzech typów gatunków, zwykłych tekstów, konwersacji i dokumentów natywnych. Podsumowanie tekstu akceptuje tylko bloki zwykłego tekstu, a podsumowanie konwersacji akceptuje dane wejściowe konwersacyjne, w tym różne sygnały audio mowy w celu efektywnego segmentowania i podsumowywania modelu, a dokument natywny może bezpośrednio podsumowywać dokumenty w ich natywnych formatach, takich jak Słowa, PDF itp.
Ta dokumentacja zawiera następujące typy artykułów:
- Przewodniki Szybki start to instrukcje wprowadzające, które ułatwiają wysyłanie żądań do usługi.
- Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.
Te funkcje zostały zaprojektowane tak, aby skrócić zawartość, którą można uznać za zbyt długą do odczytania.
Kluczowe funkcje podsumowywania tekstu
Podsumowywanie tekstu używa technik przetwarzania języka naturalnego do generowania podsumowania zwykłych tekstów, które mogą pochodzić z dokumentu lub konwersacji lub dowolnych tekstów. Istnieją dwa podejścia do podsumowania tego interfejsu API:
Podsumowanie wyodrębniające: tworzy podsumowanie, wyodrębniając ważne zdania w dokumencie, a następnie umieszczając informacje o pozycjonowaniu tych zdań.
- Wiele wyodrębnionych zdań: zdania te łącznie przekazują główną ideę dokumentu. Są to oryginalne zdania wyodrębnione z zawartości dokumentu wejściowego.
- Wynik klasyfikacji: wynik rangi wskazuje, jak istotne jest zdanie do głównego tematu. Podsumowanie tekstu klasyfikuje wyodrębnione zdania i możesz określić, czy są zwracane w kolejności, w której się pojawiają, czy według ich rangi. Jeśli na przykład zażądasz podsumowania wyodrębniania sumaryczne z trzema zdaniami, zwraca trzy zdania o najwyższych wynikach.
- Informacje pozycyjne: pozycja początkowa i długość wyodrębnionych zdań.
Podsumowanie abstrakcyjne: generuje podsumowanie z zwięzłymi, spójnymi zdaniami lub wyrazami, które nie są dosłowne wyodrębnianie zdań z oryginalnego dokumentu.
- Teksty podsumowujące: podsumowanie abstrakcyjne zwraca podsumowanie dla każdego kontekstowego zakresu danych wejściowych. Długie dane wejściowe można podzielić na segmenty, aby można było zwracać wiele grup tekstów podsumowujących z ich kontekstowym zakresem danych wejściowych.
- Zakres danych wejściowych kontekstowych: zakres w danych wejściowych, który został użyty do wygenerowania tekstu podsumowania.
Rozważmy na przykład następujący akapit tekstu:
"W firmie Microsoft dążymy do rozwoju sztucznej inteligencji poza istniejącymi technikami, przyjmując bardziej całościowe, skoncentrowane na człowieku podejście do uczenia się i zrozumienia. Jako dyrektor ds. technologii usług Azure AI pracuję z zespołem niesamowitych naukowców i inżynierów, aby przekształcić to zadanie w rzeczywistość. W mojej roli lubię wyjątkową perspektywę w wyświetlaniu relacji między trzema atrybutami poznania ludzkiego: monolingual text (X), audio lub wizualnych sygnałów sensorycznej, (Y) i wielojęzycznych (Z). Na skrzyżowaniu wszystkich trzech elementów istnieje magia — to, co nazywamy kodem XYZ, jak pokazano na rysunku 1 — wspólną reprezentacją umożliwiającą tworzenie bardziej wydajnej sztucznej inteligencji, która może mówić, słyszeć, widzieć i lepiej rozumieć ludzi. Uważamy, że kod XYZ umożliwia nam spełnienie naszej długoterminowej wizji: uczenie się transferu między domenami, obejmujące modalizacje i języki. Celem jest posiadanie wstępnie wytrenowanych modeli, które mogą wspólnie uczyć się reprezentacji w celu obsługi szerokiej gamy podrzędnych zadań sztucznej inteligencji, znacznie w sposób, w jaki ludzie robią to dzisiaj. W ciągu ostatnich pięciu lat osiągamy ludzką wydajność w testach porównawczych rozpoznawania mowy konwersacyjnej, tłumaczenia maszynowego, odpowiadania na pytania konwersacyjne, odczytywania tekstu maszynowego i podpisów obrazów. Te pięć przełomowych przełomów dało nam silne sygnały w kierunku naszych bardziej ambitnych aspiracji do stworzenia skoku w zakresie możliwości sztucznej inteligencji, osiągnięcia wieloczułowego i wielojęzycznego uczenia się, który jest bliżej tego, jak ludzie uczą się i rozumieją. Wierzę, że wspólny kod XYZ jest podstawowym składnikiem tego aspiracji, jeśli uziemiony zewnętrznymi źródłami wiedzy w podrzędnych zadaniach sztucznej inteligencji."
Żądanie interfejsu API podsumowania tekstu jest przetwarzane po otrzymaniu żądania przez utworzenie zadania dla zaplecza interfejsu API. Jeśli zadanie zakończyło się pomyślnie, zwracane są dane wyjściowe interfejsu API. Dane wyjściowe są dostępne do pobierania przez 24 godziny. Po tym czasie dane wyjściowe są czyszczone. Ze względu na obsługę wielojęzycznych i emoji odpowiedź może zawierać przesunięcia tekstu. Aby uzyskać więcej informacji, zobacz jak przetwarzać przesunięcia.
Jeśli użyjemy powyższego przykładu, interfejs API może zwrócić następujące podsumowania:
Podsumowanie wyodrębnione:
- "W firmie Microsoft dążymy do rozwoju sztucznej inteligencji poza istniejącymi technikami, przyjmując bardziej całościowe, skoncentrowane na człowieku podejście do uczenia się i zrozumienia".
- "Uważamy, że XYZ-code umożliwia nam spełnienie naszej długoterminowej wizji: uczenie transferowe między domenami, obejmujące modalizacje i języki."
- "Celem jest posiadanie wstępnie wytrenowanych modeli, które mogą wspólnie uczyć się reprezentacji, aby obsługiwać szeroką gamę podrzędnych zadań sztucznej inteligencji, znacznie w sposób, w jaki ludzie robią dziś."
Podsumowanie abstrakcyjne:
- "Firma Microsoft przyjmuje bardziej całościowe, skoncentrowane na człowieku podejście do uczenia się i zrozumienia. Uważamy, że kod XYZ umożliwia nam spełnienie naszej długoterminowej wizji: uczenie się transferu między domenami, obejmujące modalizacje i języki. W ciągu ostatnich pięciu lat osiągnęliśmy ludzką wydajność w zakresie testów porównawczych w rozpoznawaniu mowy konwersacyjnej.
Wprowadzenie do podsumowania
Aby użyć podsumowania, należy przesłać dane wyjściowe interfejsu API do analizy i obsługiwać je w aplikacji. Analiza jest wykonywana zgodnie z rzeczywistym użyciem, bez dodatkowego dostosowania do modelu używanego na danych. Istnieją dwa sposoby użycia podsumowania:
Opcja programowania | opis |
---|---|
Studio językowe | Language Studio to platforma internetowa, która umożliwia wypróbowanie łączenia jednostek z przykładami tekstowymi bez konta platformy Azure i własnych danych podczas tworzenia konta. Aby uzyskać więcej informacji, zobacz witrynę internetową language Studio lub przewodnik Szybki start dla programu Language Studio. |
Interfejs API REST lub biblioteka klienta (Zestaw Azure SDK) | Integrowanie podsumowania tekstu z aplikacjami przy użyciu interfejsu API REST lub biblioteki klienta dostępnej w różnych językach. Aby uzyskać więcej informacji, zobacz przewodnik Szybki start podsumowania. |
Wymagania dotyczące danych wejściowych i limity usług
- Podsumowanie pobiera tekst do analizy. Aby uzyskać więcej informacji, zobacz Limity danych i usług w przewodniku z instrukcjami .
- Podsumowanie działa z różnymi językami napisanymi. Aby uzyskać więcej informacji, zobacz obsługa języków.
Dokumentacja referencyjna i przykłady kodu
Podczas korzystania z podsumowania tekstu w aplikacjach zapoznaj się z następującą dokumentacją referencyjną i przykładami dla języka AI platformy Azure:
Opcja/język programowania | Dokumentacja referencyjna | Przykłady |
---|---|---|
C# | Dokumentacja języka C# | Przykłady języka C# |
Java | Dokumentacja języka Java | Przykłady języka Java |
JavaScript | Dokumentacja języka JavaScript | Przykłady języka JavaScript |
Python | Dokumentacja języka Python | Przykłady w języku Python |
Odpowiedzialne AI
System sztucznej inteligencji obejmuje nie tylko technologię, ale także osoby, które go używają, osoby, których to dotyczy, oraz środowisko wdrażania. Przeczytaj notatkę dotyczącą przejrzystości podsumowania , aby dowiedzieć się więcej na temat odpowiedzialnego używania i wdrażania sztucznej inteligencji w systemach. Aby uzyskać więcej informacji, zobacz następujące artykuły: