Что такое обобщение?

2025-04-22

Важный

Наша региональная предварительная версия, Центральная Швеция, демонстрирует наши новейшие и постоянно развивающиеся методы тонкой настройки LLM на основе моделей GPT. Вы можете опробовать их, используя языковой ресурс в регионе Центральной Швеция.

Сводка разговора доступна только с использованием:

REST API
Питон
C#

Суммаризация — это функция, предлагаемая Azure AI Language, комбинацией генеративных моделей больших языков и оптимизированных под задачи моделей-энкодеров, которые предоставляют решения для суммаризации с более высоким качеством, экономичностью и меньшей задержкой. Используйте эту статью, чтобы узнать больше об этой функции и о том, как её использовать в ваших приложениях.

В стандартной комплектации сервис предоставляет решения для суммирования трех типов жанров: простые тексты, диалоги и собственные документы. Суммаризация текста принимает только блоки обычного текста. Функция резюмирования разговоров принимает разговорный ввод, включая различные аудиосигналы речи. Функция суммирования документов в их родных форматах принимает документы в таких форматах, как Word, PDF или простой текст. Для получения дополнительной информации см. разделПоддерживаемые форматы документов.

Подсказка

Попробуйте функцию суммирования в портале Azure AI Foundry. Там вы можете использовать уже существующий ресурс Language Studio или создать новый ресурс Azure AI Foundry, чтобы воспользоваться этой услугой.

Возможности

Эта документация содержит следующие типы статей:

Быстрые старты — это инструкции для начала работы, которые помогут вам сделать запросы к сервису.
Руководства содержат инструкции по использованию сервиса более конкретными или индивидуальными способами.

Стандартный рабочий процесс

Чтобы использовать эту возможность, нужно в приложении передать данные для анализа и обработать полученный от API результат. Анализ выполняется без изменений, без какой-либо дополнительной настройки модели, использованной на ваших данных.

Создайте ресурс языка ИИ Azure, который предоставляет вам доступ к функциям, предлагаемым языком искусственного интеллекта Azure. Он создает пароль (называемый ключом) и URL-адрес конечной точки, используемый для проверки подлинности запросов API.
Создайте запрос, используя REST API или клиентскую библиотеку для C#, Java, JavaScript или Python. Также можно отправить асинхронные вызовы с пакетным запросом, чтобы объединить в один вызов несколько запросов к разным функциям API.
Отправьте запрос, содержащий текстовые данные. Ключ и конечная точка используются для проверки подлинности.
Выполните потоковую передачу ответа или сохраните его локально.

Kлючевые особенности текстового резюмирования

Текстовое резюмирование использует методы обработки естественного языка для создания краткого содержания для простых текстов, которые могут быть взяты из документа, разговора или любых других текстов. Этот API предоставляет два подхода к суммированию:

Экстрактивное суммирование: Создаёт резюме, извлекая ключевые предложения из исходного текста вместе с информацией об их расположении.
- Несколько извлечённых предложений: Эти предложения совместно передают основную идею исходного текста. Они взяты из исходного текста и являются оригинальными предложениями.
- Оценка ранга: Оценка ранга показывает, насколько релевантно предложение основной теме. Суммаризация текста ранжирует извлеченные предложения, и вы можете определить, будут ли они возвращены в порядке их появления или в соответствии с их рангом. Например, если вы запрашиваете краткое изложение из трех предложений, то экстрактивное суммирование возвращает три предложения с наивысшими оценками.
- Позиционная информация: начальная позиция и длина извлечённых предложений.
Абстрактивное суммирование: Создает краткое и связное резюме, состоящее из предложений или слов, которые не являются дословными извлечениями из оригинального источника.
- Тексты резюме: Абстрактивное суммирование возвращает резюме для каждого диапазона контекстуального ввода. Длинный ввод можно сегментировать, чтобы вернуть несколько групп текстов резюме с их соответствующим диапазоном контекстного ввода.
- Контекстуальный диапазон ввода: Диапазон в предоставленных данных, который использовался для создания текста краткого содержания.

В качестве примера рассмотрим следующий абзац текста:

В компании Microsoft мы стремимся продвинуть технологии искусственного интеллекта за пределы существующих методов, применяя более целостный подход, ориентированный на человека, к обучению и пониманию. В качестве главного технического директора Azure AI services я работаю с командой удивительных учёных и инженеров, чтобы превратить эту задачу в реальность. В моей роли я наслаждаюсь уникальной перспективой в понимании взаимосвязи между тремя аспектами человеческого познания: монолингвальный текст (X), аудио- или визуальные сенсорные сигналы (Y) и мультиязычность (Z). На пересечении всех трёх есть нечто магическое — то, что мы называем XYZ-код, как показано на Рисунке 1 — совместное представление для создания более мощного ИИ, который может лучше говорить, слышать, видеть и понимать человека. Мы верим, что код XYZ позволяет нам реализовать наше долгосрочное видение: перенос обучения между доменами, охватывающий различные модальности и языки. Цель состоит в том, чтобы иметь предобученные модели, которые могут совместно изучать представления для поддержки широкого спектра последующих задач в области искусственного интеллекта, подобно тому, как это делают люди сегодня. За последние пять лет мы достигли уровня человеческих возможностей в эталонах распознавания разговорной речи, машинного перевода, ответа на вопросы в разговорной форме, понимания текстов и создания подписей к изображениям. Эти пять прорывов дали нам сильные сигналы в направлении нашей более амбициозной цели сделать скачок в возможностях ИИ, достигнув многоуровневого и многоязычного обучения, более соответствующего тому, как люди учатся и понимают. Я считаю, что общий XYZ-код является основополагающим компонентом этого устремления, если он основан на внешних источниках знаний в последующих AI задачах.

Запрос на API для суммаризации текста обрабатывается после его получения путем создания задачи для бэкенда API. Если задание выполнено успешно, возвращается результат API. Результат доступен для получения в течение 24 часов. После этого времени вывод данных очищается. Из-за поддержки многоязычности и эмодзи, ответ может содержать смещения текста. Для получения дополнительной информации см. как обрабатывать смещения.

Если мы используем предыдущий пример, API может вернуть следующие резюме:

Экстрактивная суммаризация:

"В компании Microsoft мы стремимся продвинуть искусственный интеллект за пределы существующих методов, применяя более целостный, ориентированный на человека подход к обучению и пониманию."
Мы верим, что XYZ-код позволяет нам реализовать наше долгосрочное видение: перенос обучения между различными доменами, охватывающий различные модальности и языки.
Цель состоит в том, чтобы иметь предварительно обученные модели, которые могут совместно обучаться представлениям, поддерживающим широкий спектр последующих задач ИИ, аналогично тому, как это делают люди сегодня.

Абстрактная сводка:

Корпорация Microsoft применяет более целостный и ориентированный на человека подход к обучению и пониманию. Мы верим, что код XYZ позволяет нам реализовать наше долгосрочное видение: перенос обучения между доменами, охватывающий различные модальности и языки. За последние пять лет мы достигли человеческого уровня в распознавании речевого потока на контрольных тестах.

Эта документация содержит следующие типы статей:

Быстрые старты — это инструкции для начала работы, которые помогут вам сделать запросы к сервису.
Руководства содержат инструкции по использованию сервиса более конкретными или индивидуальными способами.

Основные функции для суммирования разговоров

Подведение итогов разговора поддерживает следующие функции:

Резюме: Сводит разговор в краткий абзац.
Сводка вопросов/резолюций: Особые функции колл-центра, предоставляющие сводку вопросов и решений в разговорах между агентами службы поддержки и вашими клиентами.
Резюмирование заголовков глав: Разделяет беседу на главы на основе обсуждаемых тем и предлагает рекомендуемые заголовки глав для вводимой беседы.
Создание повествовательного резюме: Генерирует подробные заметки о вызовах, заметки о встречах или аннотации чатов из входящего разговора.

В качестве примера рассмотрим следующий пример диалога:

Агент: "Здравствуйте, вы общаетесь с Рене. Чем я могу вам помочь?"

Покупатель: "Здравствуйте, я пытался настроить подключение к Wi-Fi для кофемашины Smart Brew 300, но это не сработало."

Агент: "Сожалею, что это произошло. Давайте посмотрим, что мы можем сделать, чтобы решить эту проблему. Можете нажать кнопку подключения Wi-Fi, удерживать 3 секунды и затем сообщить мне, мигает ли индикатор питания медленно?"

Клиент: "Да, я нажал кнопку подключения к Wi-Fi, и теперь индикатор питания медленно мигает."

Агент: "Отлично. Спасибо! А теперь, пожалуйста, проверьте ваше приложение Contoso Coffee. Прошсит ли оно вас подключиться к машине?"

Клиент: "Нет. Ничего не произошло."

Агент: "Понятно. Спасибо. Давайте попробуем, может сброс настроек поможет решить проблему. Не могли бы Вы нажать и удерживать центральную кнопку в течение 5 секунд, чтобы начать сброс настроек."

Клиент: "Я пытался выполнить сброс до заводских настроек и снова следовал вышеуказанным шагам, но это все равно не сработало."

Агент: "Мне очень жаль это слышать. Позвольте мне посмотреть, есть ли другой способ решить проблему. Пожалуйста, подождите минуту."

Функция суммирования разговора упростит текст следующим образом:

Пример резюме	Замечание	Аспект разговора
Клиент не может установить подключение к Wi-Fi для кофемашины Smart Brew 300.	проблема клиента в разговоре между клиентом и агентом	вопрос
Агент предложил несколько шагов по устранению неполадок, включая проверку подключения к Wi-Fi, проверку приложения Contoso Coffee и выполнение сброса до заводских настроек. Однако ни один из этих шагов не решил проблему. Агент затем поставил клиента на удержание, чтобы поискать другое решение.	попытки решений в разговоре между клиентом и агентом	разрешение
Клиент обратился к агенту за помощью в настройке WiFi-соединения для своей кофемашины Smart Brew 300. Агент провел клиента через несколько шагов устранения неполадок, включая проверку подключения Wi-Fi, проверку индикатора питания и сброс настроек до заводских. Несмотря на выполнение этих шагов, проблема осталась. Затем агент решил изучить другие потенциальные решения.	Суммирует разговор в один абзац	краткий обзор
Устранение неполадок в кофемашине SmartBrew 300	Делит разговор на сегменты и генерирует заголовок для каждого сегмента; обычно работает совместно с аспектом `narrative`.	Название главы
Клиент испытывает трудности с настройкой Wi-Fi соединения для своей кофемашины Smart Brew 300. Агент предлагает несколько решений, включая сброс к заводским настройкам, но проблема остаётся.	Сегментирует разговор и создает краткое содержание для каждого сегмента, обычно работает вместе с аспектом `chapterTitle`.	повествование

Эта документация содержит следующие типы статей:

Быстрые старты — это инструкции для начала работы, которые помогут вам сделать запросы к сервису.
Руководства содержат инструкции по использованию сервиса более конкретными или индивидуальными способами.

Нативное суммирование документов использует методы обработки естественного языка для создания резюме для нативных документов. Родной документ относится к файловому формату, который используется для создания оригинального документа, такого как Microsoft Word (docx) или портативный файл документа (pdf). Поддержка собственных документов устраняет необходимость предварительной обработки текста перед использованием возможностей ресурсов языка искусственного интеллекта Azure. В настоящее время поддержка нативных документов доступна для двух типов обобщения:

Экстрактивное суммирование: Создает краткое содержание путем извлечения ключевых предложений из документа вместе с информацией о расположении этих предложений.
- Несколько извлеченных предложений: Эти предложения коллективно передают основную идею документа. Это оригинальные предложения, извлеченные из содержания исходного документа.
- Оценка ранга: Оценка ранга показывает, насколько релевантно предложение основной теме. Суммаризация текста ранжирует извлеченные предложения, и вы можете определить, будут ли они возвращены в порядке их появления или в соответствии с их рангом. Например, если вы запрашиваете краткое изложение из трех предложений, то экстрактивное суммирование возвращает три предложения с наивысшими оценками.
- Позиционная информация: начальная позиция и длина извлечённых предложений.
Абстрактное резюме: Генерирует резюме с краткими, связными предложениями или словами, которые не являются дословными извлечениями из исходного документа.
- Тексты резюме: Абстрактивное суммирование возвращает резюме для каждого диапазона контекстуального ввода. Длинный ввод можно сегментировать, чтобы вернуть несколько групп текстов резюме с их соответствующим диапазоном контекстного ввода.
- Контекстуальный диапазон ввода: Диапазон в предоставленных данных, который использовался для создания текста краткого содержания.

В настоящее время Суммирование документов поддерживает следующие форматы исходных документов:

Тип файла	Расширение файла	Описание
Текст	`.txt`	Неотформатированный текстовый документ.
Adobe PDF	`.pdf`	Документ в формате переносимого файла.
Майкрософт Ворд	`.docx`	Файл документа Microsoft Word.

Для получения дополнительной информации см. вРезюме собственных документов

Начните с резюмирования

Чтобы использовать функции суммаризации, отправьте данные на анализ и обработайте вывод API в вашем приложении. Анализ выполняется без изменений, без какой-либо дополнительной настройки модели, использованной на ваших данных. Существует два способа использования summarization:

Вариант разработки	Описание
Azure AI Foundry	Azure AI Foundry — это веб-платформа, позволяющая использовать связывание сущностей с текстовыми примерами и вашими собственными данными после регистрации. Для получения дополнительной информации посетите веб-сайт Azure AI Foundry или документацию Azure AI Foundry.
REST API или Клиентская библиотека (Azure SDK)	Интегрируйте текстовое суммирование в ваши приложения с использованием REST API или библиотеки клиента, доступной на различных языках. Для получения дополнительной информации см. summarization quickstart.

Вариант разработки

Описание

Azure AI Foundry

Azure AI Foundry — это веб-платформа, позволяющая использовать связывание сущностей с текстовыми примерами и вашими собственными данными после регистрации. Для получения дополнительной информации посетите веб-сайт Azure AI Foundry или документацию Azure AI Foundry.

REST API или Клиентская библиотека (Azure SDK)

Интегрируйте текстовое суммирование в ваши приложения с использованием REST API или библиотеки клиента, доступной на различных языках. Для получения дополнительной информации см. summarization quickstart.

Вариант разработки	Описание	Ссылки.
REST API	Интегрируйте суммирование диалогов в свои приложения с использованием REST API.	Быстрый старт: Используйте резюмирование разговоров

Вариант разработки	Описание
Azure AI Foundry	Azure AI Foundry — это веб-платформа, позволяющая использовать связывание сущностей с текстовыми примерами и вашими собственными данными после регистрации. Для получения дополнительной информации посетите веб-сайт Azure AI Foundry или документацию Azure AI Foundry.
REST API или Клиентская библиотека (Azure SDK)	Интегрируйте текстовое суммирование в ваши приложения с использованием REST API или библиотеки клиента, доступной на различных языках. Для получения дополнительной информации см. summarization quickstart.

Вариант разработки

Описание

Azure AI Foundry

REST API или Клиентская библиотека (Azure SDK)

Требования к вводу и ограничения на обслуживание

Суммирование анализирует текст. Дополнительную информацию см. в разделе Ограничения данных и услуг в руководстве.
Обобщение работает с различными письменными языками. Для получения дополнительной информации см. language support.

Справочная документация и примеры кода

Когда вы используете суммаризацию текста в своих приложениях, ознакомьтесь со следующей справочной документацией и примерами для Azure AI Language.

Вариант разработки / язык	Справочная документация	Образцы
C#	Документация по C#	Примеры C#
Ява	Документация по Java	Примеры для Java
JavaScript	Документация по работе с JavaScript.	Примеры JavaScript
Питон	Документация по Python.	Примеры для Python

Ответственный ИИ

Система искусственного интеллекта включает не только технологию, но и людей, которые её используют, людей, на которых она влияет, и среду развёртывания. Прочитайте заметку о прозрачности для суммирования, чтобы узнать о разумном использовании и внедрении ИИ в ваши системы. Для получения дополнительной информации см. следующие статьи:

Поделиться через

Что такое обобщение?

Возможности

Стандартный рабочий процесс

Kлючевые особенности текстового резюмирования

Начните с резюмирования

Требования к вводу и ограничения на обслуживание

Справочная документация и примеры кода

Ответственный ИИ

Обратная связь

Дополнительные ресурсы