Что такое суммирование?

Мақала
05/07/2024

Внимание

Наш предварительный просмотр региона, Швеция Central, демонстрирует наши последние и постоянно развивающиеся методы тонкой настройки LLM на основе моделей GPT. Вы можете попробовать их с языковым ресурсом в Центральном регионе Швеции.

Сводка по беседам доступна только с помощью:

REST API
Python
C#

Сводка — это одна из функций, предлагаемых языком искусственного интеллекта Azure, которая представляет собой сочетание созданных моделей больших языков и моделей кодировщика, оптимизированных для задач, которые предлагают решения для суммирования с более высоким качеством, экономичностью и низкой задержкой. Используйте эту статью для получения дополнительных сведений о данной функции и ее использовании в приложениях.

Вне поля служба предоставляет решения для суммирования для трех типов жанров, простых текстов, бесед и собственных документов. Суммирование текста принимает только блоки обычного текста, а сводка бесед принимает входные данные беседы, включая различные звуковые сигналы речи, чтобы модель эффективно сегментировала и суммирует, а собственный документ может напрямую суммировать документы в собственных форматах, таких как слова, PDF и т. д.

Эта документация включает статьи следующих типов:

Краткие руководства — инструкции по началу работы и отправке запросов в службу.
Руководства — содержат инструкции для более специфического или специализированного использования службы.

Эти функции предназначены для сокращения содержимого, которое можно считать слишком длинным для чтения.

Ключевые функции для суммирования текста

Сводка текста использует методы обработки естественного языка для создания сводки для простых текстов, которые могут быть из документа или беседы или любого текста. Существует два подхода к обобщению этого API:

Извлечение сводных данных: создает сводку, извлекая в документе ключевые предложения вместе с информацией о расположении этих предложений.
- Несколько извлеченных предложений: эти предложения коллективно передают основную идею документа. Они исходные предложения, извлеченные из содержимого входного документа.
- Оценка ранжирования: оценка ранжирования указывает, насколько релевантно предложение к главной теме. Формирование сводных данных ранжирует извлеченные предложения, чтобы у вас была возможность определить, возвращаются ли они в том же порядке, в котором они отображаются, или в соответствии с их рейтингом. Например, если вы запрашиваете три предложения сводных сводных суммарных сводных данных, возвращает три наиболее оцененных предложения.
- Сведения о положении в тексте: Начальное расположение и длина извлеченных предложений.
Абстрактная сводка: создает сводку с краткими, последовательными предложениями или словами, которые не являются подробными, извлекающими предложения из исходного документа.
- Сводные тексты: абстрактная сводка возвращает сводку для каждого контекстного входного диапазона. Длинные входные данные можно сегментировать, чтобы можно было вернуть несколько групп сводных текстов с их контекстным диапазоном входных данных.
- Контекстный входной диапазон: диапазон входных данных, используемый для создания сводного текста.

В качестве примера рассмотрим следующий абзац текста:

"В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию. Как главный технический директор служб ИИ Azure, я работал с командой удивительных ученых и инженеров, чтобы превратить этот поиск в реальность. Я использую в работе уникальный подход, основанный на рассмотрении взаимосвязей между тремя аспектами когнитивной деятельности человека: одноязычный текст (X), звуковые или визуальные сигналы (Y) и многоязычное восприятие (Z). На пересечении всех трех, есть магия - то, что мы называем XYZ-code, как показано на рис. 1- совместное представление для создания более мощных ИИ, которые могут говорить, слышать, видеть и понимать людей лучше. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. Наша цель состоит в том, чтобы предварительно обученные модели могли совместно изучать представления для поддержки широкого спектра нижестоящих задач ИИ, как сегодня это делают люди. За последние пять лет мы достигаем производительности на тестах в распознавании речи беседы, машинном переводе, ответе на беседы, машинном чтении и субтитрах изображений. Достижения по этим пяти направлениям дали нам твердую уверенность в возможности реализации более амбициозных задач, которые помогли бы нам совершить настоящий прорыв в области ИИ за счет мультисенсорного многоязычного обучения, которое по своей сути ближе к тому, как учатся и воспринимают информацию люди. Я полагаю, что этот совместный код XYZ может стать фундаментом для такого рывка при наличии соответствующих внешних источников знаний в нижестоящих задачах ИИ".

Запрос API суммирования текста обрабатывается при получении запроса путем создания задания для серверной части API. Если задание выполнено успешно, возвращается результат API. Выходные данные доступны для получения в течение 24 часов. По прошествии этого времени выходные данные очищаются. Благодаря поддержке многоязычных и эмодзи ответ может содержать смещения текста. Дополнительные сведения см. в статье об обработке смещения.

Если мы используем приведенный выше пример, API может вернуть следующие сводки:

Извлечение сводных данных:

"В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию".
"Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки".
"Цель состоит в том, чтобы иметь предварительно обученные модели, которые могут совместно изучать представления для поддержки широкого спектра подчиненных задач ИИ, много в том, как люди делают сегодня".

Абстрактная сводка:

"Корпорация Майкрософт принимает более целостный, ориентированный на человека подход к обучению и пониманию. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. За последние пять лет мы достигли человеческой производительности на тестах в распознавании речи беседы".

Эта документация включает статьи следующих типов:

Краткие руководства — инструкции по началу работы и отправке запросов в службу.
Руководства — содержат инструкции для более специфического или специализированного использования службы.

Ключевые функции для суммирования бесед

Сводка бесед поддерживает следующие функции:

Краткое описание. Сводка беседы в кратком абзаце.
Сводка вопросов и решений: специальные функции центра обработки вызовов, которые предоставляют сводку проблем и решений в беседах между агентами обслуживания клиентов и клиентами.
Сводка заголовка главы: сегментирует беседу в главы на основе тем, рассмотренных в беседе, и предоставляет предлагаемые заголовки глав входной беседы.
Сводка по повествованию: создает заметки о звонках, заметках о собраниях или сводках чата для входной беседы.

Для примера давайте рассмотрим следующий пример беседы:

Агент: "Привет, вы беседуете с Рене. Как я могу помочь вам?

Клиент: "Привет, я пытался настроить wi-fi подключение для Smart Brew 300 эспрессо-машины, но это не работало".

Агент: "Мне жаль, что вы услышите это. Давайте посмотрим, что мы можем сделать для устранения этой проблемы. Можете ли вы нажать кнопку подключения к Wi-Fi, удерживайте в течение 3 секунд, а затем сообщите мне, если свет питания медленно мигает?

Клиент: "Да, я нажал кнопку подключения Wi-Fi, и теперь индикатор питания медленно мигает."

Агент: "Отлично, спасибо! Теперь проверьте приложение Contoso Coffee. Есть ли там предложение подключиться к кофеварке?"

Клиент: "Нет. Там ничего не изменилось".

Агент: "Я вижу. Спасибо. Давайте попробуем, если сброс фабрики может решить эту проблему. Можете ли вы нажать и удерживать центральную кнопку в течение 5 секунд, чтобы начать сброс фабрики".

Клиент: "Я пытался сбросить завод и следовать приведенным выше шагам снова, но он все еще не работал".

Агент: "Я очень жаль услышать это. Позвольте мне узнать, есть ли еще один способ устранить проблему. Пожалуйста, удерживайте на минуту".

Функция суммирования бесед упростит текст следующим образом:

Пример сводки	Комментарий	Аспект беседы
Клиент не может настроить wi-fi connection for Smart Brew 300 espresso machine	Проблема с клиентом в беседе с клиентом и агентом	проблема
Агент предложил несколько действий по устранению неполадок, включая проверку подключения wi-fi, проверку приложения Contoso Coffee и сброс фабрики. Однако ни один из этих шагов не устранил проблему. Затем агент удерживает клиента на удержание, чтобы найти другое решение.	решения, проверенные в беседе с клиентом и агентом	разрешение
Клиент обратился к агенту за помощью по настройке wi-fi-подключения для их smart Brew 300 эспрессо-машины. Агент управлял клиентом с помощью нескольких действий по устранению неполадок, включая проверку подключения wi-fi, проверку питания и сброс фабрики. Несмотря на следующие действия, проблема сохранялась. Затем агент решил изучить другие потенциальные решения	Сводка беседы в один абзац	рекапитуляция
Устранение неполадок SmartBrew 300 Espresso Machine	Сегментирует беседу и создает заголовок для каждого сегмента; обычно совместная работа с `narrative` аспектом	chapterTitle
У клиента возникли проблемы с настройкой wi-fi-подключения для их Smart Brew 300 эспрессо-машины. Агент предлагает несколько решений, включая сброс фабрики, но проблема сохраняется.	Сегментирует беседу и создает сводку для каждого сегмента, как правило, совместно с `chapterTitle` аспектом	с автоописанием

Эта документация включает статьи следующих типов:

Краткие руководства — инструкции по началу работы и отправке запросов в службу.
Руководства — содержат инструкции для более специфического или специализированного использования службы.

Сводка документов использует методы обработки естественного языка для создания сводки для документов.

Собственный документ ссылается на формат файла, используемый для создания исходного документа, например Microsoft Word (docx) или переносимого файла документа (pdf). Поддержка собственных документов устраняет необходимость предварительной обработки текста перед использованием возможностей ресурсов языка искусственного интеллекта Azure. В настоящее время поддержка собственных документов доступна для двух типов суммирования:

Извлечение сводных данных: создает сводку, извлекая в документе ключевые предложения вместе с информацией о расположении этих предложений.
- Несколько извлеченных предложений: эти предложения коллективно передают основную идею документа. Они исходные предложения, извлеченные из содержимого входного документа.
- Оценка ранжирования: оценка ранжирования указывает, насколько релевантно предложение к главной теме. Формирование сводных данных ранжирует извлеченные предложения, чтобы у вас была возможность определить, возвращаются ли они в том же порядке, в котором они отображаются, или в соответствии с их рейтингом. Например, если вы запрашиваете три предложения сводных сводных суммарных сводных данных, возвращает три наиболее оцененных предложения.
- Сведения о положении в тексте: Начальное расположение и длина извлеченных предложений.
Абстрактная сводка: создает сводку с краткими, последовательными предложениями или словами, которые не являются подробными, извлекающими предложения из исходного документа.
- Сводные тексты: абстрактная сводка возвращает сводку для каждого контекстного входного диапазона. Длинные входные данные можно сегментировать, чтобы можно было вернуть несколько групп сводных текстов с их контекстным диапазоном входных данных.
- Контекстный входной диапазон: диапазон входных данных, используемый для создания сводного текста.

В настоящее время сводка документов поддерживает следующие собственные форматы документов:

Тип файла	Расширение файла	Описание
Текст	`.txt`	Неформатированный текстовый документ.
Adobe PDF	`.pdf`	Переносимый документ с форматированным документом.
Microsoft Word	`.docx`	Файл документа Microsoft Word.

Дополнительные сведения см. в разделе "Использование собственных документов для обработки языка"

Начало работы с формированием сводных данных

Чтобы использовать сводку, вы отправляете для анализа и обрабатываете выходные данные API в приложении. Анализ выполняется как есть, без добавления настройки модели, используемой для данных. Существует два способа использования функции формирования сводных данных:

Вариант разработки	Description
Студия службы "Язык"	Language Studio — это веб-платформа, которая позволяет попробовать связывание сущностей с текстовыми примерами без учетной записи Azure и собственных данных при регистрации. Дополнительные сведения см. в кратком руководстве по веб-сайту Или языковой студии Language Studio.
REST API или клиентская библиотека (пакет SDK для Azure)	Интеграция сводных данных текста в приложения с помощью REST API или клиентской библиотеки, доступной на различных языках. Дополнительные сведения см. в кратком руководстве по сводных данных.

Вариант разработки

Description

Студия службы "Язык"

Language Studio — это веб-платформа, которая позволяет попробовать связывание сущностей с текстовыми примерами без учетной записи Azure и собственных данных при регистрации. Дополнительные сведения см. в кратком руководстве по веб-сайту Или языковой студии Language Studio.

REST API или клиентская библиотека (пакет SDK для Azure)

Интеграция сводных данных текста в приложения с помощью REST API или клиентской библиотеки, доступной на различных языках. Дополнительные сведения см. в кратком руководстве по сводных данных.

Вариант разработки	Description	Ссылки.
REST API	Интеграция сводных данных о беседе в приложения с помощью REST API.	Краткое руководство: применение функции формирования сводных данных по беседе

Настраиваемая сводка позволяет пользователям создавать пользовательские модели искусственного интеллекта для суммирования неструктурированного текста, например контрактов или романов. Создавая проект пользовательской суммирования, разработчики могут итеративно пометить данные, обучить, оценить и повысить производительность модели, прежде чем сделать его доступным для использования. Качество данных с метками значительно влияет на производительность модели. Чтобы упростить создание и настройку модели, служба предлагает настраиваемый веб-портал, доступ к которому можно получить с помощью Language Studio. Вы можете легко приступить к работе со службой, выполнив действия, описанные в этом кратком руководстве.

Вариант разработки	Description
Студия службы "Язык"	Language Studio — это веб-платформа, которая позволяет попробовать связывание сущностей с текстовыми примерами без учетной записи Azure и собственных данных при регистрации. Дополнительные сведения см. в кратком руководстве по веб-сайту Или языковой студии Language Studio.
REST API или клиентская библиотека (пакет SDK для Azure)	Интеграция сводных данных текста в приложения с помощью REST API или клиентской библиотеки, доступной на различных языках. Дополнительные сведения см. в кратком руководстве по сводных данных.

Вариант разработки

Description

Студия службы "Язык"

REST API или клиентская библиотека (пакет SDK для Azure)

Требования к входным данным и ограничения службы

Сводка принимает текст для анализа. Дополнительные сведения см . в руководстве по ограничениям данных и служб.
Сводка работает с различными письменными языками. Дополнительные сведения см. в разделе Поддержка языков.

Справочная документация и примеры кода

При использовании сводные данные текста в приложениях см. в следующей справочной документации и примерах для языка искусственного интеллекта Azure:

Вариант разработки и язык	Справочная документация	Примеры
C#	Документация по C#	Примеры C#
Java	Документация по Java	Примеры для Java
JavaScript	Документация по работе с JavaScript.	Примеры JavaScript
Python	Документация по Python.	Примеры для Python

Ответственное применение ИИ

Система ИИ включает не только технологию, но и людей, которые используют ее, людей, пострадавших от нее, и среды развертывания. Ознакомьтесь с примечанием о прозрачности для формирования сводных данных, чтобы больше узнать об ответственном использовании и развертывании решений искусственного интеллекта в своих системах. Дополнительные сведения см. в следующих статьях:

Бөлісу құралы:

Что такое суммирование?

Ключевые функции для суммирования текста

Ключевые функции для суммирования бесед

Начало работы с формированием сводных данных

Требования к входным данным и ограничения службы

Справочная документация и примеры кода

Ответственное применение ИИ

Кері байланыс

Кері байланыс

Қосымша ресурстар