요약이란?

아티클
09/03/2024

Important

미리 보기 지역인 스웨덴 중부에서는 GPT 모델을 기준으로 계속 진화하고 있는 최신 LLM 미세 조정 기술을 선보입니다. 스웨덴 중부 지역의 언어 리소스로 이 기술을 사용해 볼 수 있습니다.

대화 요약은 다음을 통해서만 사용할 수 있습니다.

REST API
Python
C#

요약은 Azure AI 언어가 제공하는 기능 중 하나입니다. 이는 더 높은 품질, 비용 효율성 및 더 낮은 대기 시간을 갖춘 요약 솔루션을 제공하는 생성적 대규모 언어 모델과 작업 최적화 인코더 모델의 조합입니다. 이 문서를 사용하여 이 기능과 애플리케이션에서 이 기능을 사용하는 방법에 대해 자세히 알아보세요.

기본적으로 일반 텍스트, 대화, 네이티브 문서의 세 가지 형식의 장르에 대한 요약 솔루션을 제공합니다. 텍스트 요약은 일반 텍스트 블록만 허용하고 대화 요약은 모델이 효과적으로 분할하고 요약할 수 있도록 다양한 음성 오디오 신호를 포함한 대화 입력을 허용하며, 네이티브 문서는 Word, PDF 등과 같은 네이티브 형식의 문서를 직접 요약할 수 있습니다.

이 설명서에는 다음과 같은 문서 유형이 포함되어 있습니다.

빠른 시작은 서비스에 대한 요청을 수행하는 과정을 안내하는 시작 지침입니다.
방법 가이드에는 보다 구체적이거나 사용자 지정된 방식으로 서비스를 사용하기 위한 지침이 포함되어 있습니다.

이러한 기능은 읽기에 너무 길다고 생각할 수 있는 콘텐츠를 줄이도록 설계되었습니다.

텍스트 요약의 주요 기능

텍스트 요약은 자연어 처리 기술을 사용하여 문서, 대화 또는 모든 텍스트에서 나올 수 있는 일반 텍스트에 대한 요약을 생성합니다. 이 API가 제공하는 요약에는 두 가지 방식이 있습니다.

추출적 요약: 문서 내에서 핵심 문장을 추출하고 이러한 문장의 위치 정보를 함께 추출하여 요약을 생성합니다.
- 추출된 여러 문장: 이 문장은 문서의 기본 아이디어를 집합적으로 전달합니다. 입력 문서의 콘텐츠에서 추출된 원래 문장입니다.
- 순위 점수: 순위 점수는 문장이 주요 항목과 얼마나 관련성이 있는지를 나타냅니다. 텍스트 요약은 추출된 문장의 순위를 매기며, 문장이 나타나는 순서대로 반환되는지 또는 순위에 따라 반환되는지 확인할 수 있습니다. 예를 들어, 세 문장 요약 추출 요약을 요청하면 점수가 가장 높은 세 문장을 반환합니다.
- 위치 정보: 추출된 문장의 시작 위치 및 길이입니다.
추상 요약: 원래 문서에서 문장을 축어적으로 추출하지 않는 간결하고 일관된 문장 또는 단어가 포함된 요약을 생성합니다.
- 요약 텍스트: 추상 요약은 각 상황에 맞는 입력 범위에 대한 요약을 반환합니다. 긴 입력은 분할할 수 있으므로 요약 텍스트의 여러 그룹을 컨텍스트 입력 범위와 함께 반환할 수 있습니다.
- 상황에 맞는 입력 범위: 요약 텍스트를 생성하는 데 사용된 입력 내의 범위입니다.

예를 들어 다음 텍스트 단락을 고려하세요.

"Microsoft에서는 학습과 이해에 대해 보다 전체적이고 인간 중심적인 접근 방식을 취함으로써 기존 기술을 넘어 AI를 발전시키기 위한 노력을 기울이고 있습니다. Azure AI 서비스의 최고 기술 책임자(CTO)로서 저는 이 탐구를 현실로 만들기 위해 뛰어난 과학자 및 엔지니어로 구성된 팀과 협력해 왔습니다. 제 역할에서 저는 인간 인지의 세 가지 특성, 즉 단일 언어 텍스트(X), 청각 또는 시각 감각 신호(Y) 및 다국어(Z) 간의 관계를 보는 고유한 관점을 활용합니다. 세 가지가 모두 교차하는 지점에는 그림 1에 나와 있는 바와 같이 XYZ-코드라고 하는 매직이 있습니다. 인간보다 더 잘 말하고, 듣고, 보고, 이해할 수 있는 강력한 AI를 만드는 공동 표현입니다. XYZ-코드를 통해 장기적인 비전(도메인 간 전이 학습, 형식 및 언어 확장)을 수행할 수 있습니다. 목표는 오늘날 인간이 하는 것처럼 광범위한 다운스트림 AI 작업을 지원하기 위해 표현을 공동으로 학습할 수 있는 미리 학습된 모델을 보유하는 것입니다. 지난 5년간 대화형 음성 인식, 기계 번역, 대화형 질문 답변, 기계 판독값 이해 및 이미지 자막의 벤치마크에서 인간의 성과를 달성했습니다. 이러한 5가지 혁신은 인간이 학습하고 이해하는 방식에 더 가까운 다감각적이고 다국어 학습을 달성하기 위한 AI 기능의 도약을 이루고자 하는 원대한 열망에 대한 강력한 신호를 제공했습니다. 저는 다운스트림 AI 작업에서 외부 기술 자료를 기반으로 한 경우에는 공동 XYZ- 코드가 이러한 열망의 기본 구성 요소라고 생각합니다."

텍스트 요약 API 요청은 API 백 엔드에 대한 작업을 만들어 요청을 수신하면 처리됩니다. 작업이 성공하면 API의 출력이 반환됩니다. 출력은 24시간 동안 검색에 사용할 수 있습니다. 이 시간이 지나면 출력이 제거됩니다. 다국어 지원 및 emoji 지원으로 인해 응답에 텍스트 오프셋이 포함될 수 있습니다. 자세한 내용은 오프셋 처리 방법을 참조하세요.

위의 예를 사용하면 API는 다음 요약을 반환할 수 있습니다.

추출 요약:

"Microsoft에서는 학습과 이해에 대해 보다 전체적이고 인간 중심적인 접근 방식을 취함으로써 기존 기술을 넘어 AI를 발전시키기 위한 노력을 기울이고 있습니다."
"XYZ-코드를 통해 장기적인 비전(도메인 간 전이 학습, 형식 및 언어 확장)을 수행할 수 있습니다."
"목표는 오늘날 인간이 하는 것처럼 광범위한 다운스트림 AI 작업을 지원하기 위해 표현을 공동으로 학습할 수 있는 미리 학습된 모델을 보유하는 것입니다."

추상 요약:

"Microsoft는 학습 및 이해에 대해 보다 총체적이고 인간 중심적인 방식을 취하고 있습니다. XYZ-코드를 통해 장기적인 비전(도메인 간 전이 학습, 형식 및 언어 확장)을 수행할 수 있습니다. 지난 5년 동안 대화형 음성 인식 분야의 벤치마크에서 인간의 성과를 달성했습니다."

이 설명서에는 다음과 같은 문서 유형이 포함되어 있습니다.

빠른 시작은 서비스에 대한 요청을 수행하는 과정을 안내하는 시작 지침입니다.
방법 가이드에는 보다 구체적이거나 사용자 지정된 방식으로 서비스를 사용하기 위한 지침이 포함되어 있습니다.

대화 요약을 위한 주요 기능

대화 요약은 다음 기능을 지원합니다.

요약: 간단한 단락으로 대화를 요약합니다.
문제/해결 요약: 고객 서비스 에이전트와 고객 간의 대화에서 문제 및 해결 방법 요약을 제공하는 콜 센터 전용 기능입니다.
챕터 제목 요약: 대화에 설명된 항목에 따라 대화를 장으로 분할하고 입력 대화의 제안된 장 제목을 제공합니다.
내러티브 요약: 세부 통화 메모, 회의 메모 또는 입력 대화의 채팅 요약을 제공합니다.

예를 들어 다음 예제 대화를 살펴보겠습니다.

에이전트: "안녕하세요, Rene과 채팅하고 있습니다. 무엇을 도와드릴까요?"

고객: "안녕하세요, Smart Brew 300 에스프레소 머신에 WiFi 연결을 설정하려고 하는데 작동이 안됩니다."

에이전트: "유감입니다. 이 문제를 해결하기 위해 무엇을 할 수 있는지 살펴보겠습니다. WiFi 연결 단추를 누르고 3초 동안 유지한 다음, 전원 표시등이 천천히 깜박이는지 알려주시겠습니까?"

고객: “네, WiFi 연결 단추를 눌렀는데 이제 전원 표시등이 서서히 깜박입니다.”

에이전트: “다행입니다. 감사합니다! 이제 Contoso Coffee 앱을 확인해주세요. 머신에 연결하라는 메시지가 표시되었나요?”

고객: “아니요. 아무 것도 표시되지 않네요.”

에이전트: "알겠습니다. 감사합니다. 공장 초기화로 문제를 해결할 수 있는지 살펴보겠습니다. 가운데 단추를 5초 동안 길게 눌러 공장 초기화를 시작해주세요."

고객: "공장 초기화를 시도하고 위의 단계를 다시 해봤는데도 여전히 작동하지 않습니다."

에이전트: "매우 안타깝네요. 문제를 해결하는 또 다른 방법이 있는지 살펴보겠습니다. 잠시만 기다려주세요."

대화 요약 기능은 다음과 같이 텍스트를 간소화합니다.

예제 요약	설명	대화 측면
고객이 Smart Brew 300 에스프레소 컴퓨터에 Wi-Fi 연결을 설정할 수 없음	고객과 에이전트 간의 대화에서 고객 문제	이슈
에이전트는 Wi-Fi 연결 확인, Contoso Coffee 앱 확인, 팩터리 초기화 수행 등 몇 가지 문제 해결 단계를 제안했습니다. 그러나 이러한 단계 중 어느 것도 문제를 해결하지 못했습니다. 그러면 에이전트는 다른 솔루션을 찾기 위해 고객을 잠시 기다리게 합니다.	고객과 에이전트의 대화에서 시도한 솔루션	확인
고객이 에이전트에게 연락하여 Smart Brew 300 에스프레소 컴퓨터의 Wi-Fi 연결 설정에 대한 지원을 요청했습니다. 에이전트는 고객에게 Wi-Fi 연결 확인, 전원 표시등 확인, 팩터리 초기화 등 여러 문제 해결 단계를 안내했습니다. 이러한 단계를 수행했음에도 불구하고 문제가 지속되었습니다. 그런 다음 에이전트는 다른 잠재적인 솔루션을 탐색하기로 결정함	대화를 한 문단으로 요약	요약
SmartBrew 300 에스프레소 컴퓨터 문제 해결	대화를 분할하고 각 세그먼트에 대한 제목을 생성합니다. 일반적으로 `narrative` 측면에서 공동 작업합니다.	chapterTitle
고객이 Smart Brew 300 에스프레소 컴퓨터의 Wi-Fi 연결을 설정하는 데 문제가 있습니다. 에이전트는 팩터리 초기화를 포함한 여러 솔루션을 제안했지만 문제가 지속됩니다.	대화를 분할하고 각 세그먼트에 대한 요약을 생성합니다. 일반적으로 `chapterTitle` 측면에서 공동 작업합니다.	설명

이 설명서에는 다음과 같은 문서 유형이 포함되어 있습니다.

빠른 시작은 서비스에 대한 요청을 수행하는 과정을 안내하는 시작 지침입니다.
방법 가이드에는 보다 구체적이거나 사용자 지정된 방식으로 서비스를 사용하기 위한 지침이 포함되어 있습니다.

문서 요약은 자연어 처리 기술을 사용하여 문서 요약을 생성합니다.

원시 문서는 Microsoft Word(docx) 또는 이식 가능한 문서 파일(pdf)과 같은 원본 문서를 만드는 데 사용되는 파일 형식을 나타냅니다. 원시 문서 지원을 사용하면 Azure AI 언어 리소스 기능을 사용하기 위한 텍스트 전처리가 필요하지 않습니다. 현재 네이티브 문서 지원은 두 가지 형식의 요약에 사용할 수 있습니다.

추출적 요약: 문서 내에서 핵심 문장을 추출하고 해당 문장의 위치 정보를 함께 추출하여 요약을 생성합니다.
- 추출된 여러 문장: 이 문장은 문서의 기본 아이디어를 집합적으로 전달합니다. 입력 문서의 콘텐츠에서 추출된 원래 문장입니다.
- 순위 점수: 순위 점수는 문장이 주요 항목과 얼마나 관련성이 있는지를 나타냅니다. 텍스트 요약은 추출된 문장의 순위를 매기며, 문장이 나타나는 순서대로 반환되는지 또는 순위에 따라 반환되는지 확인할 수 있습니다. 예를 들어, 세 문장 요약 추출 요약을 요청하면 점수가 가장 높은 세 문장을 반환합니다.
- 위치 정보: 추출된 문장의 시작 위치 및 길이입니다.
추상 요약: 원래 문서에서 문장을 축어적으로 추출하지 않는 간결하고 일관된 문장 또는 단어가 포함된 요약을 생성합니다.
- 요약 텍스트: 추상 요약은 각 상황에 맞는 입력 범위에 대한 요약을 반환합니다. 긴 입력은 분할할 수 있으므로 요약 텍스트의 여러 그룹을 컨텍스트 입력 범위와 함께 반환할 수 있습니다.
- 상황에 맞는 입력 범위: 요약 텍스트를 생성하는 데 사용된 입력 내의 범위입니다.

현재 문서 요약은 다음과 같은 원시 문서 형식을 지원합니다.

파일 형식	파일 확장명	설명
Text	`.txt`	서식이 지정되지 않은 텍스트 문서입니다.
Adobe PDF	`.pdf`	이식 가능한 문서 파일 형식의 문서입니다.
Microsoft Word	`.docx`	Microsoft Word 문서 파일입니다.

자세한 내용은 언어 처리 네이티브 문서 사용을 참조하세요.

요약 시작

요약을 사용하려면 분석을 위해 제출하고 애플리케이션에서 API 출력을 처리합니다. 분석은 데이터에 사용되는 모델에 사용자 지정 추가 없이 있는 그대로 수행됩니다. 요약을 사용하는 방법에는 두 가지가 있습니다.

개발 옵션	설명
Language Studio	Language Studio는 등록 시 Azure 계정 및 고유한 데이터 없이 텍스트 예제와 엔터티 링크 설정을 시도할 수 있는 웹 기반 플랫폼입니다. 자세한 내용은 Language Studio 웹 사이트 또는 Language Studio 빠른 시작을 참조하세요.
REST API 또는 클라이언트 라이브러리(Azure SDK)	REST API 또는 다양한 언어로 제공되는 클라이언트 라이브러리를 사용하여 텍스트 요약을 애플리케이션에 통합합니다. 자세한 내용은 요약 빠른 시작을 참조하세요.

개발 옵션	설명	링크
REST API	REST API를 사용하여 애플리케이션에 대화 요약을 통합합니다.	빠른 시작: 대화 요약 사용

개발 옵션	설명
Language Studio	Language Studio는 등록 시 Azure 계정 및 고유한 데이터 없이 텍스트 예제와 엔터티 링크 설정을 시도할 수 있는 웹 기반 플랫폼입니다. 자세한 내용은 Language Studio 웹 사이트 또는 Language Studio 빠른 시작을 참조하세요.
REST API 또는 클라이언트 라이브러리(Azure SDK)	REST API 또는 다양한 언어로 제공되는 클라이언트 라이브러리를 사용하여 텍스트 요약을 애플리케이션에 통합합니다. 자세한 내용은 요약 빠른 시작을 참조하세요.

입력 요구 사항 및 서비스 제한

요약은 분석을 위해 텍스트를 사용합니다. 자세한 내용은 방법 가이드의 데이터 및 서비스 제한을 참조하세요.
요약은 다양한 쓰기 언어로 작동합니다. 자세한 내용은 언어 지원을 참조하세요.

참조 설명서 및 코드 샘플

애플리케이션에서 텍스트 요약을 사용할 때 Azure AI 언어에 대한 다음 참조 문서 및 샘플을 참조하세요.

개발 옵션/언어	참조 설명서	샘플
C#	C# 설명서	C# 샘플
Java	Java 설명서	Java 샘플
JavaScript	JavaScript 설명서	JavaScript 샘플
Python	Python 설명서	Python 샘플

책임 있는 AI

AI 시스템에는 기술뿐만 아니라 기술을 사용하는 사용자, 영향을 받는 사용자 및 배포 환경도 포함됩니다. 시스템에서 책임 있는 AI 사용 및 배포에 대해 알아보려면 요약에 대한 투명성 참고사항을 읽어보세요. 자세한 내용은 다음 문서를 참조하세요.

다음을 통해 공유

요약이란?

텍스트 요약의 주요 기능

대화 요약을 위한 주요 기능

요약 시작

입력 요구 사항 및 서비스 제한

참조 설명서 및 코드 샘플

책임 있는 AI

피드백

추가 리소스