사용자 지정 텍스트 분류란?

사용자 지정 텍스트 분류는 Azure AI 언어가 제공하는 사용자 지정 기능 중 하나입니다. 텍스트 분류 작업에 대한 사용자 지정 모델을 빌드할 수 있도록 기계 학습 인텔리전스를 적용하는 클라우드 기반 API 서비스입니다.

사용자 지정 텍스트 분류를 통해 사용자는 사용자 지정 AI 모델을 빌드하여 사용자가 미리 정의한 사용자 지정 범주로 텍스트를 분류할 수 있습니다. 개발자는 사용자 지정 텍스트 분류 프로젝트를 만들어 데이터에 반복적으로 레이블을 지정하고, 학습하고, 평가하고, 모델 성능을 개선한 후 사용할 수 있습니다. 레이블이 지정된 데이터의 품질은 모델 성능에 큰 영향을 미칩니다. 모델 빌드 및 사용자 지정을 간소화하기 위해 서비스는 언어 스튜디오를 통해 액세스할 수 있는 사용자 지정 웹 포털을 제공합니다. 이 빠른 시작의 단계를 수행하여 서비스를 쉽게 시작할 수 있습니다.

사용자 지정 텍스트 분류는 두 가지 유형의 프로젝트를 지원합니다.

  • 단일 레이블 분류 - 데이터 세트의 각 문서에 대해 단일 클래스를 할당할 수 있습니다. 예를 들어 영화 스크립트는 "Romance" 또는 "Comedy"로만 분류할 수 있습니다.
  • 다중 레이블 분류 - 데이터 세트의 각 문서에 대해 다중 클래스를 할당할 수 있습니다. 예를 들어 영화 스크립트는 "Comedy" 또는 "Romance" 및 "Comedy"로 분류될 수 있습니다.

이 설명서에는 다음과 같은 문서 유형이 포함되어 있습니다.

  • 빠른 시작은 서비스에 대한 요청을 수행하는 과정을 안내하는 시작 지침입니다.
  • 개념은 서비스 기능에 대한 설명을 제공합니다.
  • 방법 가이드에는 보다 구체적이거나 사용자 지정된 방식으로 서비스를 사용하기 위한 지침이 포함되어 있습니다.

사용 시나리오 예제

사용자 지정 텍스트 분류는 다양한 산업의 여러 시나리오에서 사용할 수 있습니다.

자동 이메일 또는 티켓 심사

모든 유형의 지원 센터는 구조화되지 않은 자유형 텍스트 및 첨부 파일이 포함된 대량의 이메일 또는 티켓을 받습니다. 내부 팀 내의 주제 전문가에게 시기적절한 검토, 승인 및 라우팅하는 것이 중요합니다. 이 규모의 이메일 심사를 위해서는 적절한 부서를 검토하고 라우팅해야 하므로 시간과 리소스가 필요합니다. 사용자 지정 텍스트 분류를 사용하여 들어오는 텍스트 및 심사를 분석하고 후속 작업을 위해 관련 부서로 자동으로 라우팅될 콘텐츠를 분류할 수 있습니다.

검색은 텍스트 콘텐츠를 사용자에게 제공하는 모든 앱의 기본입니다. 일반적인 시나리오에는 카탈로그 또는 문서 검색, 소매 제품 검색 또는 데이터 과학에 대한 지식 마이닝이 포함됩니다. 다양한 업계의 많은 기업은 구조화된 문서와 비구조적 문서를 모두 포함하는 다른 유형의 프라이빗 콘텐츠에 대한 풍부한 검색 환경을 구축하고 있습니다. 개발자는 파이프라인의 일부로 사용자 지정 텍스트 분류를 사용하여 해당 텍스트를 해당 업계와 관련된 클래스로 분류할 수 있습니다. 예측된 클래스를 사용하여 보다 사용자 지정된 검색 환경을 위해 파일의 인덱싱을 보강할 수 있습니다.

프로젝트 개발 수명 주기

사용자 지정 텍스트 분류 프로젝트를 만드는 데는 일반적으로 여러 단계가 포함됩니다.

The development lifecycle

모델을 최대한 활용하려면 다음 단계를 수행합니다.

  1. 스키마 정의: 데이터를 파악하고 구분하려는 클래스를 식별하여 모호성을 방지합니다.

  2. 데이터 레이블 지정: 데이터 레이블 지정의 품질은 모델 성능을 결정하는 데 중요한 요소입니다. 두 클래스에 속할 수 있는 문서가 여러 레이블 분류 프로젝트를 사용하는 경우 동일한 클래스에 속하는 문서는 항상 동일한 클래스를 가져야 합니다. 클래스 모호성을 방지하고, 특히 단일 레이블 분류 프로젝트에서 클래스를 서로 명확하게 분리할 수 있는지 확인합니다.

  3. 모델 학습: 모델은 레이블이 지정된 데이터에서 학습을 시작합니다.

  4. 모델의 성능 보기: 모델에 대한 평가 세부 정보를 확인하여 새 데이터에 도입 시 모델의 성능을 확인합니다.

  5. 모델 배포: 모델을 배포하면 분석 API를 통해 사용할 수 있습니다.

  6. 텍스트 분류: 사용자 지정 텍스트 분류 작업에 사용자 지정 모델링을 사용합니다.

참조 설명서 및 코드 샘플

사용자 지정 텍스트 분류를 사용할 때 Azure AI 언어에 대한 다음 참조 문서 및 샘플을 참조하세요.

개발 옵션/언어 참조 설명서 샘플
REST API(작성) REST API 설명서
REST API(런타임) REST API 설명서
C#(런타임) C# 설명서 C# 샘플 - 단일 레이블 분류C# 샘플 - 다중 레이블 분류
Java(런타임) Java 설명서 Java 샘플 - 단일 레이블 분류Java 샘플 - 다중 레이블 분류
JavaScript(런타임) JavaScript 설명서 JavaScript 샘플 - 단일 레이블 분류JavaScript 샘플 - 다중 레이블 분류
Python(런타임) Python 설명서 Python 샘플 - 단일 레이블 분류Python 샘플 - 다중 레이블 분류

책임 있는 AI

AI 시스템에는 기술뿐만 아니라 기술을 사용하는 사람, 영향을 받는 사람, 배포되는 환경이 포함됩니다. 시스템에서 책임 있는 AI 사용 및 배포에 대해 알아보려면 사용자 지정 텍스트 분류에 대한 투명성 참고사항을 읽어보세요. 자세한 내용은 다음 문서를 참조하세요.

다음 단계

  • 빠른 시작 문서를 사용하여 사용자 지정 텍스트 분류 사용을 시작합니다.

  • 프로젝트 개발 수명 주기를 진행하면서 용어집을 검토하여 이 기능에 대한 설명서 전체에서 사용되는 용어에 대해 자세히 알아보세요.

  • 지역별 가용성과 같은 정보에 대한 서비스 제한을 확인해야 합니다.