다음을 통해 공유


빠른 시작: 사용자 지정 요약(미리 보기)

이 문서를 사용하여 요약을 기반으로 사용자 지정 모델을 학습할 수 있는 사용자 지정 요약 프로젝트 만들기를 시작하세요. 모델은 특정 작업을 수행하도록 학습된 AI 소프트웨어입니다. 이 시스템의 경우 모델은 텍스트를 요약하고 가져온 데이터를 통해 배움으로써 학습됩니다.

이 기사에서는 Language Studio를 사용하여 사용자 지정 요약의 주요 개념을 보여줍니다. 예를 들어, 짧은 퇴원 기록에서 시설이나 치료 위치를 추출하는 사용자 정의 요약 모델을 구축하겠습니다.

필수 조건

새 Azure AI 언어 리소스 및 Azure Storage 계정을 만듭니다.

사용자 지정 요약을 사용하려면 먼저 프로젝트를 만들고 모델 학습을 시작하는 데 필요한 자격 증명을 제공하는 Azure AI 언어 리소스를 만들어야 합니다. 또한 모델을 빌드하는 데 사용할 데이터 세트를 업로드할 수 있는 Azure 스토리지 계정이 필요합니다.

Important

빠르게 시작하려면 이 문서에 제공된 단계를 사용하여 새 Azure AI 언어 리소스를 만드는 것이 좋습니다. 이 문서의 단계를 사용하면 언어 리소스와 스토리지 계정을 동시에 만들 수 있으므로 나중에 만드는 것보다 쉽습니다.

Azure Portal에서 새 리소스 만들기

  1. 새로운 Azure AI 언어 리소스를 생성하려면 Azure portal로 이동하세요.

  2. 나타나는 창의 사용자 지정 기능에서 이 서비스를 선택하세요. 화면 하단에서 계속해서 리소스 만들기를 선택합니다.

    Azure Portal에서 사용자 지정 텍스트 분류 및 사용자 지정 명명된 엔터티 인식을 보여주는 스크린샷.

  3. 다음 세부 정보를 사용하여 언어 리소스를 만듭니다.

    이름 Description
    Subscription Azure 구독.
    Resource group 리소스를 포함할 리소스 그룹입니다. 기존 리소스 그룹을 사용하거나 새로 만들 수 있습니다.
    지역 언어 리소스의 지역입니다. 예를 들어 "미국 서부 2"입니다.
    이름 리소스의 이름입니다.
    가격 책정 계층 언어 리소스에 대한 가격 책정 계층입니다. 무료(F0) 계층을 사용하여 서비스를 사용해 볼 수 있습니다.

    참고 항목

    "로그인 계정이 선택한 스토리지 계정의 리소스 그룹 소유자가 아닙니다"라는 메시지가 표시되면 언어 리소스를 만들기 전에 계정에 리소스 그룹에 대한 소유자 역할이 할당되어 있어야 합니다. 도움이 필요하면 Azure 구독 소유자에게 문의합니다.

  4. 이 서비스 섹션에서 기존 스토리지 계정을 선택하거나 새 스토리지 계정을 선택합니다. 이러한 값은 시작하는 데 도움이 되며, 반드시 프로덕션 환경에서 사용하려는 스토리지 계정 값은 아닙니다. 프로젝트를 빌드하는 동안 대기 시간을 방지하려면 언어 리소스와 동일한 지역의 스토리지 계정에 연결합니다.

    스토리지 계정 값 권장 값
    스토리지 계정 이름 임의의 이름
    Storage 계정 유형 표준 LRS
  5. 책임 있는 AI 알림이 선택되어 있는지 확인합니다. 페이지 하단에서 검토 + 만들기를 선택한 다음 만들기를 선택합니다.

샘플 데이터 다운로드

샘플 데이터가 필요한 경우 이 빠른 시작을 위해 텍스트 요약대화 요약 시나리오에 대한 일부 데이터를 제공했습니다.

Blob 컨테이너에 샘플 데이터 업로드

  1. 스토리지 계정에 업로드할 파일을 찾습니다.

  2. Azure Portal에서 생성된 스토리지 계정으로 이동하고 선택합니다.

  3. 스토리지 계정에서 데이터 스토리지 아래에 있는 왼쪽 메뉴에서 컨테이너를 선택합니다. 표시된 화면에서 + 컨테이너를 선택합니다. 컨테이너에 example-data 이름을 지정하고 기본 공개 액세스 수준을 그대로 둡니다.

    스토리지 계정의 기본 페이지를 보여주는 스크린샷.

  4. 컨테이너를 만든 후 선택합니다. 그런 다음 업로드 버튼을 선택하여 이전에 다운로드한 .txt.json 파일을 선택합니다.

    스토리지 계정에 파일을 업로드하는 단추를 보여 주는 스크린샷.

사용자 지정 요약 프로젝트 만들기

리소스 및 스토리지 계정이 구성되면 새 사용자 지정 요약 프로젝트를 만듭니다. 프로젝트는 데이터를 기반으로 하는 사용자 지정 ML 모델을 빌드하기 위한 작업 영역입니다. 사용자 및 사용 중인 언어 리소스에 대해 액세스 권한이 있는 다른 사용자만 프로젝트에 액세스할 수 있습니다.

  1. Language Studio에 로그인합니다. 구독 및 언어 리소스를 선택할 수 있는 창이 표시됩니다. 위의 단계에서 만든 언어 리소스를 선택합니다.

  2. Language Studio에서 사용하려는 기능을 선택하세요.

  3. 프로젝트 페이지의 상단 메뉴에서 새 프로젝트 만들기를 선택합니다. 프로젝트를 생성하면 데이터에 레이블을 지정하고, 모델을 학습, 평가, 개선 및 배포할 수 있습니다.

    프로젝트 만들기 페이지의 스크린샷

  4. 프로젝트에 있는 파일의 이름, 설명 및 언어를 포함한 프로젝트 정보를 입력합니다. 예제 데이터 세트를 사용하는 경우 영어를 선택합니다. 나중에 프로젝트 이름을 변경할 수 없습니다. 다음을 선택합니다.

    데이터 세트는 완전히 동일한 언어로 되어 있지 않아도 됩니다. 지원되는 언어가 서로 다른 여러 문서가 있을 수 있습니다. 데이터 세트에 다른 언어의 문서가 포함되어 있거나 런타임 중에 다른 언어의 텍스트가 필요한 경우 프로젝트에 대한 기본 정보를 입력할 때 다국어 데이터 세트 사용 옵션을 선택합니다. 이 옵션은 나중에 프로젝트 설정 페이지에서 사용하도록 설정할 수 있습니다.

  5. 새 프로젝트 만들기를 선택하면 스토리지 계정을 연결할 수 있는 창이 나타납니다. 스토리지 계정을 이미 연결한 경우 연결된 스토리지 계정이 표시됩니다. 그렇지 않은 경우 표시되는 드롭다운에서 스토리지 계정을 선택하고 스토리지 계정 연결을 선택합니다. 그러면 스토리지 계정에 필요한 역할이 설정됩니다. 스토리지 계정에 대한 소유자로 할당되지 않은 경우 이 단계에서 오류가 반환될 수 있습니다.

    참고 항목

    • 사용하는 각 새 리소스에 대해 이 단계를 한 번만 수행하면 됩니다.
    • 이 프로세스는 되돌릴 수 없으며, 스토리지 계정을 언어 리소스에 연결하면 나중에 해당 연결을 끊을 수 없습니다.
    • 언어 리소스는 하나의 스토리지 계정에만 연결할 수 있습니다.
  6. 데이터 세트를 업로드한 컨테이너를 선택합니다.

  7. 이미 데이터에 레이블을 지정했다면 지원되는 형식을 따르는지 확인하고 예, 내 파일에 이미 레이블이 지정되어 있으며 JSON 레이블 파일 형식을 지정했습니다.를 선택한 다음 드롭다운 메뉴에서 레이블 파일을 선택합니다. 다음을 선택합니다. QuickStart의 데이터 세트를 사용하는 경우 JSON 레이블 파일의 형식을 검토할 필요가 없습니다.

  8. 입력한 데이터를 검토하고, 프로젝트 만들기를 선택합니다.

모델 학습

프로젝트를 생성한 후 계속해서 모델 학습을 시작합니다.

Language Studio 내에서 모델 학습을 시작하려면 다음을 수행합니다.

  1. 왼쪽 메뉴에서 학습 작업을 선택합니다.

  2. 상단 메뉴에서 학습 작업 시작을 선택합니다.

  3. 새 모델 학습을 선택하고, 텍스트 상자에서 모델 이름을 입력합니다. 또한 이 옵션을 선택하고 드롭다운 메뉴에서 덮어쓰려는 모델을 선택하면 기존 모델을 덮어쓸 수 있습니다. 학습된 모델을 덮어쓰는 것은 되돌릴 수 없지만, 새 모델을 배포할 때까지 배포된 모델에는 영향을 주지 않습니다.

    새 학습 작업 만들기

  4. 기본적으로 시스템은 지정된 백분율에 따라 학습 집합과 테스트 집합 간에 레이블이 지정된 데이터를 분할합니다. 테스트 집합에 문서가 있는 경우 학습 데이터와 테스트 데이터를 수동으로 분할할 수 있습니다.

  5. 학습 단추를 선택합니다.

  6. 목록에서 교육 작업 ID를 선택하면 이 작업에 대한 학습 진행률, 작업 상태 및 기타 세부정보를 확인할 수 있는 측면 창이 나타납니다.

    참고 항목

    • 성공적으로 완료된 학습 작업만 모델을 생성합니다.
    • 학습은 레이블이 지정된 데이터의 크기에 따라 몇 분에서 몇 시간 사이의 시간이 걸릴 수 있습니다.
    • 한 번에 하나의 학습 작업만 실행할 수 있습니다. 실행 중인 작업이 완료될 때까지 동일한 프로젝트 내에서 다른 학습 작업을 시작할 수 없습니다.

모델 배포

일반적으로 모델을 학습시킨 후 평가 세부 정보를 검토하고 필요한 경우 개선합니다. 이 빠른 시작에서는 모델을 배포하고 Language Studio에서 사용해 볼 수 있도록 합니다.

Language Studio 내에서 모델을 배포하려면:

  1. 왼쪽 메뉴에서 모델 배포를 선택합니다.

  2. 새 배포 작업을 시작하려면 배포 추가를 선택합니다.

    배포 단추를 보여주는 스크린샷

  3. 새 배포 만들기를 선택하여 새 배포를 만들고 아래 드롭다운에서 학습된 모델을 할당합니다. 이 옵션을 선택하여 기존 배포를 덮어쓰고 아래 드롭다운에서 할당할 학습된 모델을 선택할 수도 있습니다.

    참고 항목

    기존 배포를 덮어쓸 때는 예측 API 호출을 변경할 필요가 없지만 새로 할당된 모델을 기반으로 결과를 얻을 수 있습니다.

    배포 화면을 보여주는 스크린샷

  4. 배포를 선택하여 배포 작업을 시작합니다.

  5. 배포에 성공하면 만료 날짜가 옆에 표시됩니다. 배포 만료는 배포된 모델을 예측에 사용할 수 없게 되는 때이며, 일반적으로 학습 구성이 만료된 후 12개월 후에 발생합니다.

모델 테스트

이 빠른 시작에서는 Language Studio를 사용하여 사용자 지정 요약 작업을 제출하고 결과를 시각화합니다. 이전에 다운로드한 샘플 데이터 세트에서 이 단계에서 사용할 수 있는 몇 가지 테스트 문서를 찾을 수 있습니다.

Language Studio 내에서 배포된 모델을 테스트하려면 다음을 수행합니다.

  1. 왼쪽 메뉴에서 배포 테스트를 선택합니다.

  2. 테스트할 배포를 선택합니다. 배포에 할당된 모델만 테스트할 수 있습니다.

  3. 다국어 프로젝트의 경우 언어 드롭다운에서 테스트할 텍스트의 언어를 선택합니다.

  4. 드롭다운에서 쿼리/테스트하려는 배포를 선택합니다.

  5. 요청에 제출할 텍스트를 입력하거나 사용할 .txt 파일을 업로드할 수 있습니다.

  6. 상단 메뉴에서 테스트 실행을 선택합니다.

  7. 결과 탭에 텍스트에서 추출된 엔터티와 해당 형식이 표시됩니다. 또한 JSON 탭 아래에는 JSON 응답이 표시됩니다.

모델 테스트 결과를 보여주는 스크린샷.

리소스 정리

프로젝트가 더 이상 필요하지 않은 경우 언어 스튜디오를 사용하여 프로젝트를 삭제할 수 있습니다. 상단에서 사용 중인 기능을 선택한 후, 삭제하려는 프로젝트를 선택하세요. 상단 메뉴에서 삭제를 선택하여 프로젝트를 삭제합니다.

다음 단계