다음을 통해 공유


사용자 지정 NER 프로젝트를 만드는 방법

이 문서를 사용하여 사용자 지정 NER로 시작하기 위한 요구 사항을 설정하고 프로젝트를 만드는 방법을 알아봅니다.

필수 조건

사용자 지정 NER 사용을 시작하려면 먼저 다음이 필요합니다.

언어 리소스 만들기

사용자 지정 NER 사용을 시작하려면 먼저 Azure AI 언어 리소스가 필요합니다. Azure Portal에서 언어 리소스를 만들고 스토리지 계정을 연결하는 것이 좋습니다. Azure Portal에서 리소스를 만들면 필요한 모든 권한이 미리 구성된 Azure Storage 계정을 동시에 만들 수 있습니다. 이 문서를 자세히 참조하여 기존 리소스를 사용하고 사용자 지정 명명된 엔터티 인식에서 작동하도록 구성하는 방법을 알아볼 수도 있습니다.

또한 엔터티를 추출하도록 모델을 학습시키는 데 사용할 .txt 문서를 업로드할 Azure 스토리지 계정이 필요합니다.

참고 항목

  • 언어 리소스를 만들려면 리소스 그룹에 할당된 소유자 역할이 있어야 합니다.
  • 기존 스토리지 계정을 연결하는 경우 소유자 역할이 할당되어야 합니다.

언어 리소스 만들기 및 스토리지 계정 연결

다음과 같은 방법으로 리소스를 만들 수 있습니다.

  • Azure Portal
  • Language Studio
  • PowerShell

참고 항목

언어 리소스와 연결된 후에는 스토리지 계정을 다른 리소스 그룹이나 구독으로 이동하면 안 됩니다.

Azure Portal에서 새 리소스 만들기

  1. 새로운 Azure AI 언어 리소스를 생성하려면 Azure Portal에 로그인하세요.

  2. 표시되는 창의 사용자 지정 기능에서 사용자 지정 텍스트 분류 및 사용자 지정 명명된 엔터티 인식을 선택합니다. 화면 하단에서 계속해서 리소스 만들기를 선택합니다.

    Azure Portal에서 사용자 지정 텍스트 분류 및 사용자 지정 명명된 엔터티 인식을 보여주는 스크린샷.

  3. 다음 세부 정보를 사용하여 언어 리소스를 만듭니다.

    이름 Description
    Subscription Azure 구독.
    Resource group 리소스를 포함할 리소스 그룹입니다. 기존 리소스 그룹을 사용하거나 새로 만들 수 있습니다.
    지역 언어 리소스의 지역입니다. 예를 들어 "미국 서부 2"입니다.
    이름 리소스의 이름입니다.
    가격 책정 계층 언어 리소스에 대한 가격 책정 계층입니다. 무료(F0) 계층을 사용하여 서비스를 사용해 볼 수 있습니다.

    참고 항목

    "로그인 계정이 선택한 스토리지 계정의 리소스 그룹 소유자가 아닙니다"라는 메시지가 표시되면 언어 리소스를 만들기 전에 계정에 리소스 그룹에 대한 소유자 역할이 할당되어 있어야 합니다. 도움이 필요하면 Azure 구독 소유자에게 문의합니다.

  4. 사용자 지정 텍스트 분류 및 사용자 지정 명명된 엔터티 인식 섹션에서 기존 스토리지 계정을 선택하거나 새 스토리지 계정을 선택합니다. 이러한 값은 시작하는 데 도움이 되며, 반드시 프로덕션 환경에서 사용하려는 스토리지 계정 값은 아닙니다. 프로젝트를 빌드하는 동안 대기 시간을 방지하려면 언어 리소스와 동일한 지역의 스토리지 계정에 연결합니다.

    스토리지 계정 값 권장 값
    스토리지 계정 이름 임의의 이름
    Storage 계정 유형 표준 LRS
  5. 책임 있는 AI 알림이 선택되어 있는지 확인합니다. 페이지 하단에서 검토 + 만들기를 선택한 다음 만들기를 선택합니다.

Language Studio에서 새 언어 리소스 만들기

처음 로그인하는 경우 Language Studio에서 기존 언어 리소스를 선택하거나 새로 만들 수 있는 창이 표시됩니다. 오른쪽 위 모서리에서 설정 아이콘을 클릭하고, 리소스를 선택한 다음, 새 리소스 만들기를 클릭하여 리소스를 만들 수도 있습니다.

다음 세부 정보를 사용하여 언어 리소스를 만듭니다.

인스턴스 세부 정보 필수 값
Azure 구독 Azure 구독
Azure 리소스 그룹 사용자의 Azure 리소스 그룹
Azure 리소스 이름 사용자의 Azure 리소스 이름
위치 언어 리소스의 지역입니다.
가격 책정 계층 언어 리소스에 대한 가격 책정 계층입니다.

Important

  • 언어 리소스를 만드는 경우 관리 ID를 사용하도록 설정해야 합니다.
  • 책임 있는 AI 알림을 읽고 확인합니다.

사용자 지정 명명된 엔터티 인식을 사용하려면 아직 계정이 없는 경우 Azure 스토리지 계정을 만들어야 합니다.

PowerShell을 사용하여 새 언어 리소스 만들기

GitHub에서 호스트되는 다음 CLI 템플릿매개 변수 파일을 사용하여 새 리소스와 스토리지 계정을 만들 수 있습니다.

매개 변수 파일에서 다음 값을 편집합니다.

매개 변수 이름 값 설명
name 언어 리소스 이름
location 리소스가 호스팅되는 지역입니다. 자세한 내용은 서비스 제한을 참조하세요.
sku 리소스에 대한 가격 책정 계층입니다.
storageResourceName 스토리지 계정 이름
storageLocation 스토리지 계정이 호스트되는 지역
storageSkuType 스토리지 계정의 SKU
storageResourceGroupName 스토리지 계정의 리소스 그룹

다음 PowerShell 명령을 사용하여 편집한 파일과 함께 ARM(Azure Resource Manager) 템플릿을 배포합니다.

New-AzResourceGroupDeployment -Name ExampleDeployment -ResourceGroupName ExampleResourceGroup `
  -TemplateFile <path-to-arm-template> `
  -TemplateParameterFile <path-to-parameters-file>

템플릿 배포매개 변수 파일에 대한 자세한 내용은 ARM 템플릿 문서를 참조하세요.

참고 항목

  • 스토리지 계정을 언어 리소스에 연결하는 프로세스는 되돌릴 수 없으며, 나중에 해당 연결을 끊을 수 없습니다.
  • 언어 리소스는 하나의 스토리지 계정에만 연결할 수 있습니다.

기존 언어 리소스 사용

기존 언어 리소스가 아래 요구 사항을 충족하는 경우 이 리소스를 사용하여 사용자 지정 NER을 시작할 수 있습니다.

요구 사항 설명
지역 기존 리소스가 지원되는 지역 중 하나에 프로비전되어 있는지 확인합니다. 그렇지 않은 경우 이러한 지역 중 하나에서 새 리소스를 만들어야 합니다.
가격 책정 계층 지원되는 가격 책정 계층에 대해 자세히 알아보세요.
관리 ID 리소스의 관리 ID 설정이 사용하도록 설정되어 있는지 확인합니다. 그렇지 않으면 다음 섹션을 읽으세요.

사용자 지정 명명된 엔터티 인식을 사용하려면 아직 계정이 없는 경우 Azure 스토리지 계정을 만들어야 합니다.

리소스에 대한 ID 관리 사용

Azure Portal을 사용하여 사용하도록 설정하려면 언어 리소스에 ID 관리가 있어야 합니다.

  1. 언어 리소스로 이동
  2. 왼쪽 메뉴의 리소스 관리 섹션 아래에서 ID를 선택합니다.
  3. 시스템 할당 탭에서 상태켜기로 설정해야 합니다.

사용자 지정 명명된 엔터티 인식 기능 사용

Azure Portal에서 사용자 지정 텍스트 분류/사용자 지정 명명된 엔터티 인식 기능을 사용하도록 설정해야 합니다.

  1. Azure Portal에서 언어 리소스로 이동합니다.
  2. 왼쪽 메뉴의 리소스 관리 섹션 아래에서 기능을 선택합니다.
  3. 사용자 지정 텍스트 분류/사용자 지정 명명된 엔터티 인식 기능을 사용하도록 설정합니다.
  4. 스토리지 계정을 연결합니다.
  5. 적용을 선택합니다.

Important

  • 연결하려는 스토리지 계정에 할당된 스토리지 Blob 데이터 기여자 역할이 언어 리소스에 있는지 확인합니다.

필요한 역할 추가

다음 단계를 사용하여 언어 리소스 및 스토리지 계정에 필요한 역할을 설정합니다.

Azure Portal에서 역할을 설정하는 방법을 보여주는 애니메이션 이미지.

Azure AI 언어 리소스에 대한 역할

  1. Azure Portal에서 스토리지 계정 또는 언어 리소스로 이동합니다.

  2. 왼쪽 탐색 메뉴에서 액세스 제어(IAM)를 선택합니다.

  3. 추가를 선택하여 역할 할당 추가를 선택하고, 계정에 적절한 역할을 선택합니다.

    언어 리소스에 할당된 소유자 또는 기여자 역할이 있어야 합니다.

  4. 다음에 대한 액세스 권한 할당 내에서 사용자, 그룹 또는 서비스 주체를 선택합니다.

  5. 멤버 선택을 선택합니다.

  6. 사용자 이름을 선택합니다. 선택 필드에서 사용자 이름을 검색할 수 있습니다. 모든 역할에 대해 이 작업을 반복합니다.

  7. 이러한 단계를 이 리소스에 액세스해야 하는 모든 사용자 계정에 대해 반복합니다.

스토리지 계정에 대한 역할

  1. Azure Portal에서 스토리지 계정 페이지로 이동합니다.
  2. 왼쪽 탐색 메뉴에서 액세스 제어(IAM)를 선택합니다.
  3. 추가를 선택하여 역할 할당 추가를 선택하고, 스토리지 계정에 대한 Storage Blob 데이터 기여자 역할을 선택합니다.
  4. 다음에 대한 액세스 권한 할당 내에서 관리 ID를 선택합니다.
  5. 멤버 선택을 선택합니다.
  6. 구독을 선택하고, 관리 ID로 언어를 선택합니다. 선택 필드에서 사용자 이름을 검색할 수 있습니다.

Important

가상 네트워크 또는 프라이빗 엔드포인트가 있는 경우 Azure Portal에서 신뢰할 수 있는 서비스 목록에서 Azure 서비스가 이 스토리지 계정에 액세스하도록 허용을 선택해야 합니다.

스토리지 계정에 대해 CORS 활성화

CORS(원본 간 리소스 공유)를 활성화할 때 (GET, PUT, DELETE) 메서드를 허용해야 합니다. 허용된 원본 필드를 https://language.cognitive.azure.com으로 설정합니다. *를 허용된 헤더 값에 추가하여 모든 헤더를 허용하고, 최대 기간을 500으로 설정합니다.

스토리지 계정에 대해 CORS를 사용하는 방법을 보여주는 스크린샷.

사용자 지정 명명된 엔터티 인식 프로젝트 만들기

리소스 및 스토리지 컨테이너가 구성되면 새 사용자 지정 NER 프로젝트를 만듭니다. 프로젝트는 데이터를 기반으로 하는 사용자 지정 AI 모델을 빌드하기 위한 작업 영역입니다. 사용자 및 사용 중인 Azure 리소스에 대해 액세스 권한이 있는 다른 사용자만 프로젝트에 액세스할 수 있습니다. 레이블을 데이터에 지정한 경우 프로젝트를 가져와서 시작하는 데 이를 사용할 수 있습니다.

  1. Language Studio에 로그인합니다. 구독 및 언어 리소스를 선택할 수 있는 창이 표시됩니다. 위의 단계에서 만든 언어 리소스를 선택합니다.

  2. Language Studio의 정보 추출 섹션 아래에서 사용자 지정 명명된 엔터티 인식을 선택합니다.

    Language Studio 방문 페이지에서 사용자 지정 NER의 위치를 보여주는 스크린샷.

  3. 프로젝트 페이지의 상단 메뉴에서 새 프로젝트 만들기를 선택합니다. 프로젝트를 만들면 데이터에 태그를 지정하고 모델을 학습, 평가, 개선 및 배포할 수 있습니다.

    프로젝트 만들기 페이지의 스크린샷

  4. 새 프로젝트 만들기를 클릭하면 스토리지 계정을 연결할 수 있는 창이 나타납니다. 스토리지 계정을 이미 연결한 경우 연결된 스토리지 계정이 표시됩니다. 그렇지 않은 경우 표시되는 드롭다운에서 스토리지 계정을 선택하고 스토리지 계정 연결을 선택합니다. 그러면 스토리지 계정에 필요한 역할이 설정됩니다. 스토리지 계정에 대한 소유자로 할당되지 않은 경우 이 단계에서 오류가 반환될 수 있습니다.

    참고 항목

    • 사용하는 각 새 리소스에 대해 이 단계를 한 번만 수행하면 됩니다.
    • 이 프로세스는 되돌릴 수 없으며, 스토리지 계정을 언어 리소스에 연결하면 나중에 해당 연결을 끊을 수 없습니다.
    • 언어 리소스는 하나의 스토리지 계정에만 연결할 수 있습니다.

    스토리지 연결 화면을 보여 주는 스크린샷

  5. 프로젝트에 있는 파일의 이름, 설명 및 언어를 포함한 프로젝트 정보를 입력합니다. 예제 데이터 세트를 사용하는 경우 영어를 선택합니다. 프로젝트 이름은 나중에 변경할 수 없습니다. 다음을 선택합니다.

    데이터 세트는 완전히 동일한 언어로 되어 있지 않아도 됩니다. 지원되는 언어가 서로 다른 여러 문서가 있을 수 있습니다. 데이터 세트에 다른 언어의 문서가 포함되어 있거나 런타임 중에 다른 언어의 텍스트가 필요한 경우 프로젝트에 대한 기본 정보를 입력할 때 다국어 데이터 세트 사용 옵션을 선택합니다. 이 옵션은 나중에 프로젝트 설정 페이지에서 사용하도록 설정할 수 있습니다.

  6. 데이터 세트를 업로드한 컨테이너를 선택합니다. 이미 레이블을 데이터에 지정한 경우 지원되는 형식을 따르는지 확인하고, 예, 이미 레이블을 내 파일에 지정하고 JSON 레이블 파일의 형식을 지정했습니다.를 선택하고, 드롭다운 메뉴에서 레이블 파일을 선택합니다. 다음을 선택합니다.

  7. 입력한 데이터를 검토하고, 프로젝트 만들기를 선택합니다.

프로젝트 가져오기

이미 레이블이 지정된 데이터가 있는 경우 이를 사용하여 서비스를 시작할 수 있습니다. 레이블이 지정된 데이터에서 허용되는 데이터 형식을 따르는지 확인합니다.

  1. Language Studio에 로그인합니다. 구독 및 언어 리소스를 선택할 수 있는 창이 표시됩니다. 언어 리소스를 선택합니다.

  2. Language Studio의 정보 추출 섹션 아래에서 사용자 지정 명명된 엔터티 인식을 선택합니다.

    Language Studio 방문 페이지에서 사용자 지정 NER 기능의 위치를 보여주는 스크린샷.

  3. 프로젝트 페이지의 상단 메뉴에서 새 프로젝트 만들기를 선택합니다. 프로젝트를 만들면 데이터에 태그를 지정하고 모델을 학습, 평가, 개선 및 배포할 수 있습니다.

    프로젝트 만들기 페이지의 스크린샷

  4. 새 프로젝트 만들기를 선택하면 스토리지 계정을 연결할 수 있는 화면이 표시됩니다. 스토리지 계정을 찾을 수 없는 경우 권장 단계를 사용하여 리소스를 만들었는지 확인합니다. 스토리지 계정을 언어 리소스에 이미 연결한 경우 연결된 스토리지 계정이 표시됩니다.

    참고 항목

    • 사용하는 각 새 언어 리소스에 대해 이 단계를 한 번만 수행하면 됩니다.
    • 이 프로세스는 되돌릴 수 없으며, 스토리지 계정을 언어 리소스에 연결하면 나중에 해당 연결을 끊을 수 없습니다.
    • 언어 리소스는 하나의 스토리지 계정에만 연결할 수 있습니다.

    새 프로젝트에 대한 스토리지 연결 화면의 스크린샷.

  5. 프로젝트에 있는 파일의 이름, 설명 및 언어를 포함한 프로젝트 정보를 입력합니다. 프로젝트 이름은 나중에 변경할 수 없습니다. 다음을 선택합니다.

    데이터 세트는 완전히 동일한 언어로 되어 있지 않아도 됩니다. 지원되는 언어가 서로 다른 여러 문서가 있을 수 있습니다. 데이터 세트에 다른 언어의 문서가 포함되어 있거나 런타임 중에 다른 언어의 텍스트가 필요한 경우 프로젝트에 대한 기본 정보를 입력할 때 다국어 데이터 세트 사용 옵션을 선택합니다. 이 옵션은 나중에 프로젝트 설정 페이지에서 사용하도록 설정할 수 있습니다.

  6. 데이터 세트를 업로드한 컨테이너를 선택합니다.

  7. 예, 이미 레이블을 내 파일에 지정하고 JSON 레이블 파일의 형식을 지정했습니다.를 선택하고, 아래의 드롭다운 메뉴에서 레이블 파일을 선택하여 JSON 레이블 파일을 가져옵니다. 지원되는 형식을 따르는지 확인합니다.

  8. 다음을 선택합니다.

  9. 입력한 데이터를 검토하고, 프로젝트 만들기를 선택합니다.

프로젝트 세부 정보 가져오기

  1. Language Studio프로젝트 설정 페이지로 이동합니다.

  2. 프로젝트 세부 정보를 볼 수 있습니다.

  3. 이 페이지에서 프로젝트 설명을 업데이트하고, 프로젝트 설정에서 다국어 데이터 세트를 사용하거나 사용하지 않도록 설정할 수 있습니다.

  4. 언어 리소스에 연결된 스토리지 계정 및 컨테이너를 볼 수도 있습니다.

  5. 이 페이지에서 기본 리소스 키를 검색할 수도 있습니다.

    Language Studio에서 프로젝트 설정 페이지의 스크린샷

프로젝트 삭제

프로젝트가 더 이상 필요하지 않은 경우 언어 스튜디오를 사용하여 프로젝트를 삭제할 수 있습니다. 위쪽에서 사용자 지정 NER(명명된 엔터티 인식)을 선택하고 삭제할 프로젝트를 선택한 다음, 상단 메뉴에서 삭제를 선택합니다.

다음 단계

  • 레이블을 데이터에 지정하는 데 사용할 프로젝트 스키마에 대한 아이디어가 있어야 합니다.

  • 프로젝트가 만들어지면 데이터에 레이블 지정을 시작할 수 있습니다. 그러면 텍스트를 해석하는 방법을 텍스트 분류 모델에 알려주고 이를 학습 및 평가에 사용합니다.