이미지 및 텍스트 문서에 레이블 지정

프로젝트 관리자가 Azure Machine Learning 이미지 데이터 레이블 지정 프로젝트 또는 Azure Machine Learning 텍스트 데이터 레이블 지정 프로젝트를 만든 후에는 레이블 지정 도구를 사용하여 Machine Learning 프로젝트용 데이터를 빠르게 준비할 수 있습니다. 이 문서에서는 다음을 설명합니다.

  • 레이블 지정 프로젝트에 액세스하는 방법
  • 레이블 지정 도구
  • 특정 레이블 지정 작업용 도구를 사용하는 방법

필수 조건

  • 조직 및 프로젝트에 대한 Microsoft 계정 또는 Microsoft Entra 계정.
  • 레이블 지정 프로젝트가 포함된 작업 영역에 대한 기여자 수준 액세스입니다.

스튜디오에 로그인

  1. Azure Machine Learning Studio에 로그인합니다.

  2. 레이블 지정 프로젝트가 포함된 구독 및 작업 영역을 선택합니다. 이 정보는 프로젝트 관리자에게 있습니다.

  3. 액세스 수준에 따라 왼쪽에 여러 섹션이 표시될 수 있습니다. 이 경우 왼쪽에서 데이터 레이블 지정을 선택하여 프로젝트를 찾습니다.

레이블 지정 작업 이해

데이터 레이블 지정 프로젝트 테이블에서 프로젝트에 대한 레이블 데이터 링크를 선택합니다.

프로젝트와 관련된 지침이 표시됩니다. 관련 데이터 형식, 의사 결정 방법 및 기타 관련 정보를 설명합니다. 정보를 검토하고, 페이지 위쪽에서 작업을 선택합니다. 페이지 아래쪽에서 레이블 지정 시작을 선택할 수도 있습니다.

레이블 선택

모든 데이터 레이블 지정 작업에서는 프로젝트 관리자가 지정한 세트에서 적절한 태그를 선택합니다. 키보드 숫자 키를 사용하여 처음 9개의 태그를 선택할 수 있습니다.

지원 기계 학습

레이블 지정 중에 기계 학습 알고리즘이 트리거될 수 있습니다. 이러한 알고리즘이 프로젝트에 사용하도록 설정되어 있으면 다음을 볼 수 있습니다.

  • 이미지

    • 일정량의 데이터에 레이블이 지정되면 화면 위쪽의 프로젝트 이름 옆에 클러스터된 작업을 알 수 있습니다. 동일한 페이지에 비슷한 이미지를 표시하도록 이미지가 그룹화됩니다. 이를 발견하면 여러 이미지 보기 중 하나로 전환하여 그룹화를 활용합니다.

    • 나중에 프로젝트 이름 옆에 작업 레이블이 미리 지정되어 있음을 볼 수 있습니다. 기계 학습 분류 모델에서 생성된 제안된 레이블이 있는 항목이 표시됩니다. 어떤 기계 학습 모델도 100% 정확성을 가지고 있지는 않습니다. 모델에서 신뢰할 수 있는 데이터만 사용하지만 이러한 데이터 값에는 여전히 잘못된 미리 레이블이 있을 수 있습니다. 레이블이 발견되면 페이지를 제출하기 전에 잘못된 레이블을 수정합니다.

    • 개체 식별 모델의 경우 경계 상자와 레이블이 이미 존재하는 것을 볼 수 있습니다. 페이지를 제출하기 전에 모든 실수를 수정합니다.

    • 구분 모델의 경우 다각형과 레이블이 이미 존재하는 것을 볼 수 있습니다. 페이지를 제출하기 전에 모든 실수를 수정합니다.

  • Text

    • 경우에 따라 프로젝트 이름 옆에 미리 레이블이 지정된 작업이 표시될 수 있습니다. 그러면 기계 학습 분류 모델에서 제공하는 제안된 레이블로 항목이 표시됩니다. 어떤 기계 학습 모델도 100% 정확성을 가지고 있지는 않습니다. 모델을 신뢰할 수 있는 데이터만 사용하지만 이러한 데이터는 여전히 잘못된 레이블이 지정될 수 있습니다. 레이블이 표시되면 페이지를 제출하기 전에 잘못된 레이블을 수정합니다.

레이블 지정 프로젝트 초기에 기계 학습 모델에는 미리 레이블을 작은 이미지 하위 집합에 지정하는 데 충분한 정확도만 있을 수 있습니다. 레이블이 이러한 이미지에 지정되면 레이블 지정 프로젝트가 수동 레이블 지정으로 돌아가서 다음 모델 학습 라운드에 대한 더 많은 데이터를 수집합니다. 시간이 지남에 따라 모델은 더 높은 비율의 이미지에 대해 더 확신하게 됩니다. 프로젝트의 뒤에서 더 많은 미리 레이블 작업이 수행됩니다.

미리 레이블이 지정된 작업이 더 이상 없으면 레이블 확인 또는 수정을 중지한 후 돌아가 항목에 수동으로 태그를 지정합니다.

이미지 작업

이미지 분류 작업의 경우 여러 이미지를 동시에 표시하도록 선택할 수 있습니다. 이미지 영역 위의 아이콘을 사용하여 레이아웃을 선택합니다.

표시된 모든 이미지를 동시에 선택하려면 모두 선택을 사용합니다. 개별 이미지를 선택하려면 이미지의 오른쪽 위 모서리에 있는 원형 선택 단추를 사용합니다. 태그를 적용할 이미지를 하나 이상 선택해야 합니다. 여러 이미지를 선택하면 선택한 태그가 선택한 모든 이미지에 적용됩니다.

여기서는 2x2 레이아웃을 선택하고 곰과 범고래 이미지에 "포유동물" 태그를 적용했습니다. 상어 이미지에는 이미 "연골 물고기"로 태그가 지정되었으며 이구아나에는 아직 태그가 없습니다.

Multiple image layouts and selection

Important

레이블이 지정되지 않은 데이터의 새 페이지가 있는 경우에만 레이아웃을 전환하세요. 레이아웃을 전환하면 페이지의 진행 중인 태그 지정 작업이 취소됩니다.

페이지의 모든 이미지에 태그가 지정되면 Azure에서 제출 단추를 사용하도록 설정합니다. 제출을 선택하여 작업을 저장합니다.

현재 데이터에 대한 태그가 제출되면 Azure에서 페이지를 작업 큐의 새 이미지 세트로 새로 고칩니다.

의료 이미지 작업

Important

DICOM 또는 이와 유사한 이미지 유형에 레이블을 지정하는 기능은 질병 또는 기타 상태의 진단, 치료, 완화, 처치 또는 예방에 사용하기 위한 의료 기기, 임상 지원, 진단 도구 또는 기타 기술로 사용하도록 의도되거나 제공되지 않습니다. 또한 Microsoft는 이러한 목적으로 이 기능을 사용할 수 있는 라이선스나 권한을 부여하지 않습니다. 이 기능은 전문적인 의학적 조언이나 의료 의견, 진단, 치료 또는 의료 전문가의 임상적 판단을 대체하기 위해 구현되거나, 배포되도록 설계되거나, 의도된 것이 아니므로 그렇게 사용해서는 안 됩니다. 고객은 DICOM 또는 이와 유사한 이미지 형식에 대한 데이터 레이블 지정 사용을 전적으로 책임집니다.

이미지 프로젝트는 X-레이 파일 이미지에 대한 DICOM 이미지 형식을 지원합니다.

X-ray DICOM image to be labeled.

다른 이미지와 동일한 도구를 사용하여 의료 이미지에 레이블을 지정하는 동안 다른 도구를 DICOM 이미지에 사용할 수 있습니다. 창 및 수준 도구를 선택하여 이미지의 강도를 변경합니다. 이 도구는 DICOM 이미지에 대해서만 사용할 수 있습니다.

Window and level tool for DICOM images.

다중 클래스 분류를 위한 이미지 레이블 지정

"이미지 분류 다중 클래스" 프로젝트 형식에 대해 단일 태그를 전체 이미지에 할당합니다. 지침을 검토하려면 언제든지 지침 페이지로 이동하여 자세한 지침 보기를 선택합니다.

이미지에 지정된 태그가 잘못되었음이 확인되면 해당 태그를 수정할 수 있습니다. 이미지 아래에 표시된 레이블에서 "X"를 선택하여 해당 태그를 지웁니다. 또한 이미지를 선택하고 다른 클래스를 선택할 수도 있습니다. 새로 선택한 값이 이전에 적용된 태그를 대체합니다.

다중 레이블 분류를 위한 이미지 레이블 지정

프로젝트 형식이 "이미지 분류 다중 레이블"인 경우 하나 이상의 태그를 이미지에 적용합니다. 프로젝트별 지침을 보려면 지침을 선택하고, 자세한 지침 보기로 이동합니다.

레이블을 지정하려는 이미지를 선택한 다음, 태그를 선택합니다. 태그가 선택한 모든 이미지에 적용된 다음, 이미지의 선택이 취소됩니다. 더 많은 태그를 적용하려면 이미지를 다시 선택해야 합니다. 다음 애니메이션에서는 다중 레이블 태그 지정을 보여 줍니다.

  1. 모두 선택을 사용하여 "해양"이라는 태그를 적용합니다.
  2. 단일 이미지를 선택하고 "근접"이라는 태그를 지정합니다.
  3. 세 개의 이미지를 선택하고 "광각"이라는 태그를 지정합니다.

Animation shows multilabel flow

실수를 수정하려면 "X"를 선택하여 개별 태그를 지우거나, 이미지와 태그를 차례로 선택하여 선택한 모든 이미지에서 해당 태그를 지웁니다. 이 시나리오는 다음과 같습니다. "육지"를 선택하면 선택한 두 이미지에서 해당 태그가 지워집니다.

A screenshot shows multiple deselections

사용자가 하나 이상의 태그를 각 이미지에 적용한 후에만 Azure에서 제출 단추를 사용하도록 설정합니다. 제출을 선택하여 작업을 저장합니다.

이미지 태그 지정 및 개체 감지용 경계 상자 지정

프로젝트 형식이 "개체 식별(경계 상자)"인 경우 이미지에서 하나 이상의 경계 상자를 지정하고 태그를 각 상자에 적용합니다. 이미지에는 각각 하나의 태그가 있는 여러 개의 경계 상자가 있을 수 있습니다. 자세한 지침 보기를 사용하여 프로젝트에서 여러 개의 경계 상자를 사용하는지 확인합니다.

  1. 만들려는 경계 상자에 대한 태그를 선택합니다.
  2. 사각형 상자 도구 Rectangular box tool를 선택하거나 "R"을 선택합니다.
  3. 대상을 선택하고 대각선 방향으로 가로지르며 끌어서 대략적인 경계 상자를 만듭니다. 경계 상자를 조정하려면 가장자리 또는 모서리를 끕니다.

Bounding box creation

경계 상자를 삭제하려면 경계 상자를 만든 후 옆에 표시되는 X 모양의 대상을 선택합니다.

기존 경계 상자의 태그는 변경할 수 없습니다. 태그 할당 실수를 수정하려면 경계 상자를 삭제하고 올바른 태그가 있는 경계 상자를 새로 만들어야 합니다.

기존 경계 상자는 기본적으로 편집할 수 있습니다. 영역 잠금/잠금 해제 도구 Lock/unlock regions tool 또는 "L"은 해당 동작을 전환합니다. 영역이 잠겨 있으면 새 경계 상자의 모양 또는 위치만 변경할 수 있습니다.

영역 조작 도구 This is the regions manipulation tool icon - four arrows pointing outward from the center, up, right, down, and left. 또는 "M"을 사용하여 기존 경계 상자를 조정합니다. 가장자리 또는 모서리를 끌어서 모양을 조정합니다. 경계 상자 전체를 끌려면 내부를 선택합니다. 영역을 편집할 수 없는 경우 영역 잠금/잠금 해제 도구를 전환했을 수 있습니다.

템플릿 기반 상자 도구 Template-box tool 또는 "T"를 사용하여 크기가 같은 경계 상자를 여러 개 만듭니다. 이미지에 경계 상자가 없고 템플릿 기반 상자를 활성화하면 도구에서 50x50 픽셀 상자를 생성합니다. 경계 상자를 만든 다음, 템플릿 기반 상자를 활성화하면 새 경계 상자가 마지막으로 만든 경계 상자의 크기와 일치합니다. 배치 후 템플릿 기반 상자의 크기를 조정할 수 있습니다. 템플릿 기반 상자의 크기를 조정하면 특정 상자의 크기만 조정됩니다.

현재 이미지의 모든 경계 상자를 삭제하려면 모든 영역 삭제 도구 Delete regions tool를 선택합니다.

이미지에 대한 경계 상자를 만든 후에는 제출을 선택하여 작업을 저장합니다. 그렇지 않으면 진행 중인 작업이 저장되지 않습니다.

이미지에 태그를 지정하고 이미지 분할을 위한 다각형 지정

프로젝트 형식이 "인스턴스 분할(다각형)"인 경우 이미지에서 하나 이상의 다각형을 지정하고 태그를 각 다각형에 적용합니다. 이미지에는 각각 하나의 태그가 있는 여러 개의 경계 다각형이 있을 수 있습니다. 자세한 지침 보기를 사용하여 프로젝트에서 여러 개의 경계 다각형을 사용하는지 확인합니다.

  1. 만들려는 다각형에 대한 태그를 선택합니다.

  2. 다각형 영역 그리기 도구 Draw polygon region tool를 선택하거나 "P"를 선택합니다.

  3. 다각형의 각 지점을 선택합니다. 도형이 완성되면 두 번 클릭하여 완료합니다.

    Create polygons for Cat and Dog

다각형을 삭제하려면 다각형을 만든 후 옆에 표시되는 X 모양의 대상을 선택합니다.

다각형에 대한 태그를 변경하려면 영역 이동 도구, 다각형, 올바른 태그를 차례로 선택합니다.

기존 다각형을 편집할 수 있습니다. 영역 잠금/잠금 해제 도구 Edit polygons with the lock/unlock regions tool 또는 "L"은 해당 동작을 전환합니다. 영역이 잠겨 있으면 새 다각형의 모양 또는 위치만 변경할 수 있습니다.

다각형 지점 추가 또는 제거 도구 This is the add or remove polygon points tool icon. 또는 "U"를 사용하여 기존 다각형을 조정합니다. 지점을 추가하거나 제거하려면 다각형을 선택합니다. 영역을 편집할 수 없는 경우 영역 잠금/잠금 해제 도구를 전환했을 수 있습니다.

현재 이미지의 모든 다각형을 삭제하려면 모든 영역 삭제 도구 Delete all regions tool를 선택합니다.

이미지에 대한 다각형을 만든 후 제출을 선택하여 작업을 저장하지 않으면 진행 중인 작업이 저장되지 않습니다.

의미 체계 구분을 위해 이미지에 태그 지정 및 마스크 그리기

프로젝트가 "의미 체계 구분(미리 보기)" 형식인 경우 페인트 브러시를 사용하여 태그를 지정할 영역에 마스크를 그립니다.

  1. 페인트할 영역에 대한 태그를 선택합니다.

  2. 페인트 브러시 도구 Screenshot of the Paintbrush tool.를 선택합니다.

  3. 크기 도구Screenshot of the Size tool.를 선택하여 페인트 브러시의 크기를 선택합니다.

  4. 태그를 지정할 영역 위에 페인트를 칠합니다. 태그에 해당하는 색이 그리는 영역에 적용됩니다.

    Screenshot of paint area for cat and dog faces for semantic segmentation.

영역의 일부를 삭제하려면 지우개 도구를 선택합니다.

영역의 태그를 변경하려면 새 태그를 선택하고 영역을 다시 그립니다.

다각형 도구를 사용하여 영역을 지정할 수도 있습니다.

이미지에 대한 영역을 만든 후 제출을 선택하여 작업을 저장하지 않으면 진행 중인 작업이 저장되지 않습니다. 다각형 도구를 사용한 경우 제출할 때 모든 다각형이 마스크로 변환됩니다.

레이블 텍스트

텍스트에 태그를 지정할 때 도구 모음을 사용하여 다음을 수행합니다.

  • 텍스트 크기 늘리기 또는 줄이기
  • 글꼴 변경
  • 이 항목의 레이블 지정을 건너뛰고 다음 항목으로 이동

태그를 할당한 후 실수를 발견한 경우 수정할 수 있습니다. 텍스트 아래에 표시된 레이블에서 "X"를 선택하여 해당 태그를 지웁니다.

다음과 같은 세 가지 텍스트 프로젝트 형식이 있습니다.

프로젝트 형식 설명
분류 다중 클래스 단일 태그를 전체 텍스트 항목에 할당합니다. 각 텍스트 항목에 대해 하나의 태그만 선택할 수 있습니다. 태그, 제출을 차례로 선택하여 다음 참가 항목으로 이동합니다.
분류 다중 레이블 각 텍스트 항목에 하나 이상의 태그를 할당합니다. 각 텍스트 항목에 대해 여러 태그를 선택할 수 있습니다. 적용되는 모든 태그, 제출을 차례로 선택하여 다음 참가 항목으로 이동합니다.
명명된 엔터티 인식 각 텍스트 항목에서 다른 단어 또는 구에 태그를 지정합니다. 다음 섹션의 지침을 참조하세요.

프로젝트별 지침을 보려면 지침을 선택하고, 자세한 지침 보기로 이동합니다.

태그 단어 및 구

프로젝트가 명명된 엔터티 인식에 대해 설정된 경우 각 텍스트 항목에서 다른 단어 또는 구에 태그를 지정합니다. 텍스트에 레이블을 지정하려면 다음을 수행합니다.

  1. 레이블을 선택하거나 적절한 레이블에 해당하는 번호를 입력합니다.
  2. 단어를 두 번 클릭하거나 마우스를 사용하여 여러 단어를 선택합니다.

Screenshot: Named entity recognition.

레이블을 변경하려면 다음을 수행할 수 있습니다.

  • 레이블을 삭제하고 다시 시작합니다.
  • 현재 항목의 특정 레이블 일부 또는 전부에 대한 값을 변경합니다.
    • 레이블 자체를 선택합니다. 그러면 해당 레이블의 모든 인스턴스가 선택됩니다.
    • 유지하려는 인스턴스의 선택을 취소하려면 이 레이블의 인스턴스를 다시 선택합니다.
    • 마지막으로 새 레이블을 선택하여 여전히 선택된 모든 레이블을 변경합니다.

태그가 참가 항목의 모든 항목에 지정되면 제출을 선택하여 다음 참가 항목으로 이동합니다.

완료

태그가 지정된 데이터 페이지를 제출하면 Azure는 작업 큐에서 레이블이 지정되지 않은 새 데이터를 사용자에게 할당합니다. 레이블이 지정되지 않은 사용 가능한 데이터가 더 이상 없으면 포털 홈 페이지에 대한 링크와 함께 이를 알리는 새 메시지가 표시됩니다.

레이블 지정이 완료되면 스튜디오 오른쪽 상단에 있는 원 안에 있는 이미지를 선택한 다음 로그아웃을 선택합니다. 로그아웃하지 않으면 Azure에서 시간이 초과되고 데이터를 다른 레이블 지정자에게 할당합니다.

다음 단계