다음을 통해 공유


1단계. Microsoft Syntex 사용하여 계약 파일 식별 및 데이터 추출

조직에는 받은 많은 파일에서 모든 계약 문서를 식별하고 분류하는 방법이 필요합니다. 또한 식별된 각 계약 파일(예: 클라이언트, 계약자수수료 금액)에서 몇 가지 주요 요소를 빠르게 볼 수 있습니다. Syntex]를 사용하여 구조화되지 않은 문서 처리 모델을 만들고 문서 라이브러리에 적용하여 이 작업을 수행할 수 있습니다.

프로세스 개요

구조화되지 않은 문서 처리 모델은 AI(인공 지능)를 사용하여 파일 분류 및 정보 추출을 자동화합니다. 이러한 유형의 모델은 필요한 정보가 계약과 같은 테이블이나 양식에 포함되지 않은 비정형 및 반구조적 문서에서 정보를 추출하는 데에도 최적입니다.

구조화되지 않은 문서 처리 모델은 OCR(광학 문자 인식) 기술을 사용하여 예제 파일을 사용하여 모델을 학습할 때와 문서 라이브러리의 파일에 대해 모델을 실행할 때 PDF, 이미지 및 TIFF 파일을 검사합니다.

  1. 먼저 식별하려는 콘텐츠 형식(계약)과 관련된 특성을 검색하기 위해 모델을 "학습"하는 데 사용할 수 있는 5개 이상의 예제 파일을 찾아야 합니다.

  2. Syntex를 사용하여 구조화되지 않은 새 문서 처리 모델을 만듭니다. 예제 파일을 사용하여 분류자를 만들어야 합니다. 예제 파일을 사용하여 분류자를 학습하면 회사 계약에서 볼 수 있는 특성과 관련된 특성을 검색하도록 학습합니다. 예를 들어 서비스 계약, 계약 조건보상과 같이 계약에 있는 특정 문자열을 검색하는 "설명"을 만듭니다. 문서의 특정 섹션에서 또는 다른 문자열 옆에 있는 이러한 문자열을 찾기 위해 설명을 학습시킬 수도 있습니다. 필요한 정보를 사용하여 분류자를 학습했다고 생각되면 예제 파일의 샘플 집합에서 모델을 테스트하여 얼마나 효율적인지 확인할 수 있습니다. 테스트 후 필요한 경우 설명을 변경하여 보다 효율적으로 만들 수 있습니다.

  3. 모델에서 추출기를 만들어 각 계약에서 특정 데이터 조각을 가져올 수 있습니다. 예를 들어 각 계약에 대해 가장 우려되는 정보는 클라이언트가 누구인지, 계약자의 이름 및 총 비용입니다.

  4. 모델을 성공적으로 만든 후 SharePoint 문서 라이브러리에 적용합니다. 문서 라이브러리에 문서를 업로드하면 구조화되지 않은 문서 처리 모델이 실행되고 모델에서 정의한 계약 콘텐츠 형식과 일치하는 모든 파일을 식별하고 분류합니다. 계약으로 분류된 모든 파일이 사용자 지정 라이브러리 보기에 표시됩니다. 파일은 추출기에서 정의한 각 계약의 값도 표시합니다.

    문서 라이브러리의 계약입니다.

  5. 계약에 대한 보존 또는 보안 요구 사항이 있는 경우 모델을 사용하여 지정된 기간 동안 계약이 삭제되지 않도록 하거나 계약에 액세스할 수 있는 사용자를 제한하는 보존 레이블 또는 민감도 레이블 을 적용할 수도 있습니다.

모델을 만들고 학습하는 단계

참고

이러한 단계에서는 Contracts Management Solution Assets 리포지토리의 예제 파일을 사용할 수 있습니다. 이 리포지토리의 예제에는 모델 파일과 모델 학습에 사용되는 파일이 모두 포함되어 있습니다.

계약 모델 만들기

첫 번째 단계는 계약 모델을 만드는 것입니다.

  1. 콘텐츠 센터에서 >모델>교육 방법을 선택합니다.

  2. 교육 메서드를 사용하여 모델 만들기 창의이름 필드에 모델의 이름을 입력합니다. 이 계약 관리 솔루션의 경우 모델 이름을 Contract로 지정할 수 있습니다.

  3. 만들기를 선택합니다. 이 작업을 통해 모델에 대한 홈페이지를 만들 수 있습니다.

    계약 홈페이지의 스크린샷.

파일 형식을 분류하도록 모델 학습

모델에 대한 예제 파일 추가

계약 문서인 예제 파일 5개 이상과 계약 문서가 아닌 예제 파일 1개(예: 작업 문)를 추가해야 합니다.

  1. 모델 > 계약 페이지의 주요 작업>예제 파일 추가에서 파일 추가를 선택합니다.

    예제 파일 추가 옵션이 강조 표시된 계약 페이지를 보여 주는 스크린샷

  2. 모델에 대한 예제 파일 선택 페이지에서 Contract 폴더를 열고 사용할 파일을 선택한 다음 추가를 선택합니다. 예제 파일이 없는 경우 업로드 를 선택하여 추가합니다.

파일을 양수 또는 음수 예제로 레이블 지정

  1. 모델 > 계약 페이지의 주요 작업>에서 파일을 분류하고 학습을 실행합니다. 분류자 학습을 선택합니다.

    파일 분류 및 학습 실행 옵션이 강조 표시된 계약 페이지를 보여 주는 스크린샷.

  2. 모델 > 계약 > 계약 분류자 페이지의 첫 번째 예제 파일 맨 위에 있는 뷰어에서 파일이 만든 계약 모델의 예인지 묻는 텍스트가 표시됩니다. 긍정 예제인 경우 를 선택합니다. 부정 예제인 경우 아니요를 선택합니다.

  3. 왼쪽의 레이블이 지정된 예제 목록에서 예제로 사용할 다른 파일을 선택하고 레이블을 지정합니다.

    분류자 홈페이지.

분류자를 학습하기 위해 하나 이상의 설명을 추가합니다.

  1. 모델 > 계약 > 계약 분류자 페이지에서 학습 탭을 선택합니다.

  2. 학습된 파일 섹션에는 이전에 레이블을 지정한 예제 파일 목록이 표시됩니다. 목록에서 양수 파일 중 하나를 선택하여 뷰어에 표시합니다.

  3. 설명 섹션에서 새로 만들기를 선택한 다음 공백을 선택합니다.

  4. 설명 만들기 페이지에서 다음을 수행합니다.

    a. 이름 필드에 설명의 이름(예: "계약")을 입력합니다.

    b. 텍스트 문자열을 추가하므로 설명 형식 필드에서 구 목록을 선택합니다.

    c. 구 목록 상자에 문자열(예: "AGREEMENT")을 입력합니다. 문자열이 대/소문자를 구분 해야 하는 경우 대/소문자를 구분하도록 선택할 수 있습니다.

    d. 저장 및 학습을 선택합니다.

    설명 만들기 패널의 스크린샷.

모델 테스트하기

이전에는 볼 수 없었던 예제 파일에서 계약 모델을 테스트할 수 있습니다. 선택 사항이지만 유용한 모범 사례일 수 있습니다.

  1. 모델 > 계약 > 계약 분류자 페이지에서 테스트 탭을 선택합니다. 레이블이 지정되지 않은 예제 파일에서 모델을 실행합니다.

  2. 테스트 파일 목록에서 예제 파일은 모델이 양수 또는 음수로 예측했는지 표시하고 표시합니다. 이 정보를 사용하여 문서를 식별하는 데 필요한 분류자의 효율성을 알아낼 수 있습니다.

    텍스트 파일 목록의 레이블이 지정되지 않은 파일의 스크린샷

  3. 완료되면 학습 종료를 선택합니다.

추출기 만들기 및 학습

  1. 모델 > 계약 페이지의 주요 작업>에서 추출기 만들기 및 학습에서 추출기만들기를 선택합니다.

    추출기 만들기 및 학습 옵션이 강조 표시된 계약 페이지를 보여 주는 스크린샷

  2. 새 엔터티 추출기 패널의 새 이름 필드에 추출기의 이름을 입력합니다. 예를 들어 각 계약에서 클라이언트 이름을 추출하려는 경우 클라이언트로 이름을 지정합니다.

  3. 입력이 끝나면 만들기를 선택합니다.

추출하려는 엔터티에 레이블 지정

추출기를 만들면 추출기 페이지가 열립니다. 여기 뷰어에 표시된 목록의 첫번째 파일과 함께 샘플 파일 목록이 표시됩니다.

클라이언트 추출기 레이블이 지정된 예제 페이지의 스크린샷

엔터티에 레이블을 지정하려면 다음을 수행합니다.

  1. 뷰어에서 파일로부터 추출하려는 데이터를 선택합니다. 예를 들어 클라이언트를 추출하려는 경우 첫 번째 파일의 클라이언트 값(이 예제에서는 Best For You Organics)을 강조 표시한 다음 저장을 선택합니다. 레이블이 지정된 예제 목록의 레이블 열 아래에 파일의 값이 표시됩니다.

  2. 다음 파일을 선택하여 자동 저장하고 뷰어의 목록에서 다음 파일을 엽니다. 또는 저장을 선택한 다음 레이블이 지정된 예제 목록에서 다른 파일을 선택합니다.

  3. 뷰어에서 1단계와 2단계를 반복한 다음 레이블을 모든 파일에 저장할 때까지 반복합니다.

파일에 레이블을 지정하면 학습으로 이동하라는 알림 배너가 표시됩니다. 더 많은 문서에 레이블을 지정하거나 학습으로 진행하도록 선택할 수 있습니다.

설명 추가하기

엔터티 형식 자체와 예제 파일에 있을 수 있는 변형에 대한 힌트를 제공하는 설명을 만들 수 있습니다. 예를 들어 날짜 값은 다음과 같은 다양한 형식일 수 있습니다.

  • 2019/10/14
  • 2019년 10월 14일
  • 2019년 10월 14일 월요일

계약 시작 날짜를 식별하는 데 도움이 되도록 설명을 만들 수 있습니다.

  1. 설명 섹션에서 새로 만들기를 선택한 다음 공백을 선택합니다.

  2. 설명 만들기 페이지에서 다음을 수행합니다.

    a. 이름 필드에 설명의 이름(예: 날짜)을 입력합니다.

    b. 설명 유형 필드에서 구 목록을 선택합니다.

    c. 필드에서 샘플 파일에 표시되는 날짜 변형을 제공합니다. 예를 들어 0000/00/0으로 표시되는 날짜 형식이 있는 경우 문서에 표시되는 모든 변형을 다음과 같이 입력합니다.

    • 0000/0/0
    • 0000/0/00
    • 0000/00/0
    • 0000/00/00
  3. 저장 및 학습을 선택합니다.

모델을 다시 테스트합니다.

이전에는 볼 수 없었던 예제 파일에서 계약 모델을 테스트할 수 있습니다. 선택 사항이지만 유용한 모범 사례일 수 있습니다.

  1. 모델 > 계약 > 계약 분류자 페이지에서 테스트 탭을 선택합니다. 레이블이 지정되지 않은 예제 파일에서 모델을 실행합니다.

  2. 테스트 파일 목록에서 예제 파일은 모델이 필요한 정보를 추출할 수 있는지를 표시하고 표시합니다. 이 정보를 사용하여 문서를 식별하는 데 필요한 분류자의 효율성을 알아낼 수 있습니다.

  3. 완료되면 학습 종료를 선택합니다.

문서 라이브러리에 모델 적용

SharePoint 문서 라이브러리에 모델을 적용하려면 다음을 수행합니다.

  1. 모델 > 계약 페이지의 주요 작업>라이브러리에 모델 적용에서 모델 적용을 선택합니다.

    라이브러리에 모델 적용 옵션이 강조 표시된 계약 페이지를 보여 주는 스크린샷

  2. 계약 추가 패널에서 모델을 적용할 문서 라이브러리가 포함된 SharePoint 사이트를 선택합니다. 사이트가 목록에 표시되지 않는 경우, 검색 상자를 사용하여 찾습니다. 추가를 선택합니다.

    참고

    모델을 적용할 문서 라이브러리에 대한 목록 관리 권한 또는 편집 권한이 있어야 합니다.

  3. 사이트를 선택한 후 모델을 적용할 문서 라이브러리를 선택합니다.

  4. 모델은 콘텐츠 형식에 연결되어 있으므로 라이브러리에 적용하면 추출한 레이블이 열로 표시된 콘텐츠 형식과 해당 뷰가 추가됩니다. 이 보기는 기본적으로 라이브러리의 기본 보기이지만 필요에 따라 고급 설정을 선택하고 이 새 보기를 기본 보기로 설정 확인란의 선택을 취소하여 기본 보기가 되지 않도록 선택할 수 있습니다.

  5. 라이브러리에 모델을 적용하려면 추가를 선택합니다.

  6. 모델 > 계약 페이지의 이 모델이 있는 라이브러리 섹션에 SharePoint 사이트의 URL이 나열됩니다.

    이 모델과 함께 라이브러리 섹션을 보여 주는 계약 홈 페이지의 스크린샷.

  7. 설정>라이브러리 설정에서 다음을 수행합니다.

    • Status라는 열을 추가하고 선택 항목을 열 형식으로 선택합니다.
    • 검토 중, 승인됨거부됨 값을 적용합니다.

모델을 문서 라이브러리에 적용한 후 사이트에 문서 업로드를 시작하고 결과를 볼 수 있습니다.

다음 단계

2단계. Microsoft Teams를 사용하여 계약 관리 채널 만들기