사용자 지정 모델 학습

완료됨

Azure의 Azure Document Intelligence 서비스는 감독된 기계 학습을 지원합니다. 사용자 지정 모델을 학습시키고 양식 문서 레이블이 지정된 필드가 포함된 JSON 문서를 복합 모델을 만들 수 있습니다.

사용자 지정 모델 학습에 필요한 샘플 양식 문서의 스크린샷

사용자 지정 모델을 학습하려면 다음을 수행합니다.

  1. 레이아웃 및 레이블 필드 정보를 포함하는 JSON 파일과 함께 Azure Blob 컨테이너에 샘플 양식을 저장합니다.
    • Azure Document Intelligence의 Analyze 문서 함수를 사용하여 각 샘플 양식에 대한 ocr.json 파일을 생성할 수 있습니다. 또한 추출할 필드를 설명하는 단일 fields.json 파일과 해당 양식의 해당 위치에 필드를 매핑하는 각 샘플 양식에 대한 labels.json 파일이 필요합니다.
  2. 컨테이너에 대한 SAS(공유 액세스 보안) URL을 생성합니다.
  3. Build 모델 REST API 함수(또는 동등한 SDK 메서드)를 사용합니다.
  4. Get 모델 REST API 함수(또는 동등한 SDK 메서드)를 사용하여 학습된 모델 ID가져옵니다.

또는

  1. Azure Document Intelligence Studio를 사용하여 레이블을 지정하고 학습합니다. 사용자 지정 템플릿 모델 또는 사용자 지정 신경망 모델 사용자 지정 양식에 대한 두 가지 기본 모델이 있습니다.
    • 사용자 지정 템플릿 모델은 문서에서 레이블이 지정된 키-값 쌍, 선택 표시, 테이블, 영역 및 서명을 정확하게 추출할 있습니다. 교육은 몇 분 밖에 걸리지 않으며 100개 이상의 언어가 지원됩니다.
    • 사용자 지정 신경망 모델 레이아웃 및 언어 기능을 결합하여 문서에서 레이블이 지정된 필드를 정확하게 추출하는 심층 학습된 모델입니다. 이 모델은 반구조적 또는 구조화되지 않은 문서에 가장 적합합니다.