사용자 지정 모델 학습
Azure의 Azure Document Intelligence 서비스는 감독된 기계 학습을 지원합니다. 사용자 지정 모델을 학습시키고 양식 문서 레이블이 지정된 필드가 포함된 JSON 문서를 복합 모델을 만들 수 있습니다.
사용자 지정 모델을 학습하려면 다음을 수행합니다.
- 레이아웃 및 레이블 필드 정보를 포함하는 JSON 파일과 함께 Azure Blob 컨테이너에 샘플 양식을 저장합니다.
- Azure Document Intelligence의 Analyze 문서 함수를 사용하여 각 샘플 양식에 대한 ocr.json 파일을 생성할 수 있습니다. 또한 추출할 필드를 설명하는 단일 fields.json 파일과 해당 양식의 해당 위치에 필드를 매핑하는 각 샘플 양식에 대한 labels.json 파일이 필요합니다.
- 컨테이너에 대한 SAS(공유 액세스 보안) URL을 생성합니다.
- Build 모델 REST API 함수(또는 동등한 SDK 메서드)를 사용합니다.
- Get 모델 REST API 함수(또는 동등한 SDK 메서드)를 사용하여 학습된 모델 ID가져옵니다.
또는
- Azure Document Intelligence Studio를 사용하여 레이블을 지정하고 학습합니다. 사용자 지정 템플릿 모델 또는 사용자 지정 신경망 모델 사용자 지정 양식에 대한 두 가지 기본 모델이 있습니다.
- 사용자 지정 템플릿 모델은 문서에서 레이블이 지정된 키-값 쌍, 선택 표시, 테이블, 영역 및 서명을 정확하게 추출할 있습니다. 교육은 몇 분 밖에 걸리지 않으며 100개 이상의 언어가 지원됩니다.
- 사용자 지정 신경망 모델 레이아웃 및 언어 기능을 결합하여 문서에서 레이블이 지정된 필드를 정확하게 추출하는 심층 학습된 모델입니다. 이 모델은 반구조적 또는 구조화되지 않은 문서에 가장 적합합니다.