문서 처리 FAQ
이 문서는 AI Builder의 문서 처리 모델에 대해 자주 묻는 질문으로 구성되어 있습니다. 여기에서 질문을 찾지 못하면 문서 처리 AI 모델 개요를 검토하거나 커뮤니티 AI Builder용 Power Automate Community에 질문을 제출하세요.
문서 처리를 통해 사용자 지정 AI 모델을 빌드하여 다양한 종류의 문서에서 정보를 추출할 수 있습니다.
- 고정 템플릿 문서 옵션은 문서의 요소가 유사한 위치에서 찾을 수 있는 경우에 이상적입니다. 일반적으로 송장, 구매 주문, 배달 주문, 세금 양식의 경우입니다.
- 일반 문서 옵션은 첫 번째 옵션에서 지원되는 문서는 물론 계약서, 작업 명세서, 편지 등을 포함한 모든 종류의 문서에 이상적입니다. 이 옵션은 데이터를 추출하는 데 더 강력할 수 있지만 훈련 시간이 더 오래 걸립니다.
추가 정보: 문서 처리 모델 개요
지원되는 파일 유형은 PDF, JPG, PNG입니다.
문서 처리는 문서에서 필드, 테이블 및 확인란을 추출할 수 있습니다.
자세히 보기: 추출할 정보 정의
예. 문서 처리는 문서에서 인쇄된 텍스트와 손으로 쓴 텍스트를 추출할 수 있습니다.
동일한 레이아웃을 사용하는 고품질 문서의 경우 5개의 샘플 문서로 충분합니다. 저품질 문서(예: 저품질 스캔)의 경우 더 많은 샘플 문서가 필요할 수 있습니다. 결과를 개선하려면 15~20개의 샘플 문서를 사용하세요.
예. 컬렉션 기능을 사용하면 레이아웃이 다른 문서를 처리하도록 단일 양식 처리 모델을 훈련할 수 있습니다.
자세히 보기: 컬렉션별로 문서 그룹화
각 양식은 별도의 파일에 있어야 합니다. 예를 들어 여러 청구서가 포함된 PDF 문서가 있는 경우 문서 처리 모델로 보내기 전에 각 청구서에 대해 별도의 파일을 만드세요.
문서 처리 모델이 처리할 페이지를 지정할 수도 있습니다. 이렇게 하면 페이지별로 반복되는 모델의 기능을 활용하고 한 번에 하나의 양식을 처리할 수 있습니다.
더 알아보기: 페이지 범위
모델이 학습 후 좋지 않은 결과를 반환하는 경우 모델을 편집하고 학습을 위해 더 많은 샘플을 제공하세요. 더 많은 샘플을 제공할수록 AI 모델은 문서에서 데이터를 추출하는 방법을 더 많이 배울 것입니다.
추가 정보: 문서 처리 모델의 성능 향상
환경당 60초마다 최대 360개의 문서를 처리할 수 있습니다.
- 0(숫자)과 O(문자), 1(숫자)과 l(문자), 4(숫자)와 A(문자) 등 일부 문자가 혼동될 수 있습니다.
- 다른 문자 위에 있거나 가까운 문자가 잘못 인식되는 경우가 발생할 수 있습니다. 세로줄 위의 O(문자)는 0(숫자)이 되고, 줄 위의 5(숫자)는 $(미국 달러 기호)가 되며, l_(소문자, 밑줄)은 L(대문자)가 됩니다.
- 품질이 낮은 문서의 일부 문자가 잘못 인식되거나 전혀 인식되지 않는 경우가 발생할 수 있습니다.
위의 경우 AI Builder에서는 인식을 향상시키기 위해 아무것도 할 수 없습니다. 유사한 문제를 해결하려면 소스 문서의 품질과 레이아웃을 개선하는 것이 좋습니다.
참고
문자를 감지하는 OCR 기술은 Microsoft에서 지속적으로 개선되므로 이러한 문제가 자주 발생하지 않습니다.
모델당 최대 200개의 컬렉션을 만들 수 있습니다. 그러나 수십 개의 컬렉션이 포함된 일반 문서 모델을 훈련하는 데 몇 시간이 걸릴 수 있으며 드문 경우지만 시간 초과가 발생할 수 있습니다. 모델에 컬렉션 수가 많은 경우 모델 학습이 완료될 때까지 최대 24시간을 기다려야 합니다.
현재는 솔루션에서 모델을 생성할 수 없습니다.
예, 계약서 및 서신과 같은 구조화되지 않은 문서는 일반 문서 옵션을 사용하여 문서 처리를 통해 지원됩니다.
상황에 따라 특정 모델 또는 이들의 조합을 사용해야 할 수도 있습니다.
이미지 또는 PDF에 있는 모든 텍스트를 추출하려는 경우 텍스트 인식을 사용하세요. 그런 다음 예를 들어 추출된 텍스트에서 키워드를 검색하거나 특정 항목을 추출하기 위해 몇 가지 고정 규칙을 작성할 수 있습니다.
청구서, 영수증, 여권, 운전 면허증 또는 명함에서 정보를 추출하려면 해당 사전 제작 모델부터 시작하세요.
- 청구서 처리
- 영수증 처리
- ID 문서 판독기 (여권과 운전면허증)
- 비즈니스 카드 판독기
새 모델을 만들 필요 없이 이러한 미리 빌드된 모델을 즉시 사용할 수 있습니다. 이러한 모델은 해당 문서 유형에서 찾은 공통 정보를 추출할 수 있습니다.
다른 문서 유형의 경우 사용자 지정 문서 처리 모델을 만들어 필요한 필드와 테이블을 추출할 수 있습니다. 이는 미리 빌드된 모델에서 제공하지 않는 추가 정보가 필요한 경우에도 적용됩니다.
자세히 보기: 사용자 지정 문서 처리 모델
AI Builder 문서 처리는 Azure Form Recognizer를 기반으로 합니다. 이를 통해 두 제품 모두 Microsoft AI의 최신 개선 사항을 제공합니다.
AI Builder는 Microsoft Power Platform의 일부입니다. 이를 통해 누구나 사용하기 쉬운 인터페이스를 통해 AI를 앱 및 자동화에 추가할 수 있습니다. 개발자나 데이터 과학자가 아니어도 상관없습니다.
Azure Form Recognizer는 전문 개발자를 대상으로 합니다. 간단한 REST API를 사용하여 사용자 지정 코드 솔루션에 AI 기능을 추가할 수 있습니다.
평가판을 시작하여 무료로 문서 처리를 시작할 수 있습니다. 평가한 후 문서 처리를 사용하려면 AI Builder 크레딧을 구매해야 합니다. 문서 처리로 처리하는 모든 페이지는 페이지에 추출할 데이터가 포함되어 있지 않더라도 AI Builder 크레딧을 소비합니다. AI Builder 크레딧은 AI Builder 추가 항목을 통해 구입할 수 있습니다.
자세히 알아보기: AI Builder 라이선스