다음을 통해 공유


문서 처리 모델 요구 사항 및 제한 사항

지원되는 언어

고정 템플릿 문서용 모델

문서 처리 모델을 훈련하고 문서 유형으로 고정 템플릿 문서를 선택할 때 다음 언어가 지원됩니다.

아바자어, 압하지야어, 아중국어, 아콜리어, 아당메어, 아디게어, 아파르어, 아프리칸스어, 아칸스어, 알바니아어, 알곤킨어, 안기카어(데바나가리), 아랍어, 아스투리아어, 아수(탄자니아), 아바릭어, 아와디힌디어(데바나가리), 아이마라어, 아제르바이잔어(라틴 문자), 바피아어, 바겔리어, 밤바라어, 바스키르어, 바스크어, 벨라루스어(키릴 자모), 벨라루스어(라틴 문자), 벰바어(잠비아), 벰바어(잠비아), 보즈푸리어-힌디어(데바나가리), 비콜어, 비니어, 비슬라마어, 보도어(데바나가리), 보스니아어(라틴 문자), 브라즈바어, 브르타뉴어, 불가리아어, 분델리어, 부랴트어(키릴 자모), 카탈로니아어, 세부아노어, 참링어, 차모로어, 체첸어, 차티스가르어(데바나가리어), 치가어, 중국어 간체, 중국어 번체, 촉토어, 추코트어, 추바시어, 콘월어, 코르시카어, 크리어, 크릭어, 크림 타타르어(라틴 문자), 크로아티아어, 크로우, 체코어, 덴마크어, 다르그와어, 다리어, 디말어(데바나가리어), 도그리어(데바나가리어), 두알라어, 둔간어, 네덜란드어, 에픽어, 영어, 에르자모(키릴 자모), 에스토니아어, 페로어, 피지어, 필리핀어, 핀란드어, 펀드, 프랑스어, 프리울리아어, 가어, 가가우즈어(라틴 문자), 갈리시아어, 코뿔소어, 가요어, 독일어, 길베르테스어, 곤디어(데바나가리), 그리스어, 그린란드어, 과라니어, 구룽어(데브나그리어), 구시어, 아이티 크리올어, 할비어(데바나가리), 하니어, 하리안비어, 하와이어, 하와이어, 히브리어, 헤레로어, 힐리가논어, 힌디어, 몽족어(라틴어), 호어(데방기리), 헝가리어, 이반어, 아이슬란드어, 이그보어, 일로코어, 이나리어 사미어, 인도네시아어, 잉구쉬어, 인테르링구어, 이누이트어(라틴 문자), 아일랜드어, 이탈리아어, 일본어, 자운사리어(데바나가리어), 자바어, 졸라포니어, 카바르디아어, 카부베르디아누어, 카친어(라틴 문자), 칼렌진어, 칼미크어, 캉그리어(데바나가리), 카누리어, 카라차이발카르어, 카라칼팍어(키릴 자모), 카라칼팍어(라틴 문자), 카슈브어, 카자흐어(키릴 자모), 카자흐어(라틴 문자), 카카스어, 칼링어, 카시어, 키키체어, 키쿠유어, 킬딘 사미어, 키냐르완다어, 코미어, 콩고어, 한국어, 코르쿠어, 코랴크어, 코스라어, 크펠레어, 쿠안야마어, 쿠미크어 (키릴 자모), 쿠르드어(아랍어), 쿠르드어(라틴 문자), 쿠루크어(데바나가리), 키르기스어(키릴 자모), 라크어, 라코타어, 라틴어, 라트비아어, 레즈긴어, 링갈라어, 리투아니아어, 니더소르브어, 로지어, 룰레사미어, 루오어(케냐 및 탄자니아), 룩셈부르크어, 루이아루이, 마케도니아어, 마차메어, 마두라어, 마하수파하리어(데바나가리어), 마쿠와-미토어, 마콘데어, 마다가스카르어, 말레이어(라틴 문자), 몰타어, 말토어(데바나가리), 만딩카어, 맹크스어, 마오리어, 마푸둥군, 마라티어, 마리어(러시아), 마사이어, 멘데어(시에라리온), 메루어, 메타어, 미낭카바우어, 모호크어, 몽골어(키릴 자모), 몽곤도우, 몬테네그로어(키릴 자모), 몬테네그로어(라틴 문자), 모리셴어, 문당, 나우아틀어, 나바호어, 은동아어, 나폴리어, 네팔어, 은곰바어, 니우아어, 노가이어, 북부 은데벨레어, 북부 사미어(라틴 문자), 노르웨이어, 냔자어, 냔콜레어, 은지마어, 오크어, 오지브와어, 오로모어, 오세트어, 팜팡가어, 팡가시난어, 파피아멘토어, 파슈토어, 페디어, 페르시아어, 폴란드어, 포르투갈어, 펀자브어(아랍어), 케추아어, 리푸아어, 루마니아어, 로만슈어, 룬디어, 러시아어, Rwa, 사드리어(데바나가리어), 사하어, 삼부루어, 사모아어(라틴 문자), 산고어, 산구어(가봉), 산스크리트어(데바나가리어), 산탈어(데바나기리어), 스코틀랜드어, 스코틀랜드 게일어, 세나어, 세르비아어(키릴 자모), 세르비아어(라틴 문자), 샴발라어, 셰르파(데바나가리), 쇼나어, 식시카어, 시르마우리어(데바나가리), 스콜트 사미어, 슬로바키아어, 슬로바키아어, 슬로베니아어, 소가어, 소말리아어(아랍어), 소말리아어(라틴 문자), 송가이어, 남부 은데벨레어, 남부 알타이어, 남부 사미어, 남부 소토어, 스페인어, 순다어, 스와힐리어(라틴 문자), 스와티어, 스웨덴어, 타바사란어, 타헬힛어, 타히티어, 타이타어, 타지크어(키릴 자모), 타밀어, 타타르어(키릴 자모), 타타르어(라틴 문자), 테소어, 테툼어, 태국어, 탕미어, 톡피신어, 통가어, 송가어, 츠와나어, 터키어, 투르크멘어(라틴 문자), 투바어, 우드무르트어, 위구르어(키릴 자모), 우크라이나어, 어퍼 소르브어, 우르두어, 위구르어(아랍어), 우즈베크어(아랍어), 우즈베크어(키릴 자모), 우즈베크어(라틴 문자), 베트남어, 볼라퓌크어, 분조어, 왈저어, 웨일스어, 서부 프리지아어, 월로프어, 코사어, 유카텍 마야어, 사포텍어, 자르마어, 좡어, 줄루어

일반 문서용 모델

문서 처리 모델을 훈련하고 문서 유형으로 일반 문서를 선택할 때 다음 언어가 지원됩니다.

아프리칸스어, 알바니아어, 아랍어, 불가리아어, 중국어(한어(간체)), 중국어(한어(번체)), 크로아티아어, 체코어, 덴마크어, 네덜란드어, 에스토니아어, 핀란드어, 프랑스어, 독일어, 히브리어, 힌디어, 헝가리어, 인도네시아어, 이탈리아어, 일본어, 한국어, 라트비아어, 리투아니아어, 마케도니아어, 마라티어, 현대 그리스어(1453-), 네팔어(매크로어), 노르웨이어, 판자비어, 페르시아어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 슬로바키아어, 슬로베니아어, 소말리아어(아랍어), 소말리아어(라틴어), 스와힐리어(매크로어), 스웨덴어, 타밀어, 태국어, 터키어, 우크라이나어, 우르두어, 베트남어

요구 사항

문서 처리는 다음 요구 사항을 충족하는 입력 문서에서 작동합니다.

  • JPG, PNG 또는 PDF 형식(텍스트 또는 스캔)이어야 합니다. 문자 추출과 위치에 오류가 없어서 텍스트가 임베드된 PDF가 더 좋습니다.
  • TIFF 파일은 학습에 사용할 수 없습니다. 모델을 학습시키려면 PDF, JPG 또는 PNG 형식의 문서를 사용해야 합니다. 모델이 훈련되면 Power Automate 클라우드 흐름에서 모델이 사용될 때 TIFF 파일에서 데이터를 추출할 수 있습니다.
  • PDF가 암호로 잠겨 있으면 제출하기 전에 잠금을 해제해야 합니다.
  • 처리할 최대 문서 크기는 20MB를 초과할 수 없습니다.
  • 이미지는 크기가 50 x 50 픽셀에서 10,000 × 10,000 픽셀 사이여야 합니다.
  • 종이 문서를 스캔할 때는 이미지 품질을 아주 높은 수준으로 유지해야 합니다.
  • 모델당 최대 200개의 컬렉션을 만들 수 있습니다.
  • 클라우드 흐름에서 문서 처리를 위해 태그를 지정할 수 있는 필드의 제한은 300개입니다.

노트

  • 문서에서 서명 추출은 현재 지원되지 않습니다.
  • 페이지 경계를 넘어 분할되는 필드는 현재 지원되지 않습니다.
  • 한 페이지에서 다른 페이지로 넘어가는 행은 현재 지원되지 않습니다.

최적화 팁

문서 처리 모델의 성능 개선 방법을 설명합니다.

다음 단계

양식 처리 모델 만들기