다음을 통해 공유


문서에서 날짜 및 숫자 추출

추출하는 필드는 단순 텍스트인 경우가 많지만 추출하는 정보가 날짜나 금액을 포함한 숫자인 경우도 있습니다.

이 데이터를 대상 시스템으로 가져오는 것은 번거로울 수 있으며 중요한 사용자 지정 변환 논리가 필요합니다. 대부분의 가져오기 커넥터 및 API는 YYYY-MM-DD와 같이 ISO 8601 형식의 정규화된 날짜만 허용합니다. 또한 NNN.DD와 같이 천 단위 구분 기호 없이 소수점 구분 기호로 점(.)을 사용하는 숫자만 허용합니다.

날짜 형식에 대해 자세히 알아보려면 ISO 8601 날짜 및 시간 형식으로 이동하세요.

마법사의 필드 생성 단계에서 이 유형을 선언하고 날짜 또는 숫자 규칙(로캘과 동일)을 선택하는 기능을 추가했습니다.

날짜 규칙

다음 예에서는 날짜 필드가 있는 모기지 명세서를 보여줍니다.

'개요'의 '날짜 필드' 스크린샷.

다음 예에서는 날짜 필드 형식을 보여줍니다.

'날짜 필드' 형식의 스크린샷.

지원되는 데이터 형식

필드를 정의할 때 년, 월, 일, 월, 일, 년 또는 일, 월, 년 중에서 선택합니다.

다음 문자를 날짜 구분 기호로 사용할 수 있습니다: ,-/.\. 공백은 구분 기호로 사용할 수 없습니다. 예:

  • 01,01,2020
  • 01-01-2020
  • 01/01/2020

일과 월은 각각 1자리 또는 2자리로 작성할 수 있고 연도는 2자리 또는 4자리로 작성할 수 있습니다.

  • 1-1-2020
  • 1-01-20

날짜 문자열이 8자리인 경우 구분 기호는 선택 사항입니다.

  • 01012020
  • 01 01 2020

월은 전체 또는 짧은 이름으로도 쓸 수 있습니다. 이름을 사용하는 경우 구분 기호는 선택 사항입니다. 그러나 이 형식은 다른 형식보다 덜 정확하게 인식될 수 있습니다.

  • 01/Jan/2020
  • 01Jan2020
  • 01 Jan 2020

숫자 규칙

다음 예에서는 숫자 필드가 있는 모기지 명세서를 보여줍니다.

'개요'의 '숫자 필드' 스크린샷.

다음 예에서는 숫자 필드 형식을 보여줍니다.

'숫자 필드' 형식의 스크린샷.

참고

각 필드에 대해 이 모델의 모든 컬렉션에 대해 주어진 필드에 대해 하나의 규칙만 허용됩니다. 예를 들어, 소수 구분 기호로 쉼표(,) 사용을 선택하여 필드 금액을 추출하면 다음 텍스트 1234,56 또는 1 234,56이 1234.56으로 변환됩니다. 12,34,576.78 또는 1,234.56 형식의 금액은 변환되지 않습니다.

추출하는 동안 텍스트는 제공된 규칙에 따라 자동으로 변환됩니다. 이 변환된 값은 YOURFIELDNAME value 결과를 사용하여 검색할 수 있습니다. 변환이 불가능한 경우 이 값은 비어 있습니다. 원본 텍스트는 YOURFIELDNAME text 결과를 사용하여 검색할 수 있습니다.

지원되는 숫자 형식

필드를 정의할 때 소수 구분 기호로 점(.) 사용 또는 소수 구분 기호로 쉼표(,) 사용을 선택합니다.

소수 구분 기호가 점(.)인 경우 천 단위 구분 기호는 생략할 수 있으며, 쉼표(,)나 공백을 사용할 수 있습니다. 예:

  • 1234.56
  • 1,234.56
  • 1 234.56

소수 구분 기호가 쉼표(,)인 경우 천 단위 구분 기호나 공백을 생략할 수 있습니다. 예:

  • 1234,56
  • 1 234.56

다음 단계

문서 처리 모델 학습 및 게시

학습: AI Builder로 사용자 지정 문서 처리(모듈)