Azure AI 문서 인텔리전스의 새로운 기능
이 콘텐츠의 적용 대상: v4.0(미리 보기) v3.1(GA) v3.0(GA) v2.1(GA)
문서 인텔리전스 서비스는 지속적으로 업데이트됩니다. 릴리스 정보, 향상된 기능, 최신 설명서를 최신 상태로 유지하려면 이 페이지에 책갈피를 지정하세요.
Important
미리 보기 API 버전은 GA API가 릴리스되면 사용 중지됩니다. 미리 보기 API 또는 관련 SDK 버전을 계속 사용하는 경우 2023-02-28-preview API 버전이 사용 중지됩니다. 최신 API 버전 2023-07-31(GA)을 대상으로 코드를 업데이트하세요.
2024년 8월
이제 문서 인텔리전스 2024-07-31-preview REST API를 사용할 수 있습니다. 이 미리 보기 API는 다음과 같은 새로운 기능과 업데이트된 기능을 소개합니다.
공개 미리 보기 버전 2024-07-31-preview는 현재 다음 Azure 지역에서만 사용할 수 있습니다. AI 스튜디오의 새로운 문서 필드 추출 모델은 미국 중북부 지역에서만 사용할 수 있습니다.
미국 동부
미국 서부2
서유럽
미국 중북부
-
- 생성형 AI를 사용하여 문서와 양식에서 필드를 추출합니다. 이제 문서 인텔리전스에서는 LLM(대규모 언어 모델)을 활용하여 다양한 시각적 템플릿을 통해 구조화되지 않은 문서 또는 구조화된 양식에서 필드를 추출하는 새로운 문서 필드 추출 모델을 제공합니다. 근거 값과 신뢰도 점수를 사용하는 새로운 생성형 AI 기반 추출은 기존 프로세스에 적합합니다.
-
- 이제 문서 인텔리전스에는 명시적 사용자 지정 분류 모델을 이용하는 모델 작성 작업에 대한 지원 기능이 추가되었습니다. 새로운 작성 기능을 사용할 때 얻는 이점에 대해 자세히 알아보세요.
-
- 이제 사용자 지정 분류은 모델 내부 업데이트 기능도 지원합니다.
- 사용자 지정 분류 모델에는 백업 및 재해 복구를 사용할 수 있는 모델 복사 작업에 대한 지원 기능이 추가되었습니다.
- 이제 사용자 지정 분류 모델에서는 입력 문서에서 분류할 페이지를 명시적으로 지정하는 기능을 지원합니다.
-
- 평가에서 정보를 추출합니다(양식 1004).
- 고용 유효성 검사에서 정보를 추출합니다(양식 1005).
-
- 수표에서 수취인, 금액, 날짜 및 기타 관련 정보를 추출합니다.
-
- 급여 명세서를 처리하여 임금, 근무 시간, 공제액, 실수령액 등을 추출할 수 있도록 미리 빌드된 새로운 기능입니다.
-
- 기초/기말 잔액, 은행 명세서의 거래 세부 정보를 포함한 계좌 정보를 추출할 수 있도록 미리 빌드된 새로운 기능입니다.
-
- W-2, 1098, 1099, 1040 같은 양식에서 추출할 수 있는, 새로운 통합형 미국 세금 모델입니다.
🆕 검색 가능 PDF. 이제 미리 빌드된 읽기 모델은 추출 결과에서 텍스트가 포함된 PDF를 다운로드할 수 있는 PDF 출력 기능을 지원하여 콘텐츠 검색 복사본과 같은 시나리오에서 PDF를 활용할 수 있습니다.
이제 레이아웃 모델은 문서의 그림을 이미지 파일로 다운로드하여 그림을 더 잘 이해하는 데 사용할 수 있는 향상된 그림 감지 기능을 지원합니다. 또한 레이아웃 모델에서는 단일 문자, 상자형 텍스트, 조밀한 텍스트 문서용으로 검사한 텍스트 대상 지정 기능을 향상시키기 위해 OCR 모델을 개선하였습니다.
-
- 이제 문서 인텔리전스에는 문서 집합 분석을 지원하여 개발자 환경을 간소화하고 효율성을 증진시킬 수 있는 배치 분석 작업에 대한 지원 기능이 추가되었습니다.
-
- 최신 모델에서는 쿼리 필드 AI 추출 품질이 향상되었습니다.
2024년 5월
문서 인텔리전스 스튜디오는 Microsoft Entra(이전의 Azure Active Directory) 인증에 대한 지원을 추가합니다. 자세한 내용은 문서 인텔리전스 스튜디오 개요를 참조하세요.
2024년 2월
이제 문서 인텔리전스 2024-07-31-preview REST API를 사용할 수 있습니다. 이 미리 보기 API는 다음과 같은 새로운 기능과 업데이트된 기능을 소개합니다.
공개 미리 보기 버전 2024-07-31-preview는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
- 미국 동부
- 미국 서부2
- 서유럽
이제 레이아웃 모델이 그림 검색 및 계층적 문서 구조 분석(섹션 및 하위 섹션)을 지원합니다. 읽는 순서 및 논리적 역할 검색의 AI 품질도 개선되었습니다.
-
- 이제 사용자 지정 추출 모델이 셀, 행 및 테이블 수준 신뢰도 점수를 지원합니다. 표, 행 및 셀 신뢰도에 대해 자세히 알아봅니다.
- 사용자 지정 추출 모델에는 필드 추출에 대한 AI 품질이 개선되었습니다.
- 이제 사용자 지정 템플릿 추출 모델이 겹치는 필드 추출을 지원합니다. 겹치는 필드와 사용 방법에 대해 자세히 알아봅니다.
-
- 이제 사용자 지정 분류 모델은 추가된 샘플 또는 클래스로 분류자 모델을 업데이트해야 하는 시나리오에 대한 증분 학습을 지원합니다. 증분 학습에 대해 자세히 알아봅니다.
- 사용자 지정 분류 모델은 Office 문서 형식(.docx, .pptx 및 .xls)에 대한 지원을 추가합니다. 확장된 문서 형식 지원에 대해 자세히 알아봅니다.
-
- 새 로캘에 대한 지원:
Locale 코드 아랍어 ( ar
)불가리아어 ( bg
)그리스어 ( el
)히브리어 ( he
)마케도니아어 ( mk
)러시아어( ru
)세르비아 키릴 자모( sr-cyrl
)우크라이나어 ( uk
)태국어 ( th
)터키어 ( tr
)베트남어 ( vi
)- 새로운 통화 코드 지원:
통화 Locale 코드 BAM
보스니아 컨버터블 마크 ( ba
)BGN
불가리아 레프 ( bg
)ILS
이스라엘 뉴 셰켈 ( il
)MKD
마케도니아어 데나르 ( mk
)RUB
러시아 루블 ( ru
)THB
태국 바트 ( th
)TRY
터키 리라 ( tr
)UAH
우크라이나어 흐리브냐 ( ua
)VND
베트남 동 ( vn
)- 세금 항목은 독일(
de
), 스페인(es
), 포르투갈(pt
), 영국 캐나다en-CA
에 대한 확장을 지원합니다.
-
- 유럽 연합 ID 및 운전면허증에 대한 현장 지원이 확장되었습니다.
-
- Uniform Residential Loan 신청서(양식 1003)에서 정보를 추출합니다.
- Uniform Underwriting and Transmittal Summary 또는 양식 1008에서 정보를 추출합니다.
- 모기지 마감 공개에서 정보를 추출합니다.
-
- 은행 카드에서 정보를 추출합니다.
-
- 결혼 인증서에서 정보를 추출하기 위해 새로 미리 빌드되었습니다.
2023년 12월
이제 REST API 2023-10-31-preview를 대상으로 하는 문서 인텔리전스 클라이언트 라이브러리를 사용할 수 있습니다.
2023년 11월
이제 문서 인텔리전스 2023-10-31-preview는 REST API를 사용할 수 있습니다. 이 미리 보기 API는 다음과 같은 새로운 기능과 업데이트된 기능을 소개합니다.
공개 미리 보기 버전 2023-10-31-preview는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
- 미국 동부
- 미국 서부2
- 서유럽
-
- 필기용 언어 확장: 러시아어(
ru
), 아랍어(ar
), 태국어(th
). - 사이버 EO(행정 명령) 규정 준수.
- 필기용 언어 확장: 러시아어(
-
- Office 및 HTML 파일을 지원합니다.
- Markdown 출력 지원.
- 테이블 추출, 읽기 순서 및 섹션 제목 검색이 향상되었습니다.
- 문서 인텔리전스 2023-10-31-preview를 사용하면 일반 문서 모델(미리 빌드된 문서)이 더 이상 사용되지 않습니다. 앞으로 문서에서 키-값 쌍을 추출하려면 선택적 쿼리 문자열 매개 변수
features=keyValuePairs
가 사용하도록 설정된prebuilt-layout
모델을 사용합니다.
-
- 이제 모든 가격 관련 필드에 대한 통화를 추출합니다.
-
- Medicare 및 Medicaid 정보에 대한 새 필드 지원.
-
- 새로운 1099 세금 모델. 기본 1099 양식과 A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB 변형을 지원합니다..
-
KVK
필드를 지원합니다.BPAY
필드를 지원합니다.- 다양한 필드 구체화.
-
- 다 언어 문서에 대한 지원.
- 새 페이지 분할 옵션: 자동 분할, 항상 페이지별로 분할, 분할 없음.
참고 항목
2022년 8월 31일 API GA(일반 공급) 릴리스부터 관련 미리 보기 API가 더 이상 사용되지 않습니다. 2021-09-30-미리 보기, 2022-01-30-미리 보기 또는 2022-06-30-미리 보기 API 버전을 사용하는 경우 2022-08-31 API 버전을 대상으로 하도록 애플리케이션을 업데이트하세요. 몇 가지 사소한 변경 내용이 포함됩니다. 자세한 내용은 마이그레이션 가이드를 참조하세요.
2023년 7월
참고 항목
Form Recognizer는 이제 Azure AI 문서 인텔리전스입니다!
- Document, Azure AI 서비스는 이전에 Cognitive Services 및 Azure Applied AI Services로 알려진 모든 서비스를 포함합니다.
- 가격 책정에는 변화가 없습니다.
- Cognitive Services 및 Azure Applied AI라는 이름은 Azure 청구, 비용 분석, 가격 목록 및 가격 API에서 계속 사용됩니다.
- API(애플리케이션 프로그래밍 인터페이스) 또는 클라이언트 라이브러리에 대한 호환성이 손상되는 변경은 없습니다.
- 일부 플랫폼은 여전히 이름 변경 업데이트를 기다리고 있습니다. 설명서에서 Form Recognizer 또는 문서 인텔리전스에 대한 모든 언급은 동일한 Azure 서비스를 나타냅니다.
문서 인텔리전스 v3.1(GA)
문서 인텔리전스 버전 3.1 API가 이제 일반 공급(GA)되었습니다! API 버전은 2023-07-31
에 해당합니다.
v3.1 API에는 새로운 기능과 업데이트된 기능이 도입되었습니다.
- 문서 인텔리전스 API는 이제 더욱 모듈화되었으며 선택적 기능을 지원합니다. 이제 필요한 기능을 구체적으로 포함하도록 출력을 사용자 지정할 수 있습니다. 선택 매개변수에 대해 자세히 알아보세요.
- 단일 파일을 개별 문서로 분할하기 위한 문서 분류 API입니다. 문서 분류에 대해 자세히 알아보세요.
- 사전 빌드된 계약 모델.
- 사전 빌드된 미국 세금 양식 1098 모델.
- Read API를 통한 Office 파일 형식 지원.
- 문서의 바코드 인식.
- 수식 인식 추가 기능.
- 글꼴 인식 추가 기능.
- 고해상도 문서 지원.
- 이제 사용자 지정 인공신경망 모델을 학습하려면 레이블이 지정된 단일 샘플이 필요합니다.
- 사용자 지정 인공신경망 모델 언어 확장. 30개 언어로 된 문서에 대한 인공신경망 모델을 학습합니다. 지원되는 언어의 전체 목록은 언어 지원을 참조하세요.
- 🆕 사전 빌드된 건강 보험 카드 모델.
- 사전 빌드된 청구서 모델 언어 확장.
- 100개 이상의 언어가 지원되는 사전 빌드된 영수증 모델 언어 및 로캘 확장
- 사전 빌드된 ID 모델은 이제 유럽 ID를 지원합니다.
문서 인텔리전스 스튜디오 UX 업데이트
✔️ 옵션 분석
문서 인텔리전스는 이제 보다 정교한 분석 기능을 지원하며 스튜디오에서는 추가 기능을 쉽게 구성할 수 있는 하나의 진입점(분석 옵션 버튼)을 허용합니다.
문서 추출 시나리오에 따라 분석 범위, 문서 페이지 범위, 선택적 탐지, 프리미엄 탐지 기능을 구성합니다.
참고 항목
문서 인텔리전스 스튜디오에서는 글꼴 추출이 시각화되지 않습니다. 하지만 JSON 출력의 스타일 섹션에서 글꼴 탐지 결과를 확인할 수 있습니다.
✔️ 사전 제작된 모델 또는 자체 모델 중 하나를 사용하여 문서에 자동 레이블 지정
사용자 지정 추출 모델 레이블 지정 페이지에서 이제 문서 인텔리전스 Service 사전 빌드된 모델 또는 이전에 학습한 모델 중 하나를 사용하여 문서에 자동 레이블을 지정할 수 있습니다.
일부 문서의 경우 자동 레이블을 실행한 후 레이블이 중복될 수 있습니다. 이후 레이블 지정 페이지에 중복 레이블이 없도록 레이블을 수정하시기 바랍니다.
✔️ 자동 레이블 지정 표
사용자 지정 추출 모델 레이블 지정 페이지에서 이제 테이블에 수동으로 레이블을 지정할 필요 없이 문서의 테이블에 자동으로 레이블을 지정할 수 있습니다.
✔️ 학습 데이터 세트에 직접 테스트 파일 추가
사용자 지정 추출 모델을 학습시킨 후에는 테스트 페이지를 사용하여 필요한 경우 테스트 문서를 학습 데이터 세트에 업로드하여 모델 품질을 향상시킵니다.
일부 레이블에 대해 낮은 신뢰도 점수가 반환되면 레이블이 올바른지 확인합니다. 그렇지 않은 경우 학습 데이터 세트에 추가하고 레이블을 다시 지정하여 모델 품질을 향상시키세요.
✔️ 맞춤 프로젝트에서 문서 목록 옵션 및 필터를 활용하세요.
사용자 지정 추출 모델 레이블 지정 페이지를 사용합니다. 이제 검색, 필터링, 정렬 기능을 사용하여 학습 문서를 쉽게 탐색할 수 있습니다.
그리드 보기를 활용하여 문서를 미리 보거나 목록 보기를 사용하여 문서를 더 쉽게 스크롤할 수 있습니다.
✔️ 프로젝트 공유
- 사용자 지정 추출 프로젝트를 쉽게 공유하세요. 자세한 내용은 맞춤 모델과 프로젝트 공유를 참조하세요.
2023년 5월
빌드 2023에 대한 새로워진 문서 소개
🆕 문서 인텔리전스 개요에는 향상된 탐색 기능, 구조화된 액세스 포인트 및 보강된 이미지가 포함되어 있습니다.
🆕 문서 인텔리전스 모델 선택은 프로젝트 및 워크플로에 가장 적합한 문서 인텔리전스 솔루션을 선택하기 위한 지침을 제공합니다.
2023년 4월
최신 문서 인텔리전스 클라이언트 라이브러리 공개 미리 보기 릴리스 발표
문서 인텔리전스 REST API 버전 2023-02-28-preview는 공개 미리 보기 릴리스 클라이언트 라이브러리를 지원합니다. 이 릴리스에는.NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) 및 Python (3.3.0b.1)에 사용할 수 있는 다음과 같은 새로운 기능이 포함되어 있습니다.
자세한 내용은 문서 인텔리전스 SDK(공개 미리 보기) 및 2023년 3월 출시 노트를 참조하세요.
2023년 3월
Important
2023-02-28-preview
기능은 현재는 다음 지역에서만 제공됩니다.
- 서유럽
- 미국 서부2
- 미국 동부
- 사용자 지정 분류 모델은
2023-02-28-preview
API로 시작하는 문서 인텔리전스의 새로운 기능입니다. - 일반 문서 모델에 추가된 쿼리 필드 기능은 Azure OpenAI 모델을 사용하여 문서에서 특정 필드를 추출합니다. 문서 인텔리전스 스튜디오를 사용하여 쿼리 필드가 있는 일반 문서 기능을 사용해 보세요. 쿼리 필드는 현재
East US
지역의 리소스에 대해서만 활성화되어 있습니다. - 추가 기능:
- 사용자 지정 추출 모델 업데이트:
- 사용자 지정 신경망 모델은 이제 학습 및 분석을 위해 추가된 언어를 지원합니다. 네덜란드어, 프랑스어, 독일어, 이탈리아어 및 스페인어용 신경망 모델을 학습합니다.
- 이제 사용자 지정 템플릿 모델에 향상된 서명 검색 기능이 있습니다.
- 문서 인텔리전스 스튜디오 업데이트:
- 분류 및 쿼리 필드와 같은 모든 새로운 기능을 지원하는 것 외에도 Studio는 이제 사용자 지정 모델 프로젝트에 대한 프로젝트 공유를 사용하도록 설정합니다.
- 제한적 미리 보기에 새로운 모델 추가: 예방 접종 카드, 계약서, 미국 세금 1098, 미국 세금 1098-E 및 미국 세금 1098-T. 제한적 미리 보기 모델에 대한 액세스를 요청하려면 문서 인텔리전스 비공개 미리 보기 요청 양식을 작성하여 제출하세요.
- 영수증 모델 업데이트:
- 영수증 모델은 열 영수증에 대한 지원을 추가합니다.
- 이제 영수증 모델에 18개 언어와 3개 지역 언어(영어, 프랑스어, 포르투갈어)에 대한 언어 지원을 추가합니다.
- 영수증 모델은 이제
TaxDetails
추출을 지원합니다.
- 이제 레이아웃 모델에서 테이블 인식이 향상되었습니다.
- 이제 읽기 모델에서 한 자리 문자 인식에 대한 개선이 추가되었습니다.
2023년 2월
이제 v3.0용 Select 문서 인텔리전스 컨테이너를 사용할 수 있습니다!
현재 읽기 v3.0 및 레이아웃 v3.0 컨테이너를 사용할 수 있습니다.
자세한 내용은 문서 인텔리전스 컨테이너 설치 및 실행을 참조하세요.
2023년 1월
미리 빌드된 영수증 모델 - 지원되는 언어가 추가되었습니다. 영수증 모델은 이제 이러한 추가된 언어 및 로캘을 지원합니다
- 일본어 - 일본(ja-JP)
- 프랑스어 - 캐나다(fr-CA)
- 네덜란드어 - 네덜란드(nl-NL)
- 영어 - 아랍에미리트(en-AE)
- 포르투갈어 - 브라질(pr-BR)
미리 빌드된 청구서 모델 - 지원되는 언어가 추가되었습니다. 청구서 모델은 이제 이러한 추가된 언어 및 로캘을 지원합니다
- 영어 - 미국(en-US), 오스트레일리아(en-AU), 캐나다(en-CA), 영국(en-UK), 인도(en-IN)
- 스페인어 - 스페인(es-ES)
- 프랑스어 - 프랑스(fr-FR)
- 이탈리아어 - 이탈리아(it-IT)
- 포르투갈어 -포르투갈(pt-PT)
- 네덜란드어 - 네덜란드(nl-NL)
미리 빌드된 청구서 모델 - 인식된 필드가 추가되었습니다. 이제 청구서 모델에서 이러한 추가 필드를 인식합니다
- 통화 코드
- 지불 옵션
- 총 할인
- 세금 항목(en-IN에만 해당)
미리 빌드된 ID 모델 - 지원되는 문서 형식이 추가되었습니다. 이제 ID 모델은 이러한 추가된 문서 형식을 지원합니다
- 미국 군사 ID
팁
모든 2023년 1월 업데이트는 REST API 버전 2022-08-31(GA)에서 사용할 수 있습니다.
미리 빌드된 영수증 모델 - 추가 언어 지원:
미리 빌드된 영수증 모델에 다음 언어에 대한 지원이 추가됩니다.
- 영어 - 아랍에미리트(en-AE)
- 네덜란드어 - 네덜란드(nl-NL)
- 프랑스어 - 캐나다(fr-CA)
- 독일어 - (de-DE)
- 이탈리아어 - (it-IT)
- 일본어 - 일본(ja-JP)
- 포르투갈어 - 브라질(pr-BR)
미리 빌드된 청구서 모델 - 추가 언어 지원 및 필드 추출
미리 빌드된 청구서 모델에 다음 언어에 대한 지원이 추가됩니다.
- 영어 - 오스트레일리아(en-AU), 캐나다(en-CA), 영국(en-UK), 인도(en-IN)
- 포르투갈어 - 브라질(pr-BR)
이제 미리 빌드된 청구서 모델에 다음 필드 추출에 대한 지원이 추가됩니다.
- 통화 코드
- 지불 옵션
- 총 할인
- 세금 항목(en-IN에만 해당)
미리 빌드된 ID 문서 모델 - 추가 문서 유형 지원
이제 미리 빌드된 ID 문서 모델에 다음 문서 유형에 대한 지원이 추가됩니다.
- 인도, 캐나다, 영국 및 호주를 지원하도록 운전 면허증 확장
- 미군 신분증 및 문서
- 인도 ID 카드 및 문서(PAN 및 아드하르)
- 오스트레일리아 ID 카드 및 문서(사진 카드, 키 패스 ID)
- 캐나다 ID 카드 및 문서(ID 카드, 메이플 카드)
- 영국 신분증 및 서류(국가/지역 신분증)
2022년 12월
-
12월 문서 인텔리전스 스튜디오 릴리스에는 문서 인텔리전스 스튜디오에 대한 최신 업데이트가 포함되어 있습니다. 주로 사용자 지정 모델 레이블 지정 지원을 통해 사용자 환경이 크게 개선되었습니다.
페이지 범위. 이제 Studio는 문서에서 지정된 페이지 분석을 지원합니다.
사용자 지정 모델 레이블 지정:
레이아웃 API를 자동으로 실행합니다. 사용자 지정 모델에 대한 설정 프로세스 중에 Blob Storage의 모든 문서에 대해 레이아웃 API를 자동으로 실행하도록 선택할 수 있습니다.
검색. 이제 Studio에는 문서 내에서 단어를 찾는 검색 기능이 포함되어 있습니다. 이렇게 개선하면 레이블을 지정하는 동안 탐색이 더 쉬워질 수 있습니다.
탐색. 레이블을 선택하여 문서 내에서 레이블이 지정된 단어를 대상으로 지정할 수 있습니다.
자동 테이블 레이블 지정. 문서 내에서 테이블 아이콘을 선택한 후 레이블 지정 보기에서 추출된 테이블의 레이블을 자동으로 지정하도록 선택할 수 있습니다.
레이블 하위 형식 및 두 번째 수준 하위 형식 이제 Studio는 날짜 및 숫자와 같은 형식에 대해 테이블 열, 테이블 행 및 두 번째 수준 하위 형식에 대한 하위 형식을 지원합니다.
이제 US Gov 버지니아 지역에서 사용자 지정 신경망 모델 빌드가 지원됩니다.
미리 보기 API 버전
2022-01-30-preview
및2021-09-30-preview
는 2023년 1월 31일에 사용 중지됩니다. 서비스 중단을 방지하기 위해2022-08-31
API 버전으로 업데이트하세요.
2022년 11월
- Azure AI 문서 인텔리전스 라이브러리의 최신 안정 릴리스 발표
- 이 릴리스에는 .NET, Java, JavaScript 및 Python 클라이언트 라이브러리에 대한 중요한 변경 내용과 업데이트가 포함되어 있습니다. 자세한 내용은 Azure SDK DevBlog를 참조하세요.
- 가장 중요한 향상된 기능은 및 의 두 개의 새 클라이언트
DocumentAnalysisClient
및DocumentModelAdministrationClient
를 도입하는 것입니다.
2022년 10월
문서 인텔리전스 버전이 지정된 콘텐츠
버전별 환경을 제공하기 위해 문서 인텔리전스 문서가 업데이트됩니다. 이제
v3.0 GA
환경 또는v2.1 GA
환경을 대상으로 지정하는 콘텐츠를 보도록 선택할 수 있습니다. v3.0 환경이 기본값입니다.
문서 인텔리전스 스튜디오 샘플 코드
- 이제 문서 인텔리전스 스튜디오 레이블 지정 환경의 샘플 코드를 GitHub에서 사용할 수 있습니다. 고객은 문서 인텔리전스를 개발하여 자신의 UX에 통합하거나 문서 인텔리전스 스튜디오 샘플 코드를 사용하여 자신만의 새로운 UX를 빌드할 수 있습니다.
언어 확장
- 최신 미리 보기 릴리스를 통해 문서 인텔리전스의 OCR(읽기), 레이아웃 및 사용자 지정 템플릿 모델은 134개의 새로운 언어를 지원합니다. 추가된 언어에는 그리스어, 라트비아어, 세르비아어, 태국어, 우크라이나어, 베트남어와 여러 라틴어, 키릴 자모 언어가 포함됩니다. 문서 인텔리전스는 이제 최신 GA 및 새 미리 보기 버전에서 총 299개 언어를 지원합니다. 지원되는 모든 언어를 보려면 지원되는 언어 페이지를 참조하세요.
- API 또는 해당 SDK를 사용하여 애플리케이션의 새 언어를 지원하는 경우 REST API 매개 변수
api-version=2022-06-30-preview
를 사용합니다.
새로운 미리 빌드된 계약 모델
- 당사자, 타이틀, 계약 ID, 실행 날짜 등의 정보를 계약에서 추출하는 새로운 미리 빌드된 모델입니다. 계약 모델은 현재 미리 보기로 제공되며 여기에서 액세스를 요청합니다.
사용자 지정 인공신경망 모델 학습 대상 지역 확장
- 이제 추가 지역에서 사용자 지정 신경망 모델 학습이 지원됩니다.
- 미국 동부
- 미국 동부2
- US Gov 애리조나
- 이제 추가 지역에서 사용자 지정 신경망 모델 학습이 지원됩니다.
2022년 9월
참고 항목
버전 4.0.0부터 문서 인텔리전스 서비스의 최신 기능을 활용하기 위해 새로운 클라이언트 세트가 도입되었습니다.
SDK 버전 4.0.0 GA 릴리스에는 다음 업데이트가 포함되어 있습니다.
- 버전 4.0.0 GA(2022-09-08)
- REST API v3.0 및 v2.0 클라이언트 지원
사용자 지정 신경망 모델 학습을 위한 지역 확장은 이제 6개의 새로운 지역에서 지원됩니다
- 오스트레일리아 동부
- 미국 중부
- 동아시아
- 프랑스 중부
- 영국 남부
- 미국 서부2
학습이 지원되는 지역의 전체 목록은 사용자 지정 인공신경망 모델을 참조하세요.
문서 인텔리전스 SDK 버전
4.0.0 GA
릴리스- 문서 인텔리전스 클라이언트 라이브러리 버전 4.0.0(.NET/C#, Java, JavaScript) 및 버전 3.2.0(Python)이 일반 공급되어 프로덕션 애플리케이션에서 사용할 수 있습니다!.
- 문서 인텔리전스 클라이언트 라이브러리에 대한 자세한 내용은 SDK 개요를 참조하세요.
- 프로그래밍 언어의 마이그레이션 가이드를 사용하여 애플리케이션을 업데이트합니다.
2022년 8월
문서 인텔리전스 SDK 베타 2022년 8월 미리 보기 릴리스에는 다음 업데이트가 포함되어 있습니다.
버전 4.0.0-beta.5(2022-08-09)
문서 인텔리전스 v3.0 정식 출시
- 문서 인텔리전스 REST API v3.0이 이제 정식 출시되어 프로덕션 애플리케이션에서 사용할 수 있습니다! REST API 버전 2022-08-31로 애플리케이션을 업데이트합니다.
문서 인텔리전스 스튜디오 업데이트
- 다음 단계. 이제 스튜디오의 각 모델 페이지에는 다음 단계 섹션이 있습니다. 사용자는 샘플 코드, 문제 해결 지침 및 가격 정보를 빠르게 참조할 수 있습니다.
- 사용자 지정 모델. 이제 스튜디오에는 레이블 지정 효율성을 개선하기 위해 사용자 지정 모델 프로젝트에서 레이블을 다시 정렬하는 기능이 포함되어 있습니다.
- 모델 복사 사용자 지정 모델은 스튜디오 내에서 문서 인텔리전스 서비스 간에 복사할 수 있습니다. 이 작업을 통해 학습된 모델을 다른 환경 및 지역으로 승격할 수 있습니다.
- 문서 삭제. 이제 스튜디오가 사용자 지정 프로젝트 내에서 레이블이 지정된 데이터 세트에서의 문서 삭제를 지원합니다.
문서 인텔리전스 서비스 업데이트
- prebuilt-read. 읽기 OCR 모델은 이제 두 가지 새로운 기능인 단락 및 언어 탐지와 함께 문서 인텔리전스에서도 사용할 수 있습니다. 문서 인텔리전스 Read는 문서 인텔리전스의 광범위한 문서 인텔리전스 기능과 연계된 고급 문서 시나리오를 대상으로 합니다.
- prebuilt-layout. 레이아웃 모델은 단락을 추출하며, 추출된 텍스트는 단락, 제목, 섹션 머리글, 각주, 페이지 머리글, 페이지 바닥글 또는 페이지 번호입니다.
- prebuilt-invoice. 이제 TotalVAT 및 Line/VAT 필드가 각각 기존 TotalTax 및 Line/Tax 필드로 확인됩니다.
- prebuilt-idDocument. 미국 주 ID, 사회 보장 및 그린 카드에 대한 데이터 추출 지원. 여권 비자 정보 지원.
- prebuilt-receipt. 프랑스어(fr-FR), 스페인어(es-ES), 포르투갈어(pt-PT), 이탈리아어(it-IT) 및 독일어(de-DE)에 대한 로캘 지원이 확장되었습니다.
- prebuilt-businessCard. 주소, 도시, 주, 국가/지역 및 우편번호와 같은 주소 구성 요소에 대한 하위 필드를 추출하는 주소 구문 분석 지원.
AI 품질 향상
- prebuilt-read. 단일 문자, 필기한 날짜, 금액, 이름, 영수증 및 청구서에서 일반적으로 볼 수 있는 기타 키 데이터에 대한 지원이 개선되고 디지털 PDF 문서 처리가 개선되었습니다.
- prebuilt-layout. 잘린 표, 테두리 없는 테이블 및 긴 스패닝 셀의 향상된 인식에 대한 향상된 검색을 지원합니다.
- prebuilt-document. 값 및 확인란 검색이 향상되었습니다.
- custom-neural. 테이블 검색 및 추출에 대한 정확도가 향상되었습니다.
2022년 6월
- 문서 인텔리전스 SDK 베타 2022년 6월 미리 보기 릴리스에는 다음 업데이트가 포함되어 있습니다.
버전 4.0.0-beta.4(2022-06-08)
문서 인텔리전스 스튜디오 6월 릴리스는 문서 인텔리전스 스튜디오의 최신 업데이트입니다. 이 업데이트에서는 사용자 환경과 손쉬운 사용 부분이 크게 향상되었습니다.
- JavaScript 및 C#용 코드 샘플. 이제 스튜디오 코드 탭은 기존 Python 샘플 외에도 JavaScript 및 C# 코드 샘플을 추가합니다.
- 새 문서 업로드 UI. 이제 Studio에서 끌어서 놓기를 사용하여 새 업로드 사용자 인터페이스로 문서를 업로드할 수 있습니다.
- 사용자 지정 프로젝트를 위한 새로운 기능. 이제 사용자 지정 프로젝트는 프로젝트를 구성할 때 스토리지 계정 및 Blob 만들기를 지원합니다. 또한 사용자 지정 프로젝트는 이제 Studio 내에서 직접 학습 파일 업로드 및 기존 사용자 지정 모델 복사를 지원합니다.
문서 인텔리전스 v3.0 2022-06-30-preview 릴리스에서는 기능 API 전반에 걸쳐 광범위한 업데이트를 제공합니다.
- 레이아웃은 구조 추출을 확장합니다. 이제 레이아웃에는 섹션, 섹션 머리글 및 단락을 포함한 추가된 구조 요소가 포함됩니다. 이 업데이트를 사용하면 문서 세분화 시나리오가 더 세분화됩니다. 식별된 구조 요소의 전체 목록은 향상된 구조를 참조하세요.
- 사용자 지정 신경망 모델 테이블 형식 필드가 지원됩니다. 이제 사용자 지정 문서 모델이 테이블 형식 필드를 지원합니다. 기본적으로 테이블 형식 필드는 다중 페이지이기도 합니다. 사용자 지정 신경망 모델의 테이블 형식 필드에 대한 자세한 내용은 테이블 형식 필드를 참조하세요.
- 페이지 간 테이블에 대한 사용자 지정 템플릿 모델 테이블 형식 필드를 지원합니다. 이제 사용자 지정 양식 모델이 여러 페이지에서 테이블 형식 필드를 지원합니다. 사용자 지정 템플릿 모델의 테이블 형식 필드에 대한 자세한 내용은 테이블 형식 필드를 참조하세요.
- 이제 청구서 모델 출력에는 일반 문서 키-값 쌍이 포함됩니다. 청구서에 미리 빌드된 모델에 포함된 필드 이외의 필수 필드가 포함된 경우 일반 문서 모델은 출력을 키-값 쌍으로 보완합니다. 키 값 쌍을 참조하세요.
- 청구서 언어 확장. 청구서 모델에는 확장된 언어 지원이 포함됩니다. 지원되는 언어를 참조하세요.
- 미리 빌드된 명함에는 이제 일본어 지원이 포함됩니다. 지원되는 언어를 참조하세요.
- 미리 빌드된 ID 문서 모델. 이제 ID 문서 모델은 미국 운전 면허증에서 DateOfIssue, Height, Weight, EyeColor, HairColor 및 DocumentDiscriminator를 추출합니다. 필드 추출을 참조하세요.
- 이제 읽기 모델은 일반적인 Microsoft Office 문서 형식을 지원합니다. 이제 Word(docx), Excel(xlsx), PowerPoint(pptx)와 같은 문서 형식이 읽기 API에서 지원됩니다. 읽기 데이터 추출을 참조하세요.
2022년 2월
버전 4.0.0-beta.3(2022-02-10)
문서 인텔리전스 v3.0 미리 보기 릴리스에는 다음과 같은 몇 가지 새로운 기능 및 향상된 기능이 도입되었습니다.
- 사용자 지정 신경망 모델 또는 사용자 지정 문서 모델은 정형 양식, 반정형 및 비정형 문서에서 텍스트와 선택 표시를 추출하는 새로운 사용자 지정 모델입니다.
- W-2 미리 빌드된 모델은 세금 보고 및 소득 확인 시나리오를 위해 W-2 양식에서 필드를 추출하는 새로운 미리 빌드된 모델입니다.
- 읽기 API는 검색된 경우 출력된 텍스트 줄, 단어, 텍스트 위치, 검색된 언어 및 필기 텍스트를 추출합니다.
- 일반 문서 미리 학습된 모델이 이제 양식 및 문서의 API 텍스트, 테이블, 구조, 키-값 쌍 외에도 선택 표시를 지원하도록 업데이트되었습니다.
- 청구서 API 미리 빌드된 청구서 모델은 스페인어 청구서를 지원하도록 확장합니다.
- 문서 인텔리전스 스튜디오는 읽기, W2, 호텔 영수증 샘플에 대한 새로운 데모를 추가하고 새로운 사용자 지정 인공신경망 모델 학습을 지원합니다.
- 언어 확장 문서 인텔리전스 읽기, 레이아웃 및 사용자 지정 양식은 아랍어 및 데바나가리 스크립트를 사용하여 아랍어, 힌디어 및 기타 언어를 포함한 42개의 새로운 언어에 대한 지원을 추가하여 적용 범위를 164개 언어로 확장합니다. 필기 언어 지원은 일본어와 한국어로 확장됩니다.
새 v3.0 미리 보기 API를 시작합니다.
문서 인텔리전스 모델 데이터 추출
모델 텍스트 추출 키/값 쌍 선택 표시 테이블 시그니처 읽음 ✓ 일반 문서 ✓ ✓ ✓ ✓ 레이아웃 ✓ ✓ ✓ 송장 ✓ ✓ ✓ ✓ Receipt ✓ ✓ ✓ ID 문서 ✓ ✓ 명함 ✓ ✓ 사용자 지정 템플릿 ✓ ✓ ✓ ✓ ✓ 사용자 지정 인공신경망 ✓ ✓ ✓ ✓ 문서 인텔리전스 SDK 베타 미리 보기 릴리스에는 다음 업데이트가 포함되어 있습니다.
-
- 사용자 지정 템플릿(이전의 사용자 지정 양식)
- 사용자 지정 신경망
- 사용자 지정 모델 - 빌드 모드
W-2 미리 빌드된 모델(prebuilt-tax.us.w2)
미리 빌드된 모델 읽기(prebuilt-read)
청구서 미리 빌드된 모델(스페인어)(prebuilt-invoice)
-
다음 단계
문서 인텔리전스 스튜디오를 사용하여 사용자 고유의 양식 및 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱 만들기를 시작해 보세요.
문서 인텔리전스 샘플 레이블 지정 도구를 사용하여 사용자 고유의 양식 및 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱 만들기를 시작해 보세요.