다음을 통해 공유


Microsoft Syntex 구조화되지 않은 문서 처리 개요

참고

량제 청구 가 설정된 경우 2024년 6월까지 비정형 문서 처리 및 선택한 기타 Syntex 서비스를 비용 없이 사용해 볼 수 있습니다. 자세한 내용 및 제한 사항은 Microsoft Syntex 사용해 보고 해당 서비스 탐색을 참조하세요.

비정형 문서 처리 모델(교육 방법)을 사용하여 파일을 자동으로 분류하고 정보를 추출합니다. 편지나 계약서와 같은 구조화되지 않은 문서에 가장 적합합니다.

참고

Microsoft는 Syntex에서 모델을 학습하고 처리하는 데 사용하는 데이터의 개인 정보 및 소유권을 존중합니다. Microsoft에서 AI 모델, 대문자 모델 또는 기타 모델을 학습시키기 위해 organization 데이터를 사용하거나 전송하지 않습니다. 데이터는 organization 테넌트 내에서 안전하게 유지됩니다. 자세한 내용은 Microsoft 데이터 보호 및 개인 정보를 참조하세요.

구조화되지 않은 모델 소개

구조화되지 않은 문서 처리 모델(이전의 문서 이해 모델)은 AI(인공 지능)를 사용하여 문서를 처리합니다. 이러한 문서에는 구문 또는 패턴을 기반으로 식별할 수 있는 텍스트가 있어야 합니다. 식별 된 텍스트는 파일 형식(분류자)과 추출 하려는 대상(추출자)을 지정합니다.

참고

Syntex 및 시나리오 예제를 사용하는 방법에 대한 자세한 내용은 Microsoft Syntex 및 시나리오 채택 시작및 Microsoft Syntex 사용 사례를 참조하세요.

구조화되지 않은 문서 처리 모델은 콘텐츠 센터라는 SharePoint 사이트 유형에서 만들어지고 관리됩니다. SharePoint 문서 라이브러리에 적용 되는 경우 모델은 추출되는 정보를 저장하기 위한 열이 있는 콘텐츠 유형과 연결이 되어 있습니다. 사용자가 만든 콘텐츠 형식은 SharePoint 콘텐츠 형식 갤러리에 저장됩니다. 기존 콘텐츠 유형을 사용하여 해당 스키마를 사용하도록 선택할 수도 있습니다.

참고

읽기 전용 또는 봉인된 콘텐츠 형식은 업데이트할 수 없으므로 모델에서 사용할 수 없습니다.

비정형 문서 처리 모델에 분류자 및 추출기를 추가하여 다음 작업을 수행합니다.

  • 분류자는 문서 라이브러리에 업로드 되는 문서를 식별하고 분류하는 데 사용 됩니다. 예를 들어, 분류자는 라이브러리에 업로드 되는 모든 계약 갱신을 식별하도록 “성향 습득” 할 수 있습니다. 계약 갱신 콘텐츠 형식은 사용자가 분류자를 만들 때 정의합니다.

  • 추출자가 이 문서에서 정보를 가져옵니다. 예를 들어 문서 라이브러리에서 식별된 각 계약 갱신 문서에 대해 각 문서에 대한 서비스 시작 날짜클라이언트 를 표시하는 열이 표시됩니다.

예제 파일을 사용하여 모델에서 분류자와 추출자를 성향 습득하고 테스트 할 수 있습니다. 예제 파일에서는 파일에서 데이터를 식별하고 추출하려고 할 때 검색할 항목의 모델 예제를 제공합니다. 예를 들어, 사용자의 회사가 사용하는 계약 갱신 문서 예제를 사용하여 계약 갱신 분류자와 추출자를 성향 습득 할 수 있습니다. 예제 파일을 사용하여 모델의 효율성을 테스트 할 수 있습니다.

모델을 게시 한 후 콘텐츠 센터를 사용하여 액세스 권한이 있는 모든 SharePoint 문서 라이브러리에 적용 합니다.

요구 사항 및 제한 사항

이 모델을 선택할 때 고려해야 할 요구 사항에 대한 자세한 내용은 Microsoft Syntex 모델에 대한 요구 사항 및 제한을 참조하세요.