다음을 통해 공유


Microsoft Syntex 광학 문자 인식 개요

참고

량제 청구 가 설정된 경우 2024년 6월까지 광학 문자 인식 및 선택한 기타 Syntex 서비스를 비용 없이 사용해 볼 수 있습니다. 자세한 내용 및 제한 사항은 Microsoft Syntex 사용해 보고 해당 서비스 탐색을 참조하세요.

Microsoft Syntex OCR(광학 문자 인식) 서비스를 사용하면 이미지 및 문서에서 인쇄되거나 필기된 텍스트를 추출할 수 있습니다. 이미지의 예로는 포스터, 드로잉 및 제품 레이블이 있습니다. 문서의 예로는 문서, 보고서, 양식 및 청구서가 있습니다.

텍스트는 일반적으로 단어, 텍스트 줄, 단락 또는 텍스트 블록으로 추출되므로 스캔한 텍스트의 디지털 버전에 액세스할 수 있습니다. 추출된 정보는 검색에서 인덱싱되며 DLP(데이터 손실 방지)와 같은 규정 준수 기능에 사용할 수 있습니다.

예를 들어 OCR 서비스를 사용하도록 설정한 다음, 문서 라이브러리에 이미지 파일을 추가합니다. Microsoft Syntex 이미지 파일을 자동으로 검색하고, 관련 텍스트를 추출하고, 이미지의 텍스트를 검색 및 인덱싱에 사용할 수 있게 합니다. 이 기능을 사용하면 찾고 있는 키워드와 구를 빠르고 정확하게 찾을 수 있습니다.

요구 사항 및 제한 사항

지원되는 파일 형식

끝점 지원되는 파일 형식
SharePoint 및 OneDrive .bmp .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff 및 .pdf(이미지만 해당)
Teams, Exchange 및 Windows 디바이스 .bmp, .png, .jpeg, .jpg, .tiff 및 .pdf(이미지에만 해당)

참고

이미지 파일에 OCR을 적용하면 텍스트가 추출된 텍스트 메타데이터 열에 저장됩니다. PDF 또는 TIFF 파일에 OCR을 적용하면 추출된 텍스트는 검색에서 인덱싱되지만 메타데이터 열에서는 사용할 수 없습니다.

지원되는 언어

OCR 서비스는 150개 이상의 언어를 지원합니다.

지원되는 위치 및 솔루션

OCR 서비스는 다음 표와 같이 여러 솔루션을 지원합니다. 규정 준수 솔루션에 대한 자세한 내용은 Microsoft Purview에서 지원되는 위치 및 솔루션을 참조하세요.

위치 지원되는 솔루션
Exchange 텍스트는 최종 사용자 검색 및 검색 기반 솔루션에 사용할 수 있습니다.
규정 준수 솔루션에 텍스트를 사용할 수 있습니다.
SharePoint 사이트 텍스트는 최종 사용자 검색 및 검색 기반 솔루션에 사용할 수 있습니다.
규정 준수 솔루션에 텍스트를 사용할 수 있습니다.
OneDrive 계정 텍스트는 최종 사용자 검색 및 검색 기반 솔루션에 사용할 수 있습니다.
규정 준수 솔루션에 텍스트를 사용할 수 있습니다.
Teams 채팅 및 채널 메시지 규정 준수 솔루션에 텍스트를 사용할 수 있습니다.
디바이스 규정 준수 솔루션에 텍스트를 사용할 수 있습니다.

파일 제한 사항

  • 이미지는 50MB 미만이어야 합니다.

  • 이미지는 50 x 50 픽셀 이상이어야 하며 16,000 x 16,000 픽셀보다 크지 않아야 합니다.

  • OCR을 사용하도록 설정한 후 업로드된 이미지는 검사되는 유일한 이미지입니다.

  • Office 문서에 포함된 이미지는 지원되지 않습니다.