Azure Document Intelligence Studio 사용

완료됨

SDK 및 REST API 외에도 Azure Document Intelligence 서비스는 Azure Document Intelligence 서비스의 기능을 시각적으로 탐색, 이해 및 통합하기 위한 온라인 도구인 Azure Document Intelligence Studio라는 사용자 인터페이스를 통해 액세스할 수 있습니다. Studio를 사용하여 양식 레이아웃을 분석하고, 미리 빌드된 모델에서 데이터를 추출하고, 사용자 지정 모델을 학습할 수 있습니다.

Azure Document Intelligence Studio 기능의 Gif입니다.

Azure Document Intelligence Studio는 현재 다음 프로젝트를 지원합니다.

  • 문서 분석 모델
    • 읽기: 문서 및 이미지에서 인쇄 및 필기 텍스트 줄, 단어, 위치 및 검색된 언어를 추출합니다.
    • 레이아웃: 문서(PDF 및 TIFF) 및 이미지(JPG, PNG 및 BMP)에서 텍스트, 표, 선택 표시 및 구조 정보를 추출합니다.
    • 일반 문서: 문서에서 키-값 쌍, 선택 표시 및 엔터티를 추출합니다.
  • 미리 빌드된 모델
  • 사용자 지정 모델

문서 분석 모델 프로젝트 빌드

문서 분석 모델을 사용하여 텍스트, 테이블, 구조체, 키-값 쌍 및 명명된 엔터티를 추출하려면 다음을 수행합니다.

  • Azure Document Intelligence 또는 Foundry Tools 리소스 만들기
  • 문서 분석 모델 범주에서 "읽기", "레이아웃" 또는 "일반 문서" 중 하나를 선택합니다.
  • 문서를 분석합니다. Azure Document Intelligence 또는 Foundry Tools 엔드포인트 및 키가 필요합니다.

미리 빌드된 모델 프로젝트 빌드

미리 빌드된 모델을 사용하여 공통 양식에서 데이터를 추출하려면 다음을 수행합니다.

  • Azure Document Intelligence 또는 Foundry Tools 리소스 만들기
  • W-2, 송장, 영수증, ID 문서, 건강 보험, 예방 접종 및 명함을 포함하여 "미리 빌드된 모델" 중 하나를 선택합니다.
  • 문서를 분석합니다. Azure Document Intelligence 또는 Foundry Tools 엔드포인트 및 키가 필요합니다.

사용자 지정 모델 프로젝트 빌드

사용자 지정 모델을 학습하고 테스트하는 전체 프로세스에 Azure Document Intelligence Studio의 사용자 지정 서비스를 사용할 수 있습니다.

Azure Document Intelligence Studio를 사용하여 사용자 지정 모델을 빌드하는 경우 학습에 필요한 ocr.json 파일, labels.json 파일 및 fields.json 파일이 자동으로 만들어지고 스토리지 계정에 저장됩니다.

사용자 지정 모델을 학습시키고 이를 사용하여 사용자 지정 모델을 사용하여 데이터를 추출하려면 다음을 수행합니다.

  • Azure Document Intelligence 또는 Foundry Tools 리소스 만들기
  • 학습을 위해 5-6개 이상의 샘플 양식을 수집하고 스토리지 계정 컨테이너에 업로드합니다.
  • CORS(도메인 간 리소스 공유)를 구성합니다. CORS를 사용하면 Azure Document Intelligence Studio에서 레이블이 지정된 파일을 스토리지 컨테이너에 저장할 수 있습니다.
  • Azure Document Intelligence Studio에서 사용자 지정 모델 프로젝트를 만듭니다. 스토리지 컨테이너와 Azure Document Intelligence 또는 Foundry Tools 리소스를 프로젝트에 연결하는 구성을 제공해야 합니다.
  • Azure Document Intelligence Studio를 사용하여 텍스트에 레이블을 적용합니다.
  • 모델을 학습시킵니다. 모델이 학습되면 태그에 대한 모델 ID 및 평균 정확도를 받게 됩니다.
  • 학습에 사용되지 않은 새 양식을 분석하여 모델을 테스트합니다.