다음을 통해 공유


시작: 문서 인텔리전스 스튜디오

이 콘텐츠의 적용 대상:확인 표시 v4.0(미리 보기) | 이전 버전: 파란색 확인 표시 v3.1(GA) 파란색 확인 표시 v3.0(GA)

문서 인텔리전스 스튜디오는 문서 인텔리전스 서비스의 기능을 애플리케이션에서 시각적으로 탐색, 이해 및 통합하기 위한 온라인 도구입니다. 샘플 또는 자체 문서를 사용하여 미리 학습된 모델을 탐색하여 시작할 수 있습니다. Python SDK 및 기타 빠른 시작을 사용하여 사용자 지정 템플릿 모델을 빌드하고 애플리케이션에서 모델을 참조하는 프로젝트를 만들 수도 있습니다.

새 사용자를 위한 필수 구성 요소

Document Intelligence Studio를 사용하려면 다음 자산 및 설정이 필요합니다.

단일 엔드포인트/키에서 여러 Azure AI 서비스에 액세스하려는 경우 Azure AI 서비스 리소스를 만듭니다. 문서 인텔리전스 액세스에 대해서만 문서 인텔리전스 리소스를 만듭니다. Microsoft Entra 인증을 사용하려는 경우 단일 서비스 리소스가 필요합니다.

이제 Document Intelligence는 Document Intelligence 리소스 및 스토리지 계정에 액세스할 때 로컬(키 기반) 인증에 추가적인 AAD 토큰 인증을 지원합니다. 특히 리소스가 DisableLocalAuth 정책에 적용되는 경우 올바른 액세스 역할을 설정하려면 아래 지침을 따라야 합니다.

  • 문서 분석에 대해 올바르게 범위가 지정된 Azure 역할 할당 및 역할 할당 후 미리 빌드된 모델의 경우 다양한 시나리오에 필요합니다.

    • 기본 ✔️ Cognitive Services 사용자: 분석 페이지를 입력하려면 Document Intelligence 또는 Azure AI 서비스 리소스에 대한 이 역할이 필요합니다.

    • 고급 ✔️ 기여자: 리소스 그룹, 문서 인텔리전스 서비스 또는 Azure AI 서비스 리소스를 만들려면 이 역할이 필요합니다.

      권한 부여에 대한 자세한 내용은 문서 인텔리전스 스튜디오의 권한 부여 정책참조하세요.

      참고 항목

      Document Intelligence 서비스 리소스에 대해 로컬(키 기반) 인증을 사용하지 않도록 설정한 경우 Cognitive Services 사용자 역할을 가져와야 하며 AAD 토큰을 사용하여 Document Intelligence Studio에서 요청을 인증합니다. 기여자 역할은 키를 나열할 수 있지만 키 액세스가 비활성화된 경우 리소스를 사용할 수 있는 권한을 부여하지 않습니다.

  • 리소스가 구성되면 문서 인텔리전스 스튜디오에서 제공하는 다양한 모델을 사용해 볼 수 있습니다. 첫 페이지에서 코드 없는 방법으로 사용할 문서 인텔리전스 모델을 선택합니다.

  • 문서 분석 또는 미리 빌드된 모델을 테스트하려면 모델을 선택하고 샘플 문서를 하나 사용하거나 사용자 고유의 문서를 업로드하여 분석합니다. 분석 결과는 콘텐츠 결과 코드 창의 오른쪽에 표시됩니다.

  • 사용자 지정 모델은 문서에 대해 학습해야 합니다. 사용자 지정 모델에 대한 개요는 사용자 지정 모델 개요를 참조하세요.

인증

문서 인텔리전스 스튜디오로 이동합니다. 처음 로그인하는 경우 서비스 리소스를 구성하라는 팝업 창이 나타납니다. 조직의 정책에 따라 다음 중 하나 또는 두 가지 옵션이 있습니다.

  • Microsoft Entra 인증: 리소스별 액세스(권장).

    • 기존 구독을 선택합니다.

    • 구독 내에서 기존 리소스 그룹을 선택하거나 새로 만듭니다.

    • 기존 문서 인텔리전스 또는 Azure AI 서비스 리소스를 선택합니다.

      문서 인텔리전스 스튜디오의 서비스 리소스 구성 양식 스크린샷.

  • 로컬 인증: API 엔드포인트 및 키를 통한 액세스.

    • Azure Portal에서 엔드포인트 및 키를 검색합니다.

    • 리소스에 대한 개요 페이지로 이동하고 왼쪽 탐색 모음에서 키 및 엔드포인트를 선택합니다.

    • 해당 필드에 값을 입력합니다.

      Azure Portal의 키 및 엔드포인트 페이지 스크린샷.

  • 문서 인텔리전스 스튜디오에서 시나리오의 유효성을 검사한 후 C#, Java, JavaScript 또는 Python 클라이언트 라이브러리 또는 REST API를 사용하여 문서 인텔리전스 모델을 고유의 애플리케이션에 통합하기 시작합니다.

각 모델에 대해 자세히 알아보려면 개념 페이지를 참조하세요.

리소스 세부 정보 보기

이름 및 가격 책정 계층과 같은 리소스 세부 정보를 보려면 문서 인텔리전스 스튜디오 홈페이지의 오른쪽 상단에 있는 설정 아이콘을 선택하고 리소스 탭을 선택합니다. 다른 리소스에 액세스할 수 있는 경우 리소스를 전환할 수도 있습니다.

모델

미리 빌드된 모델을 사용하면 자체 모델을 빌드, 학습 및 게시할 필요 없이 앱에 문서 인텔리전스 기능을 추가할 수 있습니다. 미리 빌드된 몇 가지 모델 중에서 선택할 수 있으며, 각 모델에는 지원되는 자체 필드 세트가 있습니다. analyze 작업에 사용할 모델 선택은 분석할 문서 유형에 따라 달라집니다. 문서 인텔리전스는 현재 다음과 같은 미리 빌드된 모델을 지원합니다.

문서 분석

  • 레이아웃: 문서(PDF, TIFF) 및 이미지(JPG, PNG, BMP)에서 텍스트, 테이블, 선택 표시 및 구조 정보를 추출합니다.
  • 읽기: 문서(PDF, TIFF) 및 이미지(JPG, PNG, BMP)에서 검색된 경우 텍스트 줄, 단어, 위치, 검색된 언어 및 필기 스타일을 추출합니다.

사전 제작

  • 청구서: 청구서에서 텍스트, 선택 표시, 테이블, 키-값 쌍 및 키 정보를 추출합니다.
  • 영수증: 영수증에서 텍스트 및 키 정보를 추출합니다.
  • 의료 보험 카드: 미국 의료 보험 카드에서 보험사, 회원, 처방전, 그룹 번호, 기타 주요 정보를 추출합니다.
  • W-2: W-2 세금 양식에서 텍스트 및 키 정보를 추출합니다.
  • ID 문서: 운전 면허증과 국제 여권에서 텍스트 및 키 정보를 추출합니다.

사용자 지정

  • 사용자 지정 추출 모델: 사용자 지정 추출 모델을 사용하여 양식 및 문서에서 정보를 추출합니다. 샘플 문서에 5개까지 레이블을 지정하여 모델을 신속하게 학습시킵니다.
  • 사용자 지정 분류 모델: 사용자 지정 분류자를 학습시켜 애플리케이션 내의 다양한 문서 유형을 구분합니다. 2개 이내의 클래스, 클래스당 5개 샘플로 모델을 빠르게 학습시킵니다.

필수 조건을 완료한 후 Document Intelligence Studio로 이동합니다.

  1. 스튜디오 홈페이지에서 문서 인텔리전스 서비스 기능을 선택합니다. 이 단계는 이전 사용에서 이미 서비스 리소스를 선택하지 않은 경우 일회용 프로세스입니다. Azure 구독, 리소스 그룹 및 리소스를 선택합니다. (상단 메뉴의 "설정"에서 언제든지 리소스를 변경할 수 있습니다.) 선택 사항을 검토 및 확인합니다.

  2. [분석] 단추를 선택하여 샘플 문서에 대한 분석을 실행하거나 [추가] 명령을 사용하여 문서를 사용해 봅니다.

  3. 문서 보기를 확대/축소하고, 회전하고, 화면 아래쪽에 있는 컨트롤을 사용합니다.

  4. 문서 보기에서 강조 표시된 추출된 콘텐츠를 관찰합니다. 세부 정보를 보려면 마우스를 키와 값 위로 마우스로 가리킵니다.

  5. 출력 섹션의 결과 탭 서식을 지정하고 JSON 출력을 찾아 서비스 응답을 더 잘 이해합니다.

  6. 코드 탭을 선택하고 통합을 위한 샘플 코드를 찾습니다. 시작하려면 복사하고 다운로드합니다.

사용자 지정 프로젝트에 대한 추가 필수 구성 요소

Azure 계정과 문서 인텔리전스 또는 Azure AI 서비스 리소스 외에 다음이 필요합니다.

Azure Blob Storage 컨테이너

표준 성능 Azure Blob Storage 계정입니다. 스토리지 계정 내에서 학습 문서를 저장하고 구성하는 컨테이너를 만듭니다. 컨테이너를 사용하여 Azure 스토리지 계정을 만드는 방법을 모르는 경우 다음 빠른 시작을 따릅니다.

  • 스토리지 계정 만들기 스토리지 계정을 만드는 경우 인스턴스 세부 정보 → 성능 필드에서 표준 성능을 선택해야 합니다.
  • 컨테이너를 만듭니다. 컨테이너를 만드는 경우 새 컨테이너 창에서 퍼블릭 액세스 수준 필드를 컨테이너(컨테이너 및 Blob에 대한 익명 읽기 액세스)로 설정합니다.

Azure 역할 할당

사용자 지정 프로젝트의 경우 다양한 시나리오에 다음 역할 할당이 필요합니다.

  • Basic

    • Cognitive Services 사용자: 사용자 지정 모델을 학습시키거나 학습된 모델을 사용하여 분석하려면 문서 인텔리전스 또는 Azure AI 서비스 리소스에 이 역할이 필요합니다.
    • Storage Blob 데이터 기여자: 스토리지 계정이 프로젝트를 만들고 데이터에 레이블을 지정하려면 이 역할이 필요합니다.
  • 고급

    • 스토리지 계정 기여자: 스토리지 계정이 CORS 설정을 설정하려면 이 역할이 필요합니다(이 작업은 동일한 스토리지 계정을 다시 사용하는 경우 일회성 작업임).
    • 기여자: 리소스 그룹과 리소스를 만들려면 이 역할이 필요합니다.

    참고 항목

    문서 인텔리전스 서비스 리소스 및 스토리지 계정에 대해 로컬(키 기반) 인증을 사용할 수 없는 경우, 문서 인텔리전스 스튜디오를 사용할 수 있는 충분한 권한을 가지려면 각각 Cognitive Services 사용자Storage Blob 데이터 기여자의 역할을 획득해야 합니다. 스토리지 계정 기여자기여자의 역할은 단지 키를 나열할 수 있게는 해 주지만, 키 액세스를 사용할 수 없는 경우에 리소스를 사용할 수 있는 권한을 부여하지는 않습니다.

CORS 구성

문서 인텔리전스 스튜디오에서 액세스할 수 있으려면 Azure Storage 계정에 CORS(원본 간 리소스 공유)를 구성해야 합니다. Azure Portal에서 CORS를 구성하려면 스토리지 계정의 CORS 탭에 액세스해야 합니다.

  1. 스토리지 계정에 대한 CORS 탭을 선택합니다.

    Azure Portal에서 CORS 설정 메뉴의 스크린샷

  2. Blob 서비스에서 새 CORS 항목을 만들어 시작합니다.

  3. 허용된 원본https://documentintelligence.ai.azure.com로 설정합니다.

    스토리지 계정에 대한 CORS 구성을 보여주는 스크린샷.

    지정된 도메인 대신 와일드카드 문자 ‘*’를 사용하여 모든 원본 도메인이 CORS를 통해 요청을 수행하도록 허용할 수 있습니다.

  4. 허용된 메서드에 사용할 수 있는 8가지 옵션을 모두 선택합니다.

  5. 각 필드에 *를 입력하여 허용된 헤더노출된 헤더를 모두 승인합니다.

  6. Max Age를 120초 또는 허용되는 값으로 설정합니다.

  7. 변경 내용을 저장하려면 페이지 맨 위에 있는 저장 단추를 선택합니다.

이제 문서 인텔리전스 스튜디오의 스토리지 계정을 사용하도록 CORS를 구성해야 합니다.

샘플 문서 세트

  1. Azure Portal에 로그인하고 스토리지 계정>데이터 스토리지>컨테이너로 이동합니다.

    Azure Portal의 데이터 스토리지 메뉴 스크린샷.

  2. 목록에서 컨테이너를 선택합니다.

  3. 페이지 위쪽의 메뉴에서 업로드를 선택합니다.

    Azure Portal의 컨테이너 업로드 단추 스크린샷.

  4. Blob 업로드 창이 표시됩니다.

  5. 업로드할 파일을 선택합니다.

    Azure Portal의 Blob 업로드 창 스크린샷.

참고 항목

기본적으로 Studio는 컨테이너의 루트에 있는 문서를 사용합니다. 그러나 사용자 지정 양식 프로젝트 만들기 단계에서 폴더 경로를 지정하여 폴더에 구성된 데이터를 사용할 수 있습니다. 하위 폴더에 데이터 구성참조하세요.

사용자 지정 모델

사용자 지정 모델을 만들려면 프로젝트 구성부터 시작합니다.

  1. Studio 홈에서 사용자 지정 모델 카드를 선택하고 사용자 지정 모델 페이지를 엽니다.

  2. "프로젝트 만들기" 명령을 사용하고 새 프로젝트 구성 마법사를 시작합니다.

  3. 프로젝트 세부 정보를 입력하고, Azure 구독 및 리소스, 데이터가 포함된 Azure Blob 스토리지 컨테이너를 선택합니다.

  4. 설정을 검토하고, 제출하고, 프로젝트를 만듭니다.

  5. 자동 레이블 기능을 사용하여 이미 학습된 모델 또는 미리 빌드된 모델 중 하나를 사용하여 레이블을 지정합니다.

  6. 수동 레이블 지정을 사용하여 추출할 레이블 및 해당 형식을 정의합니다.

  7. 문서의 텍스트를 선택하고 드롭다운 목록 또는 레이블 창에서 레이블을 선택합니다.

  8. 레이블을 4개 이상의 문서에 지정하여 레이블을 5개 이상의 문서에 지정합니다.

  9. 학습 명령을 선택하고 모델 이름을 입력한 후 사용자 지정 모델 학습을 시작할 신경(권장) 모델 또는 템플릿 모델을 선택합니다.

  10. 모델이 준비되면 Test 명령을 사용하고 테스트 문서의 유효성을 검사하고 결과를 관찰합니다.

문서 인텔리전스 사용자 지정 모델 데모

테이블로 레이블 지정

참고 항목

  • API 버전 2022-06-30-preview 이상의 릴리스에서 사용자 지정 템플릿 모델은 페이지 간 테이블 형식 필드(테이블)에 대한 지원을 추가합니다.
  • API 버전 2022-06-30-preview 이상 릴리스와 함께 사용자 지정 신경망 모델은 테이블 형식 필드(테이블)를 지원하고 API 버전 2022-08-31 이상으로 학습된 모델은 테이블 형식 필드 레이블을 허용합니다.
  1. [삭제] 명령을 사용하여 필요하지 않은 모델을 삭제합니다.

  2. 오프라인 보기를 위한 모델 세부 정보를 다운로드합니다.

  3. 여러 모델을 선택하고, 애플리케이션에서 사용할 새 모델로 구성합니다.

테이블을 시각적 패턴으로 사용:

사용자 지정 양식 모델의 경우 사용자 지정 모델을 만드는 동안 문서에서 데이터 컬렉션을 추출해야 할 수 있습니다. 데이터 컬렉션은 몇 가지 형식으로 나타날 수 있습니다. 테이블을 시각적 패턴으로 사용:

  • 지정된 필드(열) 세트에 대한 동적 또는 변수 값(행)의 개수

  • 지정된 필드(열 및/또는 행) 세트에 대한 특정 값(행)의 컬렉션

동적 테이블로 레이블 지정

동적 테이블을 사용하여 지정된 필드(열) 세트에 대한 값(행)의 변수 수를 추출합니다.

  1. 새 "테이블" 형식 레이블을 추가하고, "동적 테이블" 형식을 선택한 다음, 레이블 이름을 지정합니다.

  2. 필요한 열(필드) 및 행(데이터용)의 수를 추가합니다.

  3. 페이지에서 텍스트를 선택한 다음 셀을 선택하고 텍스트에 할당합니다. 모든 문서의 모든 페이지에 있는 모든 행과 열에 대해 반복합니다.

동적 테이블로 문서 인텔리전스 레이블 지정 예

고정 테이블로 레이블 지정

고정 테이블을 사용하여 지정된 필드(열 및/또는 행) 세트에 대한 특정 값(행)의 컬렉션을 추출합니다.

  1. 새 "테이블" 형식 레이블을 만들고, "고정 테이블" 형식을 선택한 다음, 이름을 지정합니다.

  2. 두 필드 세트에 해당하는 필요한 열과 행의 수를 추가합니다.

  3. 페이지에서 텍스트를 선택한 다음 셀을 선택하고 텍스트에 할당합니다. 다른 문서에 대해 반복합니다.

고정 테이블로 문서 인텔리전스 레이블 지정 예

서명 검색

참고 항목

서명 필드는 현재 사용자 지정 템플릿 모델에 대해서만 지원됩니다. 사용자 지정 신경망 모델을 학습할 때 레이블이 지정된 서명 필드는 무시됩니다.

서명 검색 레이블 지정(사용자 지정 양식에만 해당)하려면 다음을 수행합니다.

  1. 새 "서명" 형식 레이블을 만들고 레이블 뷰를 사용하여 이름을 지정합니다.

  2. [영역] 명령을 사용하여 사각형 영역을 서명의 예상 위치에 만듭니다.

  3. 그린 영역을 선택하고 서명 유형 레이블을 선택하고 그린 영역에 할당합니다. 다른 문서에 대해 반복합니다.

서명 검색을 위한 문서 인텔리전스 레이블 지정 예

다음 단계

문서 인텔리전스 스튜디오를 시작합니다.