편집

다음을 통해 공유


자주 묻는 질문

이 콘텐츠의 적용 대상: 확인 표시 v4.0(미리 보기) 확인 표시 v3.1(GA) 확인 표시 v3.0(GA) 확인 표시 v2.1(GA)

Azure AI 문서 인텔리전스는 기계 학습 모델을 사용하여 문서에서 키-값 쌍, 텍스트 및 테이블을 추출하는 클라우드 기반 서비스입니다. 반환된 결과는 정형 JSON 출력입니다. 문서 인텔리전스 사용 사례에는 자동화된 데이터 처리, 향상된 데이터 기반 전략, 보강된 문서 검색 기능이 포함됩니다.

개요

Azure AI 문서 인텔리전스와 Azure AI Form Recognizer는 동일한 서비스인가요?

예.

Azure AI 문서 인텔리전스와 Azure AI Form Recognizer는 동일한 서비스입니다. 2023년 7월에 서비스 이름이 Azure AI Form Recognizer에서 Azure AI 문서 인텔리전스로 변경되었습니다. 이 서비스는 이름 변경 전과 동일한 기능을 제공합니다.

  • 가격 책정 변경: 가격 책정에는 변화가 없습니다. Cognitive Services 및 Applied AI Services라는 이름은 Azure 청구, 비용 분석, 가격표, 가격 API에서 계속 사용됩니다.

  • 호환성이 손상되는 변경: API 또는 클라이언트 라이브러리에는 호환성이 손상되는 변경이 없습니다. REST API 및 SDK 버전 2024-02-29-preview, 2023-10-31-preview 이상은 document intelligence로 이름이 바뀝니다.

문서 인텔리전스는 다른 Microsoft 서비스와 통합되나요?

예.

문서 인텔리전스는 다음 서비스와 통합됩니다.

AI 기능

문서 처리를 위해 생성형 AI와 함께 문서 인텔리전스를 사용할 수 있나요?

예.

문서 생성 AI 솔루션을 사용하여 문서와 채팅하고, 해당 문서에서 매력적인 콘텐츠를 생성하고, 데이터에서 Azure OpenAI Service 모델에 액세스할 수 있습니다.

  • Azure AI 문서 인텔리전스와 Azure OpenAI를 결합하면 자연어를 사용하여 문서와 원활하게 상호 작용하는 엔터프라이즈 애플리케이션을 빌드할 수 있습니다. 쉽게 답변을 찾고, 귀중한 인사이트를 얻고, 기존 문서에서 새롭고 매력적인 콘텐츠를 생성할 수 있습니다.

  • 자세한 내용은 기술 커뮤니티 블로그에서 확인할 수 있습니다.

문서 인텔리전스가 검색 증강 생성을 위해 문서 내의 의미 체계 청크에 도움이 될 수 있나요?

예.

문서 인텔리전스는 의미 체계 청크를 사용하도록 설정하는 구성 요소를 제공할 수 있습니다. 의미 체계 청크는 효율적인 스토리지 및 검색을 보장하기 위한 RAG(검색 증강 생성)의 핵심 단계입니다.

  • 문서 인텔리전스는 의미 체계 콘텐츠를 기반으로 문서를 일관된 단위로 분할하는 레이아웃 모델을 제공합니다.

  • 그런 다음 가져오는 정보를 Markdown 형식으로 내보낼 수 있으므로 사용 가능한 구성 요소를 기반으로 의미 체계 구분 전략을 사용자 지정할 수 있습니다.

자세한 내용은 문서 인텔리전스의 RAG 개요를 참조하세요.

문서 인텔리전스 스튜디오

문서 인텔리전스 스튜디오에 액세스하려면 특정 권한이 필요하나요?

예.

문서 인텔리전스 스튜디오에 액세스하려면 활성 Azure 계정과 최소한 읽기 권한자 역할이 있는 구독이 필요합니다.

문서 분석 및 미리 빌드된 모델의 경우 사용자 시나리오의 역할 요구 사항은 다음과 같습니다.

  • 기본

  • 고급

    • 기여자: 리소스 그룹 또는 문서 인텔리전스 리소스를 만들려면 이 역할이 필요합니다.

사용자 지정 모델 프로젝트의 경우 사용자 시나리오의 역할 요구 사항은 다음과 같습니다.

  • 기본

    • Cognitive Services 사용자: 사용자 지정 모델을 학습시키거나 학습된 모델을 사용하여 분석하려면 문서 인텔리전스 또는 Cognitive Services 다중 서비스 리소스에 이 역할이 필요합니다.

    • Storage Blob 데이터 기여자: 프로젝트를 만들고 데이터에 레이블을 지정하려면 스토리지 계정에 이 역할이 필요합니다.

  • 고급

    • Storage 계정 기여자: CORS(원본 간 리소스 공유) 설정을 설정하려면 스토리지 계정에 이 역할이 필요합니다. 동일한 스토리지 계정을 다시 사용하는 경우 일회성 활동입니다.

    • 기여자: 리소스 그룹과 리소스를 만들려면 이 역할이 필요합니다. 로컬(키 기반) 인증을 사용할 수 없는 경우 기여자 또는 스토리지 계정 기여자 역할이 있어도 Document Intelligence 리소스 또는 스토리지 계정을 사용할 수 있는 액세스 권한이 부여되지 않습니다. Document Intelligence Studio에서 함수를 사용하려면 여전히 기본 역할(Cognitive Services 사용자스토리지 데이터 Blob 기여자)이 필요합니다.

자세한 내용은 Microsoft Entra 기본 제공 역할문서 인텔리전스 스튜디오 빠른 시작의 Azure 역할 할당에 대한 섹션을 참조하세요.

문서 인텔리전스 스튜디오에서 두 페이지가 넘는 문서를 처리할 수 있나요?

, 유료 계층 리소스의 경우.

아니요, 무료 계층 리소스의 경우.

  • 무료(F0) 계층 리소스의 경우 문서 인텔리전스 스튜디오, REST API 또는 클라이언트 라이브러리를 사용하는지에 관계없이 처음 두 페이지만 분석됩니다.

  • 문서의 모든 페이지를 분석하려면 유료(S0) 리소스로 변경합니다. 문서 인텔리전스 스튜디오에서 설정(기어) 단추를 선택하고 리소스 탭을 선택한 다음 문서 분석에 사용할 기준 가격을 확인합니다.

문서 인텔리전스 스튜디오에서 디렉터리나 구독을 변경할 수 있나요?

예.

  • 문서 인텔리전스 스튜디오에서 디렉터리를 변경하려면 설정(기어) 단추를 선택합니다. 디렉터리 아래의 목록에서 디렉터리를 선택한 다음 디렉터리 전환을 선택합니다. 디렉터리를 전환한 후 다시 로그인합니다.

  • 구독 또는 리소스를 변경하려면 설정 아래의 리소스 탭으로 이동합니다.

방화벽이나 가상 네트워크로 구성된 리소스와 함께 문서 인텔리전스 스튜디오를 사용할 수 있나요?

예.

문서 인텔리전스 리소스가 방화벽 또는 가상 네트워크로 구성된 경우 문서 인텔리전스 리소스에 대한 방화벽 허용 목록에 전용 IP 주소 20.3.165.95를 추가해야 합니다.

문서 인텔리전스 스튜디오의 레이블 지정 환경을 재사용하거나 사용자 지정하여 내 애플리케이션에 빌드할 수 있나요?

예.

문서 인텔리전스 스튜디오의 레이블 지정 환경은 도구 키트 리포지토리에 오픈 소스로 제공됩니다.

문서 인텔리전스 소버린 클라우드 지역에 대한 별도의 URL 엔드포인트가 있나요?

예.

문서 인텔리전스 스튜디오에는 소버린 클라우드 지역에 대한 별도의 URL 엔드포인트가 있습니다.

앱 개발

최신 개발 옵션을 사용하여 Azure AI 문서 인텔리전스를 사용하여 애플리케이션을 개발할 수 있나요?

예.

문서 인텔리전스는 다음 플랫폼 내에서 최신 개발 옵션을 제공합니다.

내 애플리케이션을 최신 버전의 문서 인텔리전스로 마이그레이션할 수 있나요?

예.

다음 표에서는 최신 버전의 문서 인텔리전스로 마이그레이션하기 위한 자세한 지침에 대한 링크를 제공합니다.

언어/API 마이그레이션 가이드
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

문서에서 분석할 페이지 범위를 지정할 수 있나요?

예.

pages 매개 변수(v2.1, v3.0 이상 버전의 REST API에서 지원됨)를 사용하고 여러 페이지 PDF 및 TIFF 문서의 페이지를 지정합니다. 허용되는 입력에는 다음 범위가 포함됩니다.

  • 단일 페이지. 예를 들어 1, 2를 지정하면 1페이지와 2페이지가 처리됩니다.
  • 유한한 범위. 예를 들어 2-5를 지정하면 2~5페이지가 처리됩니다.
  • 열린 범위. 예를 들어 5-를 지정하면 5페이지부터 모든 페이지가 처리됩니다. 예를 들어 -10을 지정하면 1~10페이지가 처리됩니다.

이러한 매개 변수를 함께 혼합할 수 있으며 범위가 겹칠 수 있습니다. 예를 들어 -5, 1, 3, 5-10을 지정하면 1~10페이지가 처리됩니다.

서비스는 문서의 한 페이지 이상을 처리할 수 있는 경우 요청을 수락합니다. 예를 들어 5페이지 문서에서 5-100을 사용하는 것은 5페이지가 처리됨을 의미하는 유효한 입력입니다.

페이지 범위를 제공하지 않으면 전체 문서가 처리됩니다.

내 프로젝트에 FOTT 샘플 레이블 지정 도구 대신 문서 인텔리전스 스튜디오를 사용하는 것이 좋나요?

예.

대부분의 경우 문서 인텔리전스 리소스 및 스토리지 서비스를 구성하는 시간을 줄일 수 있으므로 문서 인텔리전스 스튜디오를 권장합니다.

다음 시나리오의 경우에만 FOTT(양식 테스트 도구) 사용을 고려합니다.

제한을 완화하는 모범 사례가 있나요?

예.

문서 인텔리전스는 자동 크기 조정을 사용하여 필요한 계산 리소스를 주문형으로 제공하는 동시에 고객 비용을 낮게 유지합니다. 자동 스케일링 중에 제한을 완화하려면 다음 방법을 사용하는 것이 좋습니다.

  • 애플리케이션에서 다시 시도 논리를 구현합니다.

  • POST 요청 수에 제한이 있는 경우 요청 사이에 지연을 추가하는 것이 좋습니다.

  • 워크로드를 점진적으로 늘립니다. 급격한 변화를 피합니다.

  • TPS(초당 트랜잭션 수) 제한을 늘리기 위한 지원 요청을 만듭니다.

문서 인텔리전스 서비스 할당량 및 한도에 대해 자세히 알아봅니다.

사용자 지정 모델

사용자 지정 모델의 예상 정확도 점수를 개선할 수 있나요?

예.

문서의 시각적 구조의 차이는 모델의 정확도에 영향을 줄 수 있습니다. 다음 팁을 참조하세요.

  • 학습 데이터 세트에 문서의 모든 변형을 포함합니다. 변형에는 여러 형식이 포함됩니다(예: 디지털 PDF와 스캔된 PDF).

  • 시각적으로 고유한 문서 형식을 구분하고 다른 모델을 학습시킵니다.

  • 관련 없는 레이블이 없는지 확인합니다.

  • 서명 및 지역 레이블을 지정할 때는 주변 텍스트를 포함하지 마세요.

자세한 내용은 정확도 및 신뢰도 점수를 참조하세요.

사용자 지정 모델을 다시 학습시킬 수 있나요?

아니요.

  • 문서 인텔리전스에는 명시적인 재학습 작업이 없습니다. 각 학습 작업은 새 모델을 생성합니다.

  • 모델을 다시 학습시켜야 경우 학습 데이터 세트에 더 많은 샘플을 추가하고 새 모델을 학습시킬 수 있습니다.

  • 다음과 같이 원본 모델로 구성할 새 모델을 만들 수도 있습니다.

    1. 새 템플릿에 대한 데이터 세트를 만듭니다.

    2. 새 모델의 레이블을 지정하고 학습시킵니다.

    3. 새 모델이 특정 문서 형식에 대해 잘 작동하는지 확인합니다.

    4. 기존 모델을 사용하여 새 모델을 단일 엔드포인트로 작성합니다. 그런 다음 문서 인텔리전스는 분석할 각 문서에 가장 적합한 모델을 결정할 수 있습니다.

    자세한 내용은 구성된 모델을 참조하세요.

학습된 모델을 한 환경(예: 베타)에서 다른 환경(예: 프로덕션)으로 이동할 수 있나요?

예.

복사 API를 사용하여 한 문서 인텔리전스 계정에서 지원되는 지리적 지역에 있는 다른 계정으로 사용자 지정 모델을 복사할 수 있습니다. 자세한 지침은 재해 복구를 참조하세요.

복사 작업은 모델을 학습시킨 특정 클라우드 환경 내에서 모델을 복사하는 것으로 제한됩니다. 예를 들어 퍼블릭 클라우드에서 Azure Government 클라우드로 모델을 복사하는 것은 지원되지 않습니다.

스토리지 계정

스토리지 계정 인증을 위해 SAS(공유 액세스 서명) 토큰에 만료 시간이 있나요?

예.

SAS(공유 액세스 서명)를 만들 때 기본 기간은 48시간입니다. 48시간이 지나면 새 토큰을 만들어야 합니다.

문서 인텔리전스에서 스토리지 계정을 사용하는 시간에 대해 더 긴 시간을 설정하는 것이 좋습니다.

문서 인텔리전스가 가상 네트워크나 방화벽 뒤에 있는 경우 내 스토리지 계정의 데이터에 액세스할 수 있나요?

아니요, 직접적으로는 아닙니다.

가상 네트워크 또는 방화벽으로 보호되는 경우 문서 인텔리전스는 스토리지 계정에 액세스할 수 없습니다.

하지만 프라이빗 Azure 스토리지 계정 액세스 및 인증은 Azure 리소스에 대한 관리 ID를 지원합니다. 관리 ID를 사용하는 경우 문서 인텔리전스 서비스는 할당된 자격 증명을 사용하여 스토리지 계정에 액세스할 수 있습니다.

FOTT를 사용하여 프라이빗 스토리지 계정 데이터를 분석하려는 경우 가상 네트워크 또는 방화벽 뒤에 도구를 배포해야 합니다.

문서 인텔리전스 리소스에 대한 관리 ID를 만들기 및 사용하는 방법을 알아봅니다.

컨테이너

연결이 끊긴 컨테이너와 연결된 컨테이너 사이에 차이가 있나요?

예.

연결된 컨테이너와 연결이 끊긴 컨테이너의 모델 기능은 동일하지만 청구 및 연결 방법은 다릅니다.

  • 연결된 컨테이너는 Azure 계정의 문서 인텔리전스 리소스를 사용하여 Azure에 청구 정보를 보냅니다. 연결된 컨테이너를 사용하는 경우 Azure로 청구 정보를 보내려면 인터넷 연결이 필요합니다. 문서 인텔리전스 연결된 컨테이너는 Azure 계정의 문서 인텔리전스 리소스를 사용하여 Azure에 청구 정보를 보냅니다. 연결된 컨테이너는 고객 데이터(예: 분석 중인 이미지 또는 텍스트)를 Microsoft에 보내지 않습니다. 연결된 컨테이너가 청구를 위해 Microsoft에 보내는 정보의 예는 Azure AI 컨테이너 FAQ를 참조하세요.

  • 연결이 끊긴 컨테이너를 사용하면 인터넷에서 연결이 끊긴 API를 사용할 수 있습니다. 청구 정보는 인터넷을 통해 전송되지 않습니다. 대신 요금은 구매한 약정 계층을 기준으로 청구됩니다. 현재 문서 인텔리전스 사용자 지정 및 청구서 모델에 연결되지 않은 컨테이너 사용이 가능합니다.

문서 인텔리전스 샘플 레이블 지정 도구(FOTT) 컨테이너에 로컬 스토리지를 사용할 수 있나요?

예.

FOTT에는 로컬 스토리지를 사용하는 버전이 있습니다. 이 버전을 Windows 머신에 설치해야 합니다. 이 위치에서 설치할 수 있습니다.

레이블 지정 파일이 하위 디렉터리에 있는 경우 프로젝트 페이지에서 레이블 폴더 URI를 /shared 또는 /shared/sub-dir로 지정합니다. 다른 모든 문서 인텔리전스 샘플 레이블 지정 도구 동작은 호스트된 서비스와 동일합니다.

크기 조정을 위한 모범 사례가 있나요?

예.

비동기 호출의 경우 공유 스토리지를 사용하여 여러 컨테이너를 실행할 수 있습니다. POST 분석 호출을 처리하는 컨테이너는 출력을 스토리지에 저장합니다. 그러면 다른 컨테이너가 스토리지에서 결과를 가져오고 GET 호출을 처리할 수 있습니다. 요청 ID는 컨테이너에 연결되지 않습니다.

동기 호출의 경우 여러 컨테이너를 실행할 수 있지만 하나의 컨테이너만 요청을 처리합니다. 이는 차단 호출이므로 풀의 모든 컨테이너가 요청을 처리하고 응답을 보낼 수 있습니다. 여기서는 한 번에 하나의 컨테이너만 요청에 연결되며 폴링이 필요하지 않습니다.

공유 스토리지를 사용하여 컨테이너를 설정할 수 있나요?

예.

컨테이너는 시작하는 동안 처리 파일을 저장할 공유 스토리지를 지정하기 위해 Mounts: Shared 속성을 사용합니다. 이 속성의 사용을 보려면 컨테이너 설명서를 참조하세요.

보안 및 개인 정보

문서 인텔리전스는 내 데이터를 저장하나요?

예, 간략하게 설명할 예정입니다.

모든 기능에 대해 문서 인텔리전스는 요청과 동일한 지역에 있는 Azure Storage에 데이터와 결과를 일시적으로 저장합니다. 그러면 분석 요청을 제출한 시간으로부터 24시간 이내에 데이터가 삭제됩니다.

문서 인텔리전스의 데이터, 개인 정보 보호 및 보안에 대해 자세히 알아봅니다.

학습된 사용자 지정 모델의 경우 분석 및 레이블 지정 후의 중간 출력은 학습 데이터를 저장하는 동일한 Azure Storage 위치에 저장됩니다. 학습된 사용자 지정 모델은 동일한 지역의 Azure Storage에 저장되고 Azure 구독 및 API 자격 증명과 함께 논리적으로 격리됩니다.

추가 도움말 및 지원

Azure AI 문서 인텔리전스 질문에 대한 솔루션을 제공하는 데 사용할 수 있는 다른 리소스가 있나요?

예.

Microsoft Q & A는 기술 관련 질문 및 답변을 위한 기본 공간입니다. 문서 인텔리전스와 관련된 쿼리를 필터링할 수 있습니다.

문서에 레이블을 붙일 때 서비스가 특정 텍스트를 인식하지 못하거나 잘못 인식하는 경우 직접 피드백을 제공할 수 있나요?

예.

Microsoft는 문서 인텔리전스 모델을 지속적으로 업데이트하고 개선합니다. 문서 인텔리전스 팀에 이메일을 보내실 수 있습니다. 가능하다면 이슈가 강조 표시된 샘플 문서를 공유해 주세요.