다음을 통해 공유


Foundry Tools의 Azure Content Understanding이란?

비고

Content Understanding은 2025-11-01 API 버전 출시와 함께 이제 일반 사용 가능(GA) 서비스입니다. 자세한 내용은 새로운 기능 참조하세요.

Foundry Tools의 Azure Content Understanding은 Azure Portal에서 Microsoft Foundry 리소스의 일부로 사용할 수 있는 Foundry 도구입니다. 생성 AI를 사용하여 문서, 이미지, 비디오 및 오디오를 비롯한 다양한 유형의 콘텐츠를 사용자 정의 출력 형식으로 처리하고 수집합니다. Content Understanding은 많은 양의 비정형 데이터를 처리하고 이해하는 간소화된 프로세스를 제공하여, 자동화 및 분석 워크플로에 통합할 수 있는 출력을 생성함으로써 가치를 실현하는 시간을 단축합니다.

Content Understanding은 이제 2025-11-01 API 버전의 릴리스에 따라 일반 제공 서비스(GA)입니다. 이제 더 광범위한 지역에서 사용할 수 있습니다. GA 릴리스의 업데이트에 대한 자세한 내용은 Content Understanding 새로운 기능 페이지를 참조하세요.

Content Understanding 개요, 프로세스 및 워크플로의 스크린샷

Content Understanding을 사용하는 이유

Content Understanding은 신뢰도 점수로 구조화되지 않은 데이터를 직접 처리하고 수동 검토를 최소화하며 운영 비용을 줄여 가치 창출 시간을 단축합니다. 주요 이점은 다음과 같습니다.

  • 워크플로를 간소화하고 효율화합니다. Content Understanding은 다양한 콘텐츠 형식에서 통합 프로세스로 콘텐츠, 구조 및 인사이트의 추출 및 분류를 표준화합니다.

  • 필드 추출을 간소화합니다. 콘텐츠 이해의 필드 추출 기능을 사용하면 구조화되지 않은 콘텐츠에서 구조화된 출력을 더 쉽게 생성할 수 있습니다. 복잡한 프롬프트 엔지니어링 없이 필드 값을 추출, 분류 또는 생성할 스키마를 정의합니다.

  • 정확도 향상 콘텐츠 이해는 여러 AI 모델을 사용하여 정보를 동시에 분석하고 교차 유효성 검사하여 더욱 정확하고 신뢰할 수 있는 결과를 제공합니다.

  • 신뢰도 점수 및 기반. 콘텐츠 이해는 인적 검토 비용을 최소화하는 동시에 추출된 값의 정확도를 보장합니다.

  • 콘텐츠 형식을 분류합니다. Content Understanding을 사용하면 문서 형식을 분류하여 콘텐츠를 처리하는 기능을 간소화할 수 있습니다. 이 기능은 이제 분석 API의 통합된 접근 방식에서 사용할 수 있습니다.

  • 산업별 미리 빌드된 분석기입니다. Content Understanding에는 세금 준비, 조달 문서 처리, 계약 분석, 콜 센터 분석, 미디어 분석 등을 비롯한 업계별 시나리오를 위해 미리 빌드된 분석기가 포함되어 있습니다.

콘텐츠 이해 사용 사례

  • IDP(지능형 문서 처리). Content Understanding을 사용하면 구조화되지 않은 문서를 높은 정확도로 구조화된 데이터로 변환하여 지능형 문서 처리를 수행할 수 있습니다. 신뢰도 점수 및 접지 기능은 수동 검토를 최소화하고 운영 비용을 줄이면서 데이터 품질을 보장합니다. 예를 들어 복잡한 문서에서 필드를 추출하고 유효성을 검사하여 청구서 처리, 계약 분석 및 클레임 관리를 자동화합니다.

  • 에이전트 애플리케이션. Content Understanding은 복잡한 다중 모드 파일 입력을 예측 가능하고 표준화된 입력으로 바꿉니다. 추론 및 지식 워크플로에 대한 명확한 Markdown 표현을 제공하여 다운스트림 작업에 대한 명확성과 컨텍스트를 보장합니다. 구조화된 데이터가 필요한 경우, 스키마에 정렬된 키-값 필드와 신뢰도 점수 및 참조 기준을 제공하여 에이전트의 의사 결정 자동화를 정확성과 감사 가능성을 가지고 지원합니다.

  • 검색 및 RAG(검색 증강 생성) Content Understanding을 사용하면 형식의 콘텐츠를 검색 인덱스로 수집할 수 있으며, 그림 설명 및 분석을 광범위하게 지원하여 데이터에 더 쉽게 액세스할 수 있습니다. Content Understanding 서비스는 RAG 검색 시나리오에 가장 적합한 출력을 제공하도록 미세 조정된 미리 빌드된 여러 분석기를 제공합니다.

  • RPA(로봇 프로세스 자동화). Content Understanding은 다양한 콘텐츠 형식에서 추출된 구조화된 데이터를 제공하여 RPA 워크플로와 원활하게 통합됩니다. 이 기능을 사용하면 주문 처리, 고객 온보딩 및 규정 준수 워크플로와 같은 콘텐츠 이해가 필요한 비즈니스 프로세스를 엔드 투 엔드 자동화할 수 있습니다.

  • 분석 및 보고: 콘텐츠 이해의 추출된 필드 출력은 분석 및 보고를 향상시켜 기업이 귀중한 인사이트를 얻고, 심층 분석을 수행하고, 정확한 보고서를 기반으로 합리적 결정을 내릴 수 있도록 합니다.

  • 분류를 통해 워크플로 최적화: Content Understanding의 분류 기능을 사용하면 추출을 위해 관련 분석기로 라우팅하기 전에 먼저 문서를 분류할 수 있습니다.

산업별 애플리케이션

Content Understanding에 대한 몇 가지 일반적인 산업별 애플리케이션은 다음과 같습니다.

애플리케이션 설명
세무 자동화 세무 준비 회사는 콘텐츠 이해를 사용하여 다양한 문서의 정보에 대한 통합된 관점을 만들고 포괄적인 세무 보고서를 작성할 수 있습니다.
모기지 애플리케이션 처리 예비 주택 구매자가 모기지를 확보하기 위해 필요한 모든 문서를 제공 여부를 결정하기 위해 보조 지원 설명서 및 모기지 응용 프로그램을 분석합니다.
청구서 계약 확인 고객과의 청구서 및 계약 계약을 신중하게 검토합니다. 다단계 추론 프로세스를 적용하여 데이터를 분석합니다. 청구서와 계약 간의 일관성 유효성 검사와 같은 결론이 정확하고 철저한지 확인합니다.
검색 강화 생성(RAG) 수집 조직은 누락된 문서에서 포괄적인 정보를 추출하여 RAG 워크플로를 향상시킬 수 있습니다. 그림 설명은 차트, 다이어그램 및 시각화의 정보를 캡처하여 검색할 수 있도록 합니다. 레이아웃 분석은 테이블, 섹션 및 계층 구조를 포함한 문서 구조를 유지합니다. 주석 감지는 필기 노트, 밑줄 및 취소선을 캡처합니다.
통화 후 분석 비즈니스 및 콜 센터는 통화 기록에서 인사이트를 생성하여 KPI(핵심 성과 지표)를 추적하고, 제품 환경을 개선하고, 비즈니스 인사이트를 생성하고, 차별화된 고객 환경을 만들고, 쿼리에 더 빠르고 정확하게 응답할 수 있습니다.
미디어 자산 관리 소프트웨어 및 미디어 공급업체는 콘텐츠 이해를 사용하여 동영상에서 더욱 풍부하고 대상이 명확한 정보를 추출하여 미디어 자산 관리 솔루션을 구축할 수 있습니다.
향상된 고객 지원 지원 채널이 있는 기업은 RAG 검색에 Content Understanding을 활용하여 이전 고객 문제 및 피드백의 데이터를 기반으로 응답 품질을 향상시킬 수 있습니다.

Content Understanding의 주요 구성 요소

Content Understanding 프레임워크는 여러 단계를 통해 구조화되지 않은 콘텐츠를 처리하여 입력을 구조화되고 실행 가능한 출력으로 변환합니다. 다음 표에서는 다이어그램과 같이 왼쪽에서 오른쪽으로 각 구성 요소를 설명합니다.

분석기를 통해 구조화된 출력으로 흐르는 입력이 있는 Content Understanding 프레임워크를 보여 주는 다이어그램.

구성 요소 설명
입력 Content Understanding에서 처리하는 원본 콘텐츠입니다. 문서, 이미지, 비디오, 오디오를 비롯한 여러 형식을 지원합니다. 입력 파일 형식에 대해 자세히 알아봅니다.
분석기 콘텐츠 처리 방법을 정의하는 핵심 구성 요소입니다. 콘텐츠 추출 설정, 필드 추출 스키마 및 모델 배포를 구성합니다. 구성되면 분석기는 이러한 설정을 들어오는 모든 데이터에 일관되게 적용합니다. Content Understanding은 일반적인 시나리오에 대해 미리 빌드된 분석기를 제공하고 요구 사항에 맞게 조정된 사용자 지정 분석기를 지원합니다. 분석기, 미리 빌드된 분석기사용자 지정 분석기를 자세히 알아봅니다.
콘텐츠 추출 구조화되지 않은 입력을 정규화된 구조적 텍스트 및 메타데이터로 변환합니다. OCR(광학 문자 인식)을 사용하여 텍스트를 추출하고, 선택 표시 및 바코드를 식별하고, 수식을 검색하고, 단락, 섹션 및 표와 같은 레이아웃 요소를 인식합니다. 오디오 및 비디오의 경우 음성을 전사하고 주요 시각적 요소를 식별합니다. 콘텐츠 추출에 대해 자세히 알아봅니다.
세그먼트 대상 처리를 위해 문서 또는 비디오를 논리적 섹션으로 나눕니다. 분석기 스키마의 enableSegment 속성을 사용하여 구성됩니다. 문서를 문서 유형별로 분할하거나 비디오를 장면으로 나누는 등의 의미 있는 청크로 콘텐츠를 분할할 수 있습니다. 세분화 및 분류에 대해 자세히 알아봅니다.
필드 추출 정의된 스키마를 기반으로 구조화된 키-값 쌍을 생성합니다. 지원되는 필드 형식 에 대한 서비스 제한을 참조하세요. 필드는 세 가지

방법을 통해 생성할 수 있습니다. • 추출: 입력 콘텐츠에 표시되는 값을 직접 추출합니다(문서에만 지원됨).(예: 영수증의 날짜 또는 송장의

항목 세부 정보)• 분류: 호출 감정 또는 차트 종류와 같이 미리 정의된 범주 집합의 콘텐츠를 분류하고 분석을 위해 올바른 분석기로 라우팅합니다.

생성: 오디오 대화 요약 또는 비디오에서 장면 설명 만들기와 같은 입력 데이터에서 자유롭게 값을 생성합니다.

필드 추출에 대해 자세히 알아봅니다.
신뢰도 점수 추출된 각 필드 값에 대해 0에서 1까지의 안정성 추정치를 제공합니다. 높은 점수는 정확한 데이터 추출을 나타내며, 자동화 워크플로에서 직접적인 처리가 가능합니다. 문서 분석기에서 estimateFieldSourceAndConfidence 설정을 사용하여 활성화합니다. 신뢰도 점수에 대해 자세히 알아봅니다.
기반을 두는 과정 각 값이 추출되거나 생성된 콘텐츠의 특정 지역을 식별합니다. 원본 접지 기능을 사용하면 자동화 시나리오의 사용자가 원본 콘텐츠의 원본으로 다시 추적하여 필드 값의 정확성을 빠르게 확인할 수 있습니다. 문서 분석기에서 estimateFieldSourceAndConfidence 설정을 사용하여 활성화합니다. 접지에 대해 자세히 알아보세요.
컨텍스트화 생성 모델에 대한 컨텍스트를 준비하고 출력을 사후 처리하는 Content Understanding의 처리 계층입니다. 모델 사용을 최적화하기 위한 출력 정규화 및 서식 지정, 원본 접지 계산, 신뢰도 점수 계산 및 컨텍스트 엔지니어링이 포함됩니다. 컨텍스트화에 대해 자세히 알아봅니다.
Foundry 모델 FOUNDry LLM(대규모 언어 모델) 및 포함 모델은 생성 기능에 전력을 공급합니다. 학습 예제를 위해 지원되는 생성 모델과 텍스트 임베딩 모델을 직접 배포합니다. Content Understanding은 이러한 모델을 필드 추출, 그림 분석 및 기타 AI 기반 기능에 사용합니다. 모델 및 배포에 대해 자세히 알아봅니다.
구조적 출력 최종 결과는 선택한 형식으로 제공됩니다. 콘텐츠는 검색 및 검색 시나리오에 대한 Markdown으로 출력되거나 자동화 및 분석 워크플로에 대해 정의된 스키마와 일치하는 구조화된 JSON으로 출력될 수 있습니다.

콘텐츠 이해 환경

Content Understanding은 Foundry 서비스입니다. Content Understanding을 사용하려면 Foundry Azure 리소스를 만들어야 합니다. Content Understanding Studio는 고급 기능이 필요한 고객을 위해 Foundry 환경을 보완합니다. 각 서비스에 대한 자세한 분석은 기능 비교: Foundry의 Content Understanding 및 Content Understanding Studio를 확인하세요.

  • Foundry의 Content Understanding(신규) 포털(출시 예정): Foundry NextGen 포털은 Content Understanding 도구를 사용하여 고급 포괄적인 에이전트 워크플로를 빌드할 수 있는 기능을 제공합니다.
  • Content Understanding Studio: 보완적인 UX 환경인 Content Understanding Studio를 사용하면 Document Intelligence에서 전환하는 고객을 원활하게 전환할 수 있습니다. 데이터 레이블 지정 기술을 사용하여 사용자 지정 분석기를 개선하는 등 분석기 성능 향상에 최적화된 환경을 제공합니다. 또한 분류 기반 사용자 지정 분석기 빌드를 지원합니다.

책임 있는 인공지능

Content Understanding은 그래픽 폭력 및 고어, 증오 발언 및 괴롭힘, 착취, 학대 등과 같은 유해한 콘텐츠를 처리하지 않도록 설계되었습니다. 이 서비스는 Azure AI Content Safety를 비롯한 표준 Foundry 인프라를 활용하여 콘텐츠 안전 결과를 Content Understanding 출력에 통합합니다. 자세한 내용과 금지된 콘텐츠의 전체 목록은 투명성 메모행동 강령을 참조하세요.

수정된 콘텐츠 필터링

Content Understanding은 승인된 고객을 위해 수정된 콘텐츠 필터링을 지원합니다. 승인된 수정된 콘텐츠 필터링이 있는 구독 ID(식별자)는 Content Understanding 출력에 영향을 줍니다. 기본적으로 Content Understanding은 제출된 프롬프트와 생성된 출력 모두에서 잠재적으로 유해한 콘텐츠에 대한 특정 위험 범주를 식별하는 콘텐츠 필터링 시스템을 사용합니다. 수정된 콘텐츠 필터링을 사용하면 시스템에서 잠재적으로 유해한 출력을 차단하는 대신 주석을 달 수 있으므로 잠재적으로 유해한 콘텐츠를 처리하는 방법을 결정할 수 있습니다. 콘텐츠 필터 형식에 대한 자세한 내용은 콘텐츠 필터 형식을 참조하세요.

얼굴 기능

Content Understanding은 비디오 및 이미지 콘텐츠에서 얼굴에 대한 자세한 텍스트 설명을 생성할 수 있는 얼굴 설명 기능을 제공합니다. 활성화된 경우 생성 모델은 얼굴 털, 얼굴 표정과 같은 얼굴 특성을 설명하고 저명한 사람 또는 유명인을 식별할 수 있습니다. 비디오 처리에서 얼굴 설명에 대해 자세히 알아봅니다.

데이터 개인 정보 보호 및 보안

콘텐츠 이해 서비스를 사용하는 개발자는 Microsoft의 고객 데이터 정책을 검토해야 합니다. 자세한 내용은 데이터, 보호 및 개인 정보 페이지를 참조하세요.

중요합니다

Microsoft 제품이나 서비스를 사용하여 생체 인식 데이터를 처리하는 경우, 사용자는 (i) 보존 기간 및 제거 등을 포함하여 데이터 주체에게 통지를 제공하고, (ii) 데이터 주체의 동의를 가져오고, (iii) 해당 데이터 보호 요구 사항에 따라 적절하고 필요한 경우 생체 인식 데이터를 삭제해야 합니다. "생체 인식 데이터"는 GDPR 제4조에 명시된 의미를 가지며, 해당되는 경우 다른 데이터 보호 요구 사항의 동등한 용어를 따릅니다. 관련 정보는 Face의 데이터 및 개인 정보를 참조하세요.

시작하기

빠른 시작 가이드를 통해 콘텐츠 이해 서비스를 빠르게 사용할 수 있습니다.