Azure AI Content Understanding은 광범위한 데이터 집합의 정확하고 정확한 분석을 용이하게 하기 위해 설계된 혁신적인 생성 AI 서비스입니다. 서비스는 문서, 이미지, 비디오 및 오디오를 비롯한 다양한 콘텐츠 형식을 처리하여 사용자가 지정한 출력 형식으로 변환합니다.
이 문서에서는 데이터 처리 및 분석 요구 사항에 Content Understanding을 효과적으로 활용하기 위한 지침과 모범 사례를 제공합니다.
필드 설명을 사용하여 출력을 안내하다.
스키마를 정의할 때는 자세한 필드 설명을 제공해야 합니다. 명확하고 간결한 설명은 모델이 올바른 정보에 집중하여 출력의 정확도를 향상하도록 안내합니다.
예제 1
청구서에서 날짜를 추출하려면 필드
Date
이름을 지정하는 것 외에도 다음과 같은 설명을 제공합니다.The date when the invoice was issued, typically found at the top right corner of the document.
예제 2
청구서에서
Customer Name
를 추출한다고 가정해 보겠습니다. 설명은 다음과 같을 수 있습니다.The name of the customer or client to whom this invoice is addressed, usually located near the billing address. It should be the name of the business or person, but not the entire mailing address.
필드 설명을 편집하여 실수 수정
시스템의 출력이 기대에 맞지 않는 경우 첫 번째 단계는 필드 설명을 구체화하고 업데이트하는 것입니다. 컨텍스트를 명확히 하고 필요한 항목에 대해 더 명시적이면 모호성을 줄이고 정확도를 향상시킵니다.
예제 3
Shipping date
필드가 일관되지 않거나 잘못된 추출을 생성했다면,Dispatch Date
레이블 이후에 더 정확한 내용으로 수정하세요.The date when the products were shipped, typically found below the item list. It may also be labeled something similar like Delivery Date or Dispatch Date. Dates should typically have a format like 1/23/2024 or 01-04-2025.
이 추가 컨텍스트는 모델을 문서의 올바른 위치로 안내합니다.
특정 출력에 분류 필드 사용
시스템이 미리 정의된 옵션 집합(예: 문서 유형, 제품 범주 또는 상태)에서 선택해야 하는 경우 분류 필드를 사용합니다. 옵션이 모호할 경우 각 옵션에 대한 명확한 설명을 제공하여 모델이 데이터를 정확하게 분류할 수 있도록 합니다.
예제 4
- 문서를
Invoice
Claim
범주 이름으로 분류하거나Report
이러한 단어가 포함된 분류 필드를 만들어야 하는 경우
예제 5
제품 이미지를 처리할 때
AlcoholicDrinks
,SoftDrinks
,Snacks
, 및DairyProducts
같은 범주에 할당해야 할 수 있습니다. 일부 항목은 유사하게 나타날 수 있으므로 근접 호출 사례에 대한 정확한 정의를 제공하는 것이 도움이 될 수 있습니다. 다음은 그 예입니다.Alcoholic Drinks
: 맥주, 와인 및 주류와 같은 알코올이 들어 있는 음료입니다. 이 범주는 청량 음료 또는 기타 무알코올 음료를 제외합니다.Soft Drinks
: 탄산 무알코올 음료(예: 탄산음료 및 스파클링 워터). 이 범주에는 주스 또는 알코올 음료가 포함되지 않습니다.
각 범주를 명확하게 정의하여 오분류를 최소화하면서 시스템이 제품을 올바르게 분류하는지 확인합니다.
신뢰도 점수를 사용하여 사용자 검토가 필요한 시기 결정
신뢰도 점수는 사용자 검토자를 참여시킬 시기를 결정하는 데 도움이 됩니다. 고객은 임계값을 사용하여 신뢰도 점수를 해석하여 더 많은 검토가 필요한 결과를 결정하여 오류 위험을 최소화할 수 있습니다.
예제 6
청구서 검토 사용 사례의 경우 추출된 키 필드(예:
TotalInvoiceAmount
신뢰도 점수 가 0.80 미만)인 경우 해당 문서를 수동 검토로 라우팅합니다. 이렇게 하면 사용자가 필요한 경우 청구서 합계 또는 법적 진술과 같은 중요한 필드를 확인할 수 있습니다.필드 유형에 따라 다른 신뢰도 임계값을 설정할 수 있습니다. 예를 들어 덜 중요한 필드에 대한
Comments
임계값이 낮고 실수가 없도록 하기 위한ContractTerminationDate
임계값이 높습니다.
오디오 및 비디오에 대한 언어 선택 범위를 좁혀 오류를 줄입니다.
오디오 및 비디오 콘텐츠를 다룰 때, 전사를 위해 제한된 언어 집합을 선택하면 잠재적으로 오류를 줄일 수 있습니다. 더 많은 언어를 포함할수록 시스템에서 어떤 언어가 사용되는지 추측해야 하므로 잘못된 인식이 증가할 수 있습니다.
예제 7
- 콘텐츠에 영어와 스페인어만 포함되어 있다고 확신하는 경우 이러한 두 언어로만 전사를 구성하면 품질이 향상될 수 있습니다. 그러나 콘텐츠에 실수로 다른 언어가 포함된 경우 이러한 구성은 실제로 전반적인 품질을 저하시킬 수 있습니다.
대본, 문서 텍스트 및 화자 데이터: 필드가 필요하지 않음
기본적으로 음성 기록, 추출한 OCR
문서 텍스트 및 비디오 키 프레임과 같은 콘텐츠 추출 정보는 즉시 검토 또는 사용자 지정 처리를 위해 분석기 출력에서 직접 액세스할 수 있습니다. 이러한 항목에 대한 스키마에 필드를 정의할 필요가 없습니다. 필드는 더 많은 처리가 필요할 때 사용될 수 있습니다. 예를 들어, 기록 요약, 엔터티 식별 또는 특정 항목 추출OCR
시에 사용할 수 있습니다. 각 필드는 시스템에 필요한 콘텐츠를 추출하거나 생성하도록 지시할 수 있습니다.
분류자 범주 이름 및 설명
분류자 및 분할 정확도를 향상하려면 컨텍스트를 사용하여 적절한 범주 이름과 설명을 지정하는 것이 중요합니다.
예제 8
범주 이름의 경우 일반적인 제목(예: 연례 재무 보고서, SEC Form 10-K)을 사용해야 합니다.
범주 설명의 경우 한 범주를 다른 범주와 구분하는 컨텍스트를 제공해야 합니다.
- 의미 체계 정의: 예:
receipts for expense reporting
- 주요 콘텐츠: 이전 세금 양식과 구별하기 위해 세금 양식과 같은
2025
범주를 고유하게 식별할 수 있는 모든 콘텐츠 - 일반적인 레이아웃: 다른 레이아웃과 구별할 수 있는 레이아웃(예:
two-column form
채워짐/채워지지 않은 확인란)
- 의미 체계 정의: 예: