다음을 통해 공유


Content Analyzers - Create Or Replace

비동기식으로 새 분석기를 생성하세요.

PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
analyzerId
path True

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

분석기의 고유 식별자입니다.

endpoint
path True

string (uri)

콘텐츠 이해 서비스 엔드포인트.

api-version
query True

string

minLength: 1

이 작업에 사용할 API 버전입니다.

allowReplace
query

boolean

기존 자원을 대체할 수 있도록 허용하세요.

요청 헤더

Name 필수 형식 Description
x-ms-client-request-id

string (uuid)

요청에 대한 불투명하고 전역적으로 고유한 클라이언트 생성 문자열 식별자입니다.

요청 본문

Name 형식 Description
baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

분석기를 점진적으로 학습할 수 있습니다.

config

ContentAnalyzerConfig

분석기 설정 설정.

description

string

분석기 설명입니다.

dynamicFieldSchema

boolean

결과에 정의된 스키마 외의 추가 필드가 포함될 수 있는지 여부를 나타냅니다.

fieldSchema

ContentFieldSchema

추출할 필드 스키마.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

분석기를 향상시키기 위해 사용되는 추가 지식 출처.

models

object

모델 역할을 특정 모델명에 매핑하는 것. 예: { "완성": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다.

tags

object

분석기와 연관된 태그들.

응답

Name 형식 Description
200 OK

ContentAnalyzer

요청이 성공했습니다.

헤더

  • Operation-Location: string
  • x-ms-client-request-id: string
201 Created

ContentAnalyzer

요청이 성공했고 결과적으로 새 리소스가 생성되었습니다.

헤더

  • Operation-Location: string
  • x-ms-client-request-id: string
Other Status Codes

Azure.Core.Foundations.ErrorResponse

예기치 않은 오류 응답입니다.

헤더

x-ms-error-code: string

보안

Ocp-Apim-Subscription-Key

Azure 리소스의 접근 키를 이용한 키 기반 인증.

형식: apiKey
In(다음 안에): header

EntraIdToken

Microsoft Entra ID OAuth2 인증 접근 토큰을 사용했습니다.

형식: oauth2
Flow: accessCode
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/authorize
토큰 URL: https://login.microsoftonline.com/common/oauth2/token

범위

Name Description
https://cognitiveservices.azure.com/.default

예제

Create or Replace Analyzer

샘플 요청

PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01

{
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

샘플 응답

Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

정의

Name Description
AnnotationFormat

분석 결과 마크다운에서 주석의 표현 형식.

Azure.Core.Foundations.Error

오류 개체입니다.

Azure.Core.Foundations.ErrorResponse

오류 세부 정보가 포함된 응답입니다.

Azure.Core.Foundations.InnerError

오류에 대한 보다 구체적인 정보를 포함하는 개체입니다. Azure REST API 지침에 따라 - https://aka.ms/AzureRestApiGuidelines#handling-errors.

ChartFormat

분석 결과 마크다운에서 차트의 표현 형식.

ContentAnalyzer

멀티모달 문서에서 내용과 필드를 추출하는 분석기입니다.

ContentAnalyzerConfig

분석기 설정 설정.

ContentAnalyzerStatus

자원의 상태.

ContentCategoryDefinition

콘텐츠 카테고리 정의.

ContentFieldDefinition

JSON 스키마와 같은 문법을 사용한 필드 정의.

ContentFieldSchema

문서에서 추출할 필드 스키마.

ContentFieldType

필드 값의 의미 체계 데이터 형식입니다.

GenerationMethod

생성 방식.

KnowledgeSourceKind

지식 원단 종류.

LabeledDataKnowledgeSource

데이터 지식 소스로 라벨링되어 있습니다.

ProcessingLocation

데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다.

SupportedModels

분석기가 지원하는 채팅 완성 및 임베딩 모델.

TableFormat

분석 결과 마크다운에서 표의 표현 형식.

AnnotationFormat

분석 결과 마크다운에서 주석의 표현 형식.

Description
none

주석을 나타내지 마세요.

markdown

기본 주석 정보를 마크다운 서식으로 표현하세요.

Azure.Core.Foundations.Error

오류 개체입니다.

Name 형식 Description
code

string

서버에서 정의한 오류 코드 집합 중 하나입니다.

details

Azure.Core.Foundations.Error[]

이 보고된 오류로 이어진 특정 오류에 대한 세부 정보 배열입니다.

innererror

Azure.Core.Foundations.InnerError

오류에 대한 현재 개체보다 더 구체적인 정보를 포함하는 개체입니다.

message

string

사람이 읽을 수 있는 오류 표현입니다.

target

string

오류의 대상입니다.

Azure.Core.Foundations.ErrorResponse

오류 세부 정보가 포함된 응답입니다.

Name 형식 Description
error

Azure.Core.Foundations.Error

오류 개체입니다.

Azure.Core.Foundations.InnerError

오류에 대한 보다 구체적인 정보를 포함하는 개체입니다. Azure REST API 지침에 따라 - https://aka.ms/AzureRestApiGuidelines#handling-errors.

Name 형식 Description
code

string

서버에서 정의한 오류 코드 집합 중 하나입니다.

innererror

Azure.Core.Foundations.InnerError

내부 오류.

ChartFormat

분석 결과 마크다운에서 차트의 표현 형식.

Description
chartJs

차트를 코드 블록으로 표현Chart.js.

markdown

차트를 마크다운 테이블로 표현하세요.

ContentAnalyzer

멀티모달 문서에서 내용과 필드를 추출하는 분석기입니다.

Name 형식 Default value Description
analyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

분석기의 고유 식별자입니다.

baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

분석기를 점진적으로 학습할 수 있습니다.

config

ContentAnalyzerConfig

분석기 설정 설정.

createdAt

string (date-time)

분석기가 만들어진 날짜와 시간.

description

string

분석기 설명입니다.

dynamicFieldSchema

boolean

False

결과에 정의된 스키마 외의 추가 필드가 포함될 수 있는지 여부를 나타냅니다.

fieldSchema

ContentFieldSchema

추출할 필드 스키마.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

분석기를 향상시키기 위해 사용되는 추가 지식 출처.

lastModifiedAt

string (date-time)

분석기가 마지막으로 수정된 날짜와 시간.

models

object

모델 역할을 특정 모델명에 매핑하는 것. 예: { "완성": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

global

데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다.

status

ContentAnalyzerStatus

분석기 상태.

supportedModels

SupportedModels

분석기가 지원하는 채팅 완성 및 임베딩 모델.

tags

object

분석기와 연관된 태그들.

warnings

Azure.Core.Foundations.Error[]

분석기를 생성하는 과정에서 발생한 경고들.

ContentAnalyzerConfig

분석기 설정 설정.

Name 형식 Default value Description
annotationFormat

AnnotationFormat

markdown

분석 결과 마크다운에서 주석의 표현 형식.

chartFormat

ChartFormat

chartJs

분석 결과 마크다운에서 차트의 표현 형식.

contentCategories

<string,  ContentCategoryDefinition>

입력 콘텐츠를 분류하기 위한 카테고리 매핑.

disableFaceBlurring

boolean

콘텐츠를 처리하는 동안 프라이버시를 위해 얼굴 기본 흐림 설정을 비활성화하세요.

enableFigureAnalysis

boolean

차트나 다이어그램과 같은 수치 분석을 가능하게 합니다.

enableFigureDescription

boolean

도형 설명 생성 활성화.

enableFormula

boolean

수학적 공식 탐지 기능을 활성화하세요.

enableLayout

boolean

레이아웃 분석을 활성화하세요.

enableOcr

boolean

광학 문자 인식(OCR)을 활성화하세요.

enableSegment

boolean

입력을 contentCategories별로 세분화할 수 있도록 활성화하세요.

estimateFieldSourceAndConfidence

boolean

필드 반환, 접지 소스와 신뢰.

locales

string[]

음성 전사를 위한 지역 힌트 목록.

omitContent

boolean

분석 결과에서 이 분석기의 내용을 생략하세요. contentCategories에 지정된 추가 분석기에서만 콘텐츠를 반환합니다.

returnDetails

boolean

모든 콘텐츠 정보를 반환하세요.

segmentPerPage

boolean

문서 내용을 페이지별로 강제로 세분화하세요.

tableFormat

TableFormat

html

분석 결과 마크다운에서 표의 표현 형식.

ContentAnalyzerStatus

자원의 상태.

Description
creating

리소스가 만들어지고 있습니다.

ready

자원이 준비됐어.

deleting

리소스가 삭제되고 있습니다.

failed

자원은 생성 과정에서 실패했습니다.

ContentCategoryDefinition

콘텐츠 카테고리 정의.

Name 형식 Description
analyzer

ContentAnalyzer

콘텐츠를 처리하는 데 사용되는 분석기의 선택적 인라인 정의가 있습니다.

analyzerId

string

콘텐츠를 처리하는 데 사용되는 선택적 분석기.

description

string

범주에 대한 설명입니다.

ContentFieldDefinition

JSON 스키마와 같은 문법을 사용한 필드 정의.

Name 형식 Description
$ref

string

다른 필드 정의에 대한 참고.

description

string

현장 설명.

enum

string[]

가능한 필드 값들의 열거.

enumDescriptions

object

각 열거 값에 대한 설명.

estimateSourceAndConfidence

boolean

그라운딩의 원천과 자신감을 되돌려라.

examples

string[]

필드 값의 예시입니다.

items

ContentFieldDefinition

각 배열 요소의 필드 타입 스키마, 타입이 배열일 경우.

method

GenerationMethod

생성 방식.

properties

<string,  ContentFieldDefinition>

객체 타입이라면 이름 있는 서브필드가 있습니다.

type

ContentFieldType

필드 값의 의미 체계 데이터 형식입니다.

ContentFieldSchema

문서에서 추출할 필드 스키마.

Name 형식 Description
definitions

<string,  ContentFieldDefinition>

스키마 내 필드에서 참조하는 추가 정의들.

description

string

필드 스키마에 대한 설명입니다.

fields

<string,  ContentFieldDefinition>

스키마에 정의된 필드들입니다.

name

string

필드 스키마의 이름입니다.

ContentFieldType

필드 값의 의미 체계 데이터 형식입니다.

Description
string

평문 텍스트.

date

날짜는 ISO 8601(YYYY-MM-DD) 형식으로 정규화됨.

time

ISO 8601 (hh:mm:ss) 형식으로 정규화된 시간.

number

숫자는 이중 정밀도 부동소수점입니다.

integer

정수는 64비트 부호 정수로 표현되었습니다.

boolean

부울 값입니다.

array

같은 유형의 하위 필드 목록.

object

서브필드의 이름 목록.

json

JSON 객체.

GenerationMethod

생성 방식.

Description
generate

가치는 내용에 따라 자유롭게 생성됩니다.

extract

값은 내용에 나타나는 대로 추출됩니다.

classify

값은 미리 정의된 범주 집합에 따라 분류됩니다.

KnowledgeSourceKind

지식 원단 종류.

Description
labeledData

라벨이 붙은 데이터 지식 소스.

LabeledDataKnowledgeSource

데이터 지식 소스로 라벨링되어 있습니다.

Name 형식 Description
containerUrl

string (uri)

라벨이 붙은 데이터가 포함된 블롭 컨테이너의 URL.

fileListPath

string

포함할 특정 블롭을 나열한 파일로 가는 선택적 경로.

kind string:

labeledData

어떤 종류의 지식 원천이죠.

prefix

string

컨테이너 내 블롭을 필터링하는 선택적 접두사입니다.

ProcessingLocation

데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다.

Description
geography

데이터는 자원과 동일한 지리적으로 처리될 수 있습니다.

dataZone

데이터는 자원과 동일한 데이터 존에서 처리될 수 있습니다.

global

데이터는 전 세계 어느 Azure 데이터 센터에서든 처리할 수 있습니다.

SupportedModels

분석기가 지원하는 채팅 완성 및 임베딩 모델.

Name 형식 Description
completion

string[]

분석기가 지원하는 채팅 완료 모델.

embedding

string[]

분석기가 지원하는 임베딩 모델.

TableFormat

분석 결과 마크다운에서 표의 표현 형식.

Description
html

테이블을 HTML 테이블 요소로 표현합니다: <table>, th>, <<tr>, <td>.

markdown

테이블을 GitHub Flavored Markdown 테이블 문법으로 표현하는데, 이 구문은 병합된 셀이나 리치 헤더를 지원하지 않습니다.