Content Analyzers - Create Or Replace
비동기식으로 새 분석기를 생성하세요.
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}
URI 매개 변수
| Name | In(다음 안에) | 필수 | 형식 | Description |
|---|---|---|---|---|
|
analyzer
|
path | True |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
분석기의 고유 식별자입니다. |
|
endpoint
|
path | True |
string (uri) |
콘텐츠 이해 서비스 엔드포인트. |
|
api-version
|
query | True |
string minLength: 1 |
이 작업에 사용할 API 버전입니다. |
|
allow
|
query |
boolean |
기존 자원을 대체할 수 있도록 허용하세요. |
요청 헤더
| Name | 필수 | 형식 | Description |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
요청에 대한 불투명하고 전역적으로 고유한 클라이언트 생성 문자열 식별자입니다. |
요청 본문
| Name | 형식 | Description |
|---|---|---|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
분석기를 점진적으로 학습할 수 있습니다. |
| config |
분석기 설정 설정. |
|
| description |
string |
분석기 설명입니다. |
| dynamicFieldSchema |
boolean |
결과에 정의된 스키마 외의 추가 필드가 포함될 수 있는지 여부를 나타냅니다. |
| fieldSchema |
추출할 필드 스키마. |
|
| knowledgeSources | KnowledgeSource[]: |
분석기를 향상시키기 위해 사용되는 추가 지식 출처. |
| models |
object |
모델 역할을 특정 모델명에 매핑하는 것. 예: { "완성": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
| processingLocation |
데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다. |
|
| tags |
object |
분석기와 연관된 태그들. |
응답
| Name | 형식 | Description |
|---|---|---|
| 200 OK |
요청이 성공했습니다. 헤더
|
|
| 201 Created |
요청이 성공했고 결과적으로 새 리소스가 생성되었습니다. 헤더
|
|
| Other Status Codes |
예기치 않은 오류 응답입니다. 헤더 x-ms-error-code: string |
보안
Ocp-Apim-Subscription-Key
Azure 리소스의 접근 키를 이용한 키 기반 인증.
형식:
apiKey
In(다음 안에):
header
EntraIdToken
Microsoft Entra ID OAuth2 인증 접근 토큰을 사용했습니다.
형식:
oauth2
Flow:
accessCode
권한 부여 URL:
https://login.microsoftonline.com/common/oauth2/authorize
토큰 URL:
https://login.microsoftonline.com/common/oauth2/token
범위
| Name | Description |
|---|---|
| https://cognitiveservices.azure.com/.default |
예제
Create or Replace Analyzer
샘플 요청
PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01
{
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"baseAnalyzerId": "prebuilt-document",
"config": {
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
샘플 응답
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
정의
| Name | Description |
|---|---|
|
Annotation |
분석 결과 마크다운에서 주석의 표현 형식. |
|
Azure. |
오류 개체입니다. |
|
Azure. |
오류 세부 정보가 포함된 응답입니다. |
|
Azure. |
오류에 대한 보다 구체적인 정보를 포함하는 개체입니다. Azure REST API 지침에 따라 - https://aka.ms/AzureRestApiGuidelines#handling-errors. |
|
Chart |
분석 결과 마크다운에서 차트의 표현 형식. |
|
Content |
멀티모달 문서에서 내용과 필드를 추출하는 분석기입니다. |
|
Content |
분석기 설정 설정. |
|
Content |
자원의 상태. |
|
Content |
콘텐츠 카테고리 정의. |
|
Content |
JSON 스키마와 같은 문법을 사용한 필드 정의. |
|
Content |
문서에서 추출할 필드 스키마. |
|
Content |
필드 값의 의미 체계 데이터 형식입니다. |
|
Generation |
생성 방식. |
|
Knowledge |
지식 원단 종류. |
|
Labeled |
데이터 지식 소스로 라벨링되어 있습니다. |
|
Processing |
데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다. |
|
Supported |
분석기가 지원하는 채팅 완성 및 임베딩 모델. |
|
Table |
분석 결과 마크다운에서 표의 표현 형식. |
AnnotationFormat
분석 결과 마크다운에서 주석의 표현 형식.
| 값 | Description |
|---|---|
| none |
주석을 나타내지 마세요. |
| markdown |
기본 주석 정보를 마크다운 서식으로 표현하세요. |
Azure.Core.Foundations.Error
오류 개체입니다.
| Name | 형식 | Description |
|---|---|---|
| code |
string |
서버에서 정의한 오류 코드 집합 중 하나입니다. |
| details |
이 보고된 오류로 이어진 특정 오류에 대한 세부 정보 배열입니다. |
|
| innererror |
오류에 대한 현재 개체보다 더 구체적인 정보를 포함하는 개체입니다. |
|
| message |
string |
사람이 읽을 수 있는 오류 표현입니다. |
| target |
string |
오류의 대상입니다. |
Azure.Core.Foundations.ErrorResponse
오류 세부 정보가 포함된 응답입니다.
| Name | 형식 | Description |
|---|---|---|
| error |
오류 개체입니다. |
Azure.Core.Foundations.InnerError
오류에 대한 보다 구체적인 정보를 포함하는 개체입니다. Azure REST API 지침에 따라 - https://aka.ms/AzureRestApiGuidelines#handling-errors.
| Name | 형식 | Description |
|---|---|---|
| code |
string |
서버에서 정의한 오류 코드 집합 중 하나입니다. |
| innererror |
내부 오류. |
ChartFormat
분석 결과 마크다운에서 차트의 표현 형식.
| 값 | Description |
|---|---|
| chartJs |
차트를 코드 블록으로 표현Chart.js. |
| markdown |
차트를 마크다운 테이블로 표현하세요. |
ContentAnalyzer
멀티모달 문서에서 내용과 필드를 추출하는 분석기입니다.
| Name | 형식 | Default value | Description |
|---|---|---|---|
| analyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
분석기의 고유 식별자입니다. |
|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
분석기를 점진적으로 학습할 수 있습니다. |
|
| config |
분석기 설정 설정. |
||
| createdAt |
string (date-time) |
분석기가 만들어진 날짜와 시간. |
|
| description |
string |
분석기 설명입니다. |
|
| dynamicFieldSchema |
boolean |
False |
결과에 정의된 스키마 외의 추가 필드가 포함될 수 있는지 여부를 나타냅니다. |
| fieldSchema |
추출할 필드 스키마. |
||
| knowledgeSources | KnowledgeSource[]: |
분석기를 향상시키기 위해 사용되는 추가 지식 출처. |
|
| lastModifiedAt |
string (date-time) |
분석기가 마지막으로 수정된 날짜와 시간. |
|
| models |
object |
모델 역할을 특정 모델명에 매핑하는 것. 예: { "완성": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
|
| processingLocation | global |
데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다. |
|
| status |
분석기 상태. |
||
| supportedModels |
분석기가 지원하는 채팅 완성 및 임베딩 모델. |
||
| tags |
object |
분석기와 연관된 태그들. |
|
| warnings |
분석기를 생성하는 과정에서 발생한 경고들. |
ContentAnalyzerConfig
분석기 설정 설정.
| Name | 형식 | Default value | Description |
|---|---|---|---|
| annotationFormat | markdown |
분석 결과 마크다운에서 주석의 표현 형식. |
|
| chartFormat | chartJs |
분석 결과 마크다운에서 차트의 표현 형식. |
|
| contentCategories |
<string,
Content |
입력 콘텐츠를 분류하기 위한 카테고리 매핑. |
|
| disableFaceBlurring |
boolean |
콘텐츠를 처리하는 동안 프라이버시를 위해 얼굴 기본 흐림 설정을 비활성화하세요. |
|
| enableFigureAnalysis |
boolean |
차트나 다이어그램과 같은 수치 분석을 가능하게 합니다. |
|
| enableFigureDescription |
boolean |
도형 설명 생성 활성화. |
|
| enableFormula |
boolean |
수학적 공식 탐지 기능을 활성화하세요. |
|
| enableLayout |
boolean |
레이아웃 분석을 활성화하세요. |
|
| enableOcr |
boolean |
광학 문자 인식(OCR)을 활성화하세요. |
|
| enableSegment |
boolean |
입력을 contentCategories별로 세분화할 수 있도록 활성화하세요. |
|
| estimateFieldSourceAndConfidence |
boolean |
필드 반환, 접지 소스와 신뢰. |
|
| locales |
string[] |
음성 전사를 위한 지역 힌트 목록. |
|
| omitContent |
boolean |
분석 결과에서 이 분석기의 내용을 생략하세요. contentCategories에 지정된 추가 분석기에서만 콘텐츠를 반환합니다. |
|
| returnDetails |
boolean |
모든 콘텐츠 정보를 반환하세요. |
|
| segmentPerPage |
boolean |
문서 내용을 페이지별로 강제로 세분화하세요. |
|
| tableFormat | html |
분석 결과 마크다운에서 표의 표현 형식. |
ContentAnalyzerStatus
자원의 상태.
| 값 | Description |
|---|---|
| creating |
리소스가 만들어지고 있습니다. |
| ready |
자원이 준비됐어. |
| deleting |
리소스가 삭제되고 있습니다. |
| failed |
자원은 생성 과정에서 실패했습니다. |
ContentCategoryDefinition
콘텐츠 카테고리 정의.
| Name | 형식 | Description |
|---|---|---|
| analyzer |
콘텐츠를 처리하는 데 사용되는 분석기의 선택적 인라인 정의가 있습니다. |
|
| analyzerId |
string |
콘텐츠를 처리하는 데 사용되는 선택적 분석기. |
| description |
string |
범주에 대한 설명입니다. |
ContentFieldDefinition
JSON 스키마와 같은 문법을 사용한 필드 정의.
| Name | 형식 | Description |
|---|---|---|
| $ref |
string |
다른 필드 정의에 대한 참고. |
| description |
string |
현장 설명. |
| enum |
string[] |
가능한 필드 값들의 열거. |
| enumDescriptions |
object |
각 열거 값에 대한 설명. |
| estimateSourceAndConfidence |
boolean |
그라운딩의 원천과 자신감을 되돌려라. |
| examples |
string[] |
필드 값의 예시입니다. |
| items |
각 배열 요소의 필드 타입 스키마, 타입이 배열일 경우. |
|
| method |
생성 방식. |
|
| properties |
<string,
Content |
객체 타입이라면 이름 있는 서브필드가 있습니다. |
| type |
필드 값의 의미 체계 데이터 형식입니다. |
ContentFieldSchema
문서에서 추출할 필드 스키마.
| Name | 형식 | Description |
|---|---|---|
| definitions |
<string,
Content |
스키마 내 필드에서 참조하는 추가 정의들. |
| description |
string |
필드 스키마에 대한 설명입니다. |
| fields |
<string,
Content |
스키마에 정의된 필드들입니다. |
| name |
string |
필드 스키마의 이름입니다. |
ContentFieldType
필드 값의 의미 체계 데이터 형식입니다.
| 값 | Description |
|---|---|
| string |
평문 텍스트. |
| date |
날짜는 ISO 8601(YYYY-MM-DD) 형식으로 정규화됨. |
| time |
ISO 8601 (hh:mm:ss) 형식으로 정규화된 시간. |
| number |
숫자는 이중 정밀도 부동소수점입니다. |
| integer |
정수는 64비트 부호 정수로 표현되었습니다. |
| boolean |
부울 값입니다. |
| array |
같은 유형의 하위 필드 목록. |
| object |
서브필드의 이름 목록. |
| json |
JSON 객체. |
GenerationMethod
생성 방식.
| 값 | Description |
|---|---|
| generate |
가치는 내용에 따라 자유롭게 생성됩니다. |
| extract |
값은 내용에 나타나는 대로 추출됩니다. |
| classify |
값은 미리 정의된 범주 집합에 따라 분류됩니다. |
KnowledgeSourceKind
지식 원단 종류.
| 값 | Description |
|---|---|
| labeledData |
라벨이 붙은 데이터 지식 소스. |
LabeledDataKnowledgeSource
데이터 지식 소스로 라벨링되어 있습니다.
| Name | 형식 | Description |
|---|---|---|
| containerUrl |
string (uri) |
라벨이 붙은 데이터가 포함된 블롭 컨테이너의 URL. |
| fileListPath |
string |
포함할 특정 블롭을 나열한 파일로 가는 선택적 경로. |
| kind |
string:
labeled |
어떤 종류의 지식 원천이죠. |
| prefix |
string |
컨테이너 내 블롭을 필터링하는 선택적 접두사입니다. |
ProcessingLocation
데이터가 처리될 수 있는 장소입니다. 기본값은 전역으로 설정됩니다.
| 값 | Description |
|---|---|
| geography |
데이터는 자원과 동일한 지리적으로 처리될 수 있습니다. |
| dataZone |
데이터는 자원과 동일한 데이터 존에서 처리될 수 있습니다. |
| global |
데이터는 전 세계 어느 Azure 데이터 센터에서든 처리할 수 있습니다. |
SupportedModels
분석기가 지원하는 채팅 완성 및 임베딩 모델.
| Name | 형식 | Description |
|---|---|---|
| completion |
string[] |
분석기가 지원하는 채팅 완료 모델. |
| embedding |
string[] |
분석기가 지원하는 임베딩 모델. |
TableFormat
분석 결과 마크다운에서 표의 표현 형식.
| 값 | Description |
|---|---|
| html |
테이블을 HTML 테이블 요소로 표현합니다: <table>, th>, <<tr>, <td>. |
| markdown |
테이블을 GitHub Flavored Markdown 테이블 문법으로 표현하는데, 이 구문은 병합된 셀이나 리치 헤더를 지원하지 않습니다. |