Content Analyzers - Create Or Replace
Crie um novo analisador de forma assíncrona.
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}
Parâmetros URI
| Nome | Em | Necessário | Tipo | Descrição |
|---|---|---|---|---|
|
analyzer
|
path | True |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
O identificador único do analisador. |
|
endpoint
|
path | True |
string (uri) |
Conteúdo Compreender o ponto final do serviço. |
|
api-version
|
query | True |
string minLength: 1 |
A versão da API a utilizar para esta operação. |
|
allow
|
query |
boolean |
Permitir que a operação substitua um recurso existente. |
Cabeçalho de Pedido
| Nome | Necessário | Tipo | Descrição |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
Um identificador de cadeia de caracteres opaco, globalmente exclusivo e gerado pelo cliente para a solicitação. |
Órgão do Pedido
| Nome | Tipo | Descrição |
|---|---|---|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
O analisador para treinar incrementalmente. |
| config |
Definições do analisador. |
|
| description |
string |
Uma descrição do analisador. |
| dynamicFieldSchema |
boolean |
Indica se o resultado pode conter campos adicionais fora do esquema definido. |
| fieldSchema |
O esquema dos campos para extrair. |
|
| knowledgeSources | KnowledgeSource[]: |
Fontes adicionais de conhecimento usadas para melhorar o analisador. |
| models |
object |
Mapeamento dos papéis dos modelos para nomes específicos de modelos. Ex. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
| processingLocation |
O local onde os dados podem ser processados. Por defeito é global. |
|
| tags |
object |
Etiquetas associadas ao analisador. |
Respostas
| Nome | Tipo | Descrição |
|---|---|---|
| 200 OK |
O pedido foi bem-sucedido. Cabeçalhos
|
|
| 201 Created |
O pedido foi bem-sucedido e, como resultado, foi criado um novo recurso. Cabeçalhos
|
|
| Other Status Codes |
Uma resposta de erro inesperada. Cabeçalhos x-ms-error-code: string |
Segurança
Ocp-Apim-Subscription-Key
Autenticação baseada em chaves usando a chave de acesso do recurso Azure.
Tipo:
apiKey
Em:
header
EntraIdToken
Autenticação OAuth2 do ID Microsoft Entra usando um token de acesso.
Tipo:
oauth2
Flow:
accessCode
URL de autorização:
https://login.microsoftonline.com/common/oauth2/authorize
Token URL:
https://login.microsoftonline.com/common/oauth2/token
Alcances
| Nome | Descrição |
|---|---|
| https://cognitiveservices.azure.com/.default |
Exemplos
Create or Replace Analyzer
Pedido de exemplo
PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01
{
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"baseAnalyzerId": "prebuilt-document",
"config": {
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Resposta de exemplo
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
"analyzerId": "myAnalyzer",
"description": "My analyzer",
"tags": {
"createdBy": "John"
},
"status": "creating",
"createdAt": "2025-05-01T18:46:36.051Z",
"lastModifiedAt": "2025-05-01T18:46:36.051Z",
"baseAnalyzerId": "prebuilt-document",
"config": {
"locales": null,
"enableOcr": true,
"enableLayout": true,
"enableFormula": false,
"returnDetails": true
},
"fieldSchema": {
"name": "MyForm",
"description": "My form",
"fields": {
"Company": {
"type": "string",
"description": "Name of company."
}
},
"definitions": {}
},
"knowledgeSources": [
{
"kind": "labeledData",
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "trainingData",
"fileListPath": "trainingData/fileList.jsonl"
}
]
}
Definições
| Nome | Descrição |
|---|---|
|
Annotation |
Formato de representação das anotações em analisar a marcação de resultados. |
|
Azure. |
O objeto de erro. |
|
Azure. |
Uma resposta contendo detalhes do erro. |
|
Azure. |
Um objeto que contém informações mais específicas sobre o erro. De acordo com as diretrizes da API REST do Azure - https://aka.ms/AzureRestApiGuidelines#handling-errors. |
|
Chart |
Formato de representação dos gráficos em analisar a marcação de resultados. |
|
Content |
Analisador que extrai conteúdo e campos de documentos multimodais. |
|
Content |
Definições de configuração para um analisador. |
|
Content |
Estado de um recurso. |
|
Content |
Definição de categoria de conteúdo. |
|
Content |
Definição do campo usando uma sintaxe semelhante a um esquema JSON. |
|
Content |
Esquema de campos a extrair de documentos. |
|
Content |
Tipo de dados semânticos do valor do campo. |
|
Generation |
Método de geração. |
|
Knowledge |
Fonte de conhecimento. |
|
Labeled |
Etiquetado como fonte de conhecimento de dados. |
|
Processing |
O local onde os dados podem ser processados. Por defeito é global. |
|
Supported |
Modelos de conclusão e incorporação de chat suportados pelo analisador. |
|
Table |
Formato de representação de tabelas em analisar a marcação de resultados. |
AnnotationFormat
Formato de representação das anotações em analisar a marcação de resultados.
| Valor | Descrição |
|---|---|
| none |
Não represente anotações. |
| markdown |
Represente informação básica de anotação usando formatação markdown. |
Azure.Core.Foundations.Error
O objeto de erro.
| Nome | Tipo | Descrição |
|---|---|---|
| code |
string |
Um de um conjunto de códigos de erro definido pelo servidor. |
| details |
Uma matriz de detalhes sobre erros específicos que levaram a esse erro relatado. |
|
| innererror |
Um objeto que contém informações mais específicas do que o objeto atual sobre o erro. |
|
| message |
string |
Uma representação legível por humanos do erro. |
| target |
string |
O alvo do erro. |
Azure.Core.Foundations.ErrorResponse
Uma resposta contendo detalhes do erro.
| Nome | Tipo | Descrição |
|---|---|---|
| error |
O objeto de erro. |
Azure.Core.Foundations.InnerError
Um objeto que contém informações mais específicas sobre o erro. De acordo com as diretrizes da API REST do Azure - https://aka.ms/AzureRestApiGuidelines#handling-errors.
| Nome | Tipo | Descrição |
|---|---|---|
| code |
string |
Um de um conjunto de códigos de erro definido pelo servidor. |
| innererror |
Erro interno. |
ChartFormat
Formato de representação dos gráficos em analisar a marcação de resultados.
| Valor | Descrição |
|---|---|
| chartJs |
Represente os gráficos como blocos de código Chart.js. |
| markdown |
Represente os gráficos como tabelas de marcação. |
ContentAnalyzer
Analisador que extrai conteúdo e campos de documentos multimodais.
| Nome | Tipo | Valor padrão | Descrição |
|---|---|---|---|
| analyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
O identificador único do analisador. |
|
| baseAnalyzerId |
string minLength: 1maxLength: 64 pattern: ^[a-zA-Z0-9._-]{1,64}$ |
O analisador para treinar incrementalmente. |
|
| config |
Definições do analisador. |
||
| createdAt |
string (date-time) |
A data e hora em que o analisador foi criado. |
|
| description |
string |
Uma descrição do analisador. |
|
| dynamicFieldSchema |
boolean |
False |
Indica se o resultado pode conter campos adicionais fora do esquema definido. |
| fieldSchema |
O esquema dos campos para extrair. |
||
| knowledgeSources | KnowledgeSource[]: |
Fontes adicionais de conhecimento usadas para melhorar o analisador. |
|
| lastModifiedAt |
string (date-time) |
A data e hora em que o analisador foi modificado pela última vez. |
|
| models |
object |
Mapeamento dos papéis dos modelos para nomes específicos de modelos. Ex. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }. |
|
| processingLocation | global |
O local onde os dados podem ser processados. Por defeito é global. |
|
| status |
O estado do analisador. |
||
| supportedModels |
Modelos de conclusão e incorporação de chat suportados pelo analisador. |
||
| tags |
object |
Etiquetas associadas ao analisador. |
|
| warnings |
Avisos encontrados durante a criação do analisador. |
ContentAnalyzerConfig
Definições de configuração para um analisador.
| Nome | Tipo | Valor padrão | Descrição |
|---|---|---|---|
| annotationFormat | markdown |
Formato de representação das anotações em analisar a marcação de resultados. |
|
| chartFormat | chartJs |
Formato de representação dos gráficos em analisar a marcação de resultados. |
|
| contentCategories |
<string,
Content |
Mapa de categorias para classificar o(s) conteúdo(s) de entrada(s) contra elas. |
|
| disableFaceBlurring |
boolean |
Desative o desfoque padrão dos rostos para preservar a privacidade durante o processamento do conteúdo. |
|
| enableFigureAnalysis |
boolean |
Permitir a análise de figuras, como gráficos e diagramas. |
|
| enableFigureDescription |
boolean |
Permitir a geração da descrição da figura. |
|
| enableFormula |
boolean |
Ativar a deteção de fórmulas matemáticas. |
|
| enableLayout |
boolean |
Ativar a análise de layout. |
|
| enableOcr |
boolean |
Ativar o reconhecimento ótico de caracteres (OCR). |
|
| enableSegment |
boolean |
Permitir a segmentação da entrada por contentCategories. |
|
| estimateFieldSourceAndConfidence |
boolean |
Retorna a base de grounding e confiança. |
|
| locales |
string[] |
Lista de dicas locais para transcrição de fala. |
|
| omitContent |
boolean |
Omita o conteúdo deste analisador do resultado da análise. Apenas devolve conteúdo(s) de analisadores adicionais especificados em contentCategories, se existirem. |
|
| returnDetails |
boolean |
Devolver todos os detalhes do conteúdo. |
|
| segmentPerPage |
boolean |
Forçar a segmentação do conteúdo do documento por página. |
|
| tableFormat | html |
Formato de representação de tabelas em analisar a marcação de resultados. |
ContentAnalyzerStatus
Estado de um recurso.
| Valor | Descrição |
|---|---|
| creating |
O recurso está sendo criado. |
| ready |
O recurso está pronto. |
| deleting |
O recurso está sendo excluído. |
| failed |
O recurso falhou durante a criação. |
ContentCategoryDefinition
Definição de categoria de conteúdo.
| Nome | Tipo | Descrição |
|---|---|---|
| analyzer |
Definição opcional em linha do analisador usado para processar o conteúdo. |
|
| analyzerId |
string |
Analisador opcional usado para processar o conteúdo. |
| description |
string |
A descrição da categoria. |
ContentFieldDefinition
Definição do campo usando uma sintaxe semelhante a um esquema JSON.
| Nome | Tipo | Descrição |
|---|---|---|
| $ref |
string |
Referência a outra definição de campo. |
| description |
string |
Descrição do campo. |
| enum |
string[] |
Enumeração dos possíveis valores de campo. |
| enumDescriptions |
object |
Descrições para cada valor de enumeração. |
| estimateSourceAndConfidence |
boolean |
Devolve a fonte de aterramento e confiança. |
| examples |
string[] |
Exemplos de valores de campo. |
| items |
Esquema de tipo de campo de cada elemento do array, se o tipo for o array. |
|
| method |
Método de geração. |
|
| properties |
<string,
Content |
Subcampos nomeados, se o tipo for objeto. |
| type |
Tipo de dados semânticos do valor do campo. |
ContentFieldSchema
Esquema de campos a extrair de documentos.
| Nome | Tipo | Descrição |
|---|---|---|
| definitions |
<string,
Content |
Definições adicionais referenciadas pelos campos no esquema. |
| description |
string |
Uma descrição do esquema de campo. |
| fields |
<string,
Content |
Os campos definidos no esquema. |
| name |
string |
O nome do esquema de campo. |
ContentFieldType
Tipo de dados semânticos do valor do campo.
| Valor | Descrição |
|---|---|
| string |
Texto simples. |
| date |
Data, normalizado para o formato ISO 8601 (YYY-MM-DD). |
| time |
Tempo, normalizado para o formato ISO 8601 (hh:mm:ss). |
| number |
Número como ponto flutuante de dupla precisão. |
| integer |
Inteiro como inteiro com sinal de 64 bits. |
| boolean |
Valor booleano. |
| array |
Lista de subcampos do mesmo tipo. |
| object |
Lista nomeada de subcampos. |
| json |
Objeto JSON. |
GenerationMethod
Método de geração.
| Valor | Descrição |
|---|---|
| generate |
Os valores são gerados livremente com base no conteúdo. |
| extract |
Os valores são extraídos à medida que aparecem no conteúdo. |
| classify |
Os valores são classificados contra um conjunto pré-definido de categorias. |
KnowledgeSourceKind
Fonte de conhecimento.
| Valor | Descrição |
|---|---|
| labeledData |
Uma fonte de conhecimento de dados rotulada. |
LabeledDataKnowledgeSource
Etiquetado como fonte de conhecimento de dados.
| Nome | Tipo | Descrição |
|---|---|---|
| containerUrl |
string (uri) |
A URL do contentor do blob que contém dados rotulados. |
| fileListPath |
string |
Um caminho opcional para um ficheiro que lista blobs específicos para incluir. |
| kind |
string:
labeled |
O tipo de fonte de conhecimento. |
| prefix |
string |
Um prefixo opcional para filtrar blobs dentro do contentor. |
ProcessingLocation
O local onde os dados podem ser processados. Por defeito é global.
| Valor | Descrição |
|---|---|
| geography |
Os dados podem ser processados na mesma geografia do recurso. |
| dataZone |
Os dados podem ser processados na mesma zona de dados que o recurso. |
| global |
Os dados podem ser processados em qualquer centro de dados Azure globalmente. |
SupportedModels
Modelos de conclusão e incorporação de chat suportados pelo analisador.
| Nome | Tipo | Descrição |
|---|---|---|
| completion |
string[] |
Modelos de conclusão de chat suportados pelo analisador. |
| embedding |
string[] |
Incorporação de modelos suportados pelo analisador. |
TableFormat
Formato de representação de tabelas em analisar a marcação de resultados.
| Valor | Descrição |
|---|---|
| html |
Representar tabelas usando elementos de tabela HTML: <tabela>, <th>, <tr>, <td>. |
| markdown |
Represente tabelas usando a sintaxe da tabela Markdown Flavored do GitHub, que não suporta células fundidas nem cabeçalhos ricos. |