Content Analyzers - Create Or Replace

Crie um novo analisador de forma assíncrona.

PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01
PUT {endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01&allowReplace={allowReplace}

Parâmetros URI

Nome Em Necessário Tipo Descrição
analyzerId
path True

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

O identificador único do analisador.

endpoint
path True

string (uri)

Conteúdo Compreender o ponto final do serviço.

api-version
query True

string

minLength: 1

A versão da API a utilizar para esta operação.

allowReplace
query

boolean

Permitir que a operação substitua um recurso existente.

Cabeçalho de Pedido

Nome Necessário Tipo Descrição
x-ms-client-request-id

string (uuid)

Um identificador de cadeia de caracteres opaco, globalmente exclusivo e gerado pelo cliente para a solicitação.

Órgão do Pedido

Nome Tipo Descrição
baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

O analisador para treinar incrementalmente.

config

ContentAnalyzerConfig

Definições do analisador.

description

string

Uma descrição do analisador.

dynamicFieldSchema

boolean

Indica se o resultado pode conter campos adicionais fora do esquema definido.

fieldSchema

ContentFieldSchema

O esquema dos campos para extrair.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Fontes adicionais de conhecimento usadas para melhorar o analisador.

models

object

Mapeamento dos papéis dos modelos para nomes específicos de modelos. Ex. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

O local onde os dados podem ser processados. Por defeito é global.

tags

object

Etiquetas associadas ao analisador.

Respostas

Nome Tipo Descrição
200 OK

ContentAnalyzer

O pedido foi bem-sucedido.

Cabeçalhos

  • Operation-Location: string
  • x-ms-client-request-id: string
201 Created

ContentAnalyzer

O pedido foi bem-sucedido e, como resultado, foi criado um novo recurso.

Cabeçalhos

  • Operation-Location: string
  • x-ms-client-request-id: string
Other Status Codes

Azure.Core.Foundations.ErrorResponse

Uma resposta de erro inesperada.

Cabeçalhos

x-ms-error-code: string

Segurança

Ocp-Apim-Subscription-Key

Autenticação baseada em chaves usando a chave de acesso do recurso Azure.

Tipo: apiKey
Em: header

EntraIdToken

Autenticação OAuth2 do ID Microsoft Entra usando um token de acesso.

Tipo: oauth2
Flow: accessCode
URL de autorização: https://login.microsoftonline.com/common/oauth2/authorize
Token URL: https://login.microsoftonline.com/common/oauth2/token

Alcances

Nome Descrição
https://cognitiveservices.azure.com/.default

Exemplos

Create or Replace Analyzer

Pedido de exemplo

PUT {endpoint}/contentunderstanding/analyzers/myAnalyzer?api-version=2025-11-01

{
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Resposta de exemplo

Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}
Operation-Location: https://myendpoint.cognitiveservices.azure.com/contentunderstanding/analyzers/myAnalyzer/operations/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2025-11-01
{
  "analyzerId": "myAnalyzer",
  "description": "My analyzer",
  "tags": {
    "createdBy": "John"
  },
  "status": "creating",
  "createdAt": "2025-05-01T18:46:36.051Z",
  "lastModifiedAt": "2025-05-01T18:46:36.051Z",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "locales": null,
    "enableOcr": true,
    "enableLayout": true,
    "enableFormula": false,
    "returnDetails": true
  },
  "fieldSchema": {
    "name": "MyForm",
    "description": "My form",
    "fields": {
      "Company": {
        "type": "string",
        "description": "Name of company."
      }
    },
    "definitions": {}
  },
  "knowledgeSources": [
    {
      "kind": "labeledData",
      "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
      "prefix": "trainingData",
      "fileListPath": "trainingData/fileList.jsonl"
    }
  ]
}

Definições

Nome Descrição
AnnotationFormat

Formato de representação das anotações em analisar a marcação de resultados.

Azure.Core.Foundations.Error

O objeto de erro.

Azure.Core.Foundations.ErrorResponse

Uma resposta contendo detalhes do erro.

Azure.Core.Foundations.InnerError

Um objeto que contém informações mais específicas sobre o erro. De acordo com as diretrizes da API REST do Azure - https://aka.ms/AzureRestApiGuidelines#handling-errors.

ChartFormat

Formato de representação dos gráficos em analisar a marcação de resultados.

ContentAnalyzer

Analisador que extrai conteúdo e campos de documentos multimodais.

ContentAnalyzerConfig

Definições de configuração para um analisador.

ContentAnalyzerStatus

Estado de um recurso.

ContentCategoryDefinition

Definição de categoria de conteúdo.

ContentFieldDefinition

Definição do campo usando uma sintaxe semelhante a um esquema JSON.

ContentFieldSchema

Esquema de campos a extrair de documentos.

ContentFieldType

Tipo de dados semânticos do valor do campo.

GenerationMethod

Método de geração.

KnowledgeSourceKind

Fonte de conhecimento.

LabeledDataKnowledgeSource

Etiquetado como fonte de conhecimento de dados.

ProcessingLocation

O local onde os dados podem ser processados. Por defeito é global.

SupportedModels

Modelos de conclusão e incorporação de chat suportados pelo analisador.

TableFormat

Formato de representação de tabelas em analisar a marcação de resultados.

AnnotationFormat

Formato de representação das anotações em analisar a marcação de resultados.

Valor Descrição
none

Não represente anotações.

markdown

Represente informação básica de anotação usando formatação markdown.

Azure.Core.Foundations.Error

O objeto de erro.

Nome Tipo Descrição
code

string

Um de um conjunto de códigos de erro definido pelo servidor.

details

Azure.Core.Foundations.Error[]

Uma matriz de detalhes sobre erros específicos que levaram a esse erro relatado.

innererror

Azure.Core.Foundations.InnerError

Um objeto que contém informações mais específicas do que o objeto atual sobre o erro.

message

string

Uma representação legível por humanos do erro.

target

string

O alvo do erro.

Azure.Core.Foundations.ErrorResponse

Uma resposta contendo detalhes do erro.

Nome Tipo Descrição
error

Azure.Core.Foundations.Error

O objeto de erro.

Azure.Core.Foundations.InnerError

Um objeto que contém informações mais específicas sobre o erro. De acordo com as diretrizes da API REST do Azure - https://aka.ms/AzureRestApiGuidelines#handling-errors.

Nome Tipo Descrição
code

string

Um de um conjunto de códigos de erro definido pelo servidor.

innererror

Azure.Core.Foundations.InnerError

Erro interno.

ChartFormat

Formato de representação dos gráficos em analisar a marcação de resultados.

Valor Descrição
chartJs

Represente os gráficos como blocos de código Chart.js.

markdown

Represente os gráficos como tabelas de marcação.

ContentAnalyzer

Analisador que extrai conteúdo e campos de documentos multimodais.

Nome Tipo Valor padrão Descrição
analyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

O identificador único do analisador.

baseAnalyzerId

string

minLength: 1
maxLength: 64
pattern: ^[a-zA-Z0-9._-]{1,64}$

O analisador para treinar incrementalmente.

config

ContentAnalyzerConfig

Definições do analisador.

createdAt

string (date-time)

A data e hora em que o analisador foi criado.

description

string

Uma descrição do analisador.

dynamicFieldSchema

boolean

False

Indica se o resultado pode conter campos adicionais fora do esquema definido.

fieldSchema

ContentFieldSchema

O esquema dos campos para extrair.

knowledgeSources KnowledgeSource[]:

LabeledDataKnowledgeSource[]

Fontes adicionais de conhecimento usadas para melhorar o analisador.

lastModifiedAt

string (date-time)

A data e hora em que o analisador foi modificado pela última vez.

models

object

Mapeamento dos papéis dos modelos para nomes específicos de modelos. Ex. { "completion": "gpt-4.1", "embedding": "text-embedding-3-large" }.

processingLocation

ProcessingLocation

global

O local onde os dados podem ser processados. Por defeito é global.

status

ContentAnalyzerStatus

O estado do analisador.

supportedModels

SupportedModels

Modelos de conclusão e incorporação de chat suportados pelo analisador.

tags

object

Etiquetas associadas ao analisador.

warnings

Azure.Core.Foundations.Error[]

Avisos encontrados durante a criação do analisador.

ContentAnalyzerConfig

Definições de configuração para um analisador.

Nome Tipo Valor padrão Descrição
annotationFormat

AnnotationFormat

markdown

Formato de representação das anotações em analisar a marcação de resultados.

chartFormat

ChartFormat

chartJs

Formato de representação dos gráficos em analisar a marcação de resultados.

contentCategories

<string,  ContentCategoryDefinition>

Mapa de categorias para classificar o(s) conteúdo(s) de entrada(s) contra elas.

disableFaceBlurring

boolean

Desative o desfoque padrão dos rostos para preservar a privacidade durante o processamento do conteúdo.

enableFigureAnalysis

boolean

Permitir a análise de figuras, como gráficos e diagramas.

enableFigureDescription

boolean

Permitir a geração da descrição da figura.

enableFormula

boolean

Ativar a deteção de fórmulas matemáticas.

enableLayout

boolean

Ativar a análise de layout.

enableOcr

boolean

Ativar o reconhecimento ótico de caracteres (OCR).

enableSegment

boolean

Permitir a segmentação da entrada por contentCategories.

estimateFieldSourceAndConfidence

boolean

Retorna a base de grounding e confiança.

locales

string[]

Lista de dicas locais para transcrição de fala.

omitContent

boolean

Omita o conteúdo deste analisador do resultado da análise. Apenas devolve conteúdo(s) de analisadores adicionais especificados em contentCategories, se existirem.

returnDetails

boolean

Devolver todos os detalhes do conteúdo.

segmentPerPage

boolean

Forçar a segmentação do conteúdo do documento por página.

tableFormat

TableFormat

html

Formato de representação de tabelas em analisar a marcação de resultados.

ContentAnalyzerStatus

Estado de um recurso.

Valor Descrição
creating

O recurso está sendo criado.

ready

O recurso está pronto.

deleting

O recurso está sendo excluído.

failed

O recurso falhou durante a criação.

ContentCategoryDefinition

Definição de categoria de conteúdo.

Nome Tipo Descrição
analyzer

ContentAnalyzer

Definição opcional em linha do analisador usado para processar o conteúdo.

analyzerId

string

Analisador opcional usado para processar o conteúdo.

description

string

A descrição da categoria.

ContentFieldDefinition

Definição do campo usando uma sintaxe semelhante a um esquema JSON.

Nome Tipo Descrição
$ref

string

Referência a outra definição de campo.

description

string

Descrição do campo.

enum

string[]

Enumeração dos possíveis valores de campo.

enumDescriptions

object

Descrições para cada valor de enumeração.

estimateSourceAndConfidence

boolean

Devolve a fonte de aterramento e confiança.

examples

string[]

Exemplos de valores de campo.

items

ContentFieldDefinition

Esquema de tipo de campo de cada elemento do array, se o tipo for o array.

method

GenerationMethod

Método de geração.

properties

<string,  ContentFieldDefinition>

Subcampos nomeados, se o tipo for objeto.

type

ContentFieldType

Tipo de dados semânticos do valor do campo.

ContentFieldSchema

Esquema de campos a extrair de documentos.

Nome Tipo Descrição
definitions

<string,  ContentFieldDefinition>

Definições adicionais referenciadas pelos campos no esquema.

description

string

Uma descrição do esquema de campo.

fields

<string,  ContentFieldDefinition>

Os campos definidos no esquema.

name

string

O nome do esquema de campo.

ContentFieldType

Tipo de dados semânticos do valor do campo.

Valor Descrição
string

Texto simples.

date

Data, normalizado para o formato ISO 8601 (YYY-MM-DD).

time

Tempo, normalizado para o formato ISO 8601 (hh:mm:ss).

number

Número como ponto flutuante de dupla precisão.

integer

Inteiro como inteiro com sinal de 64 bits.

boolean

Valor booleano.

array

Lista de subcampos do mesmo tipo.

object

Lista nomeada de subcampos.

json

Objeto JSON.

GenerationMethod

Método de geração.

Valor Descrição
generate

Os valores são gerados livremente com base no conteúdo.

extract

Os valores são extraídos à medida que aparecem no conteúdo.

classify

Os valores são classificados contra um conjunto pré-definido de categorias.

KnowledgeSourceKind

Fonte de conhecimento.

Valor Descrição
labeledData

Uma fonte de conhecimento de dados rotulada.

LabeledDataKnowledgeSource

Etiquetado como fonte de conhecimento de dados.

Nome Tipo Descrição
containerUrl

string (uri)

A URL do contentor do blob que contém dados rotulados.

fileListPath

string

Um caminho opcional para um ficheiro que lista blobs específicos para incluir.

kind string:

labeledData

O tipo de fonte de conhecimento.

prefix

string

Um prefixo opcional para filtrar blobs dentro do contentor.

ProcessingLocation

O local onde os dados podem ser processados. Por defeito é global.

Valor Descrição
geography

Os dados podem ser processados na mesma geografia do recurso.

dataZone

Os dados podem ser processados na mesma zona de dados que o recurso.

global

Os dados podem ser processados em qualquer centro de dados Azure globalmente.

SupportedModels

Modelos de conclusão e incorporação de chat suportados pelo analisador.

Nome Tipo Descrição
completion

string[]

Modelos de conclusão de chat suportados pelo analisador.

embedding

string[]

Incorporação de modelos suportados pelo analisador.

TableFormat

Formato de representação de tabelas em analisar a marcação de resultados.

Valor Descrição
html

Representar tabelas usando elementos de tabela HTML: <tabela>, <th>, <tr>, <td>.

markdown

Represente tabelas usando a sintaxe da tabela Markdown Flavored do GitHub, que não suporta células fundidas nem cabeçalhos ricos.