Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure AI Document Intelligence Layout API puede transformar los documentos en Markdown enriquecido, conservando su estructura y formato originales. Solo tiene que especificar outputContentFormat=markdown
en la solicitud para recibir contenido semánticomente estructurado que mantenga párrafos, encabezados, tablas y otros elementos de documento en su jerarquía adecuada.
Esta salida de Markdown captura elegantemente la organización original del documento a la vez que proporciona contenido normalizado y fácilmente consumible para las aplicaciones de nivel inferior. La estructura semántica conservada permite flujos de trabajo de procesamiento de documentos más sofisticados sin perder el contexto y las relaciones entre los elementos del documento.
Elementos markdown admitidos en el análisis de diseño
Los siguientes elementos markdown se incluyen en las respuestas de la API de diseño:
- Párrafo
- Encabezado
- Tabla
- Figura
- Marca de selección
- Fórmula
- Código de barras
- Número de página/Encabezado de página/Pie de página
- PageBreak
- KeyValuePairs/Language/Style
- Intervalos y contenido
Párrafo
Los párrafos representan bloques cohesivos de texto que pertenecen semánticamente. La API layout mantiene la integridad del párrafo mediante:
- Conservación de límites de párrafo con líneas vacías entre párrafos independientes
- Uso de saltos de línea dentro de párrafos para mantener la estructura visual del documento original
- Mantenimiento del flujo de texto adecuado que respeta el orden de lectura del documento original
Este es un ejemplo:
This is paragraph 1.
This is still paragraph 1, even if in another Markdown line.
This is paragraph 2. There is a blank line between paragraph 1 and paragraph 2.
Encabezado
Los encabezados organizan el contenido del documento en una estructura jerárquica para facilitar la navegación y la comprensión. La API layout tiene las siguientes funcionalidades:
- Usa la sintaxis de encabezado markdown estándar con símbolos hash de 1 a 6 (#) correspondientes a los niveles de encabezado.
- Mantiene el espaciado adecuado con dos líneas en blanco antes de cada encabezado para mejorar la legibilidad.
Este es un ejemplo:
# This is a title
## This is heading 1
### This is heading 2
#### This is heading 3
Tabla
Las tablas conservan datos estructurados complejos en un formato organizado visualmente. La API layout usa la sintaxis de tabla HTML para lograr la máxima fidelidad y compatibilidad:
- Implementa el marcado de tabla HTML completo (
<table>
,<tr>
,<th>
,<td>
) en lugar de las tablas estándar de Markdown. - Conserva la celda combinada con los atributos HTML rowspan y colspan.
- Conserva los títulos de tabla con la etiqueta
<caption>
para mantener el contexto del documento. - Controla estructuras de tabla complejas, como encabezados, celdas y pies de página
- Mantiene el espaciado adecuado con dos líneas en blanco antes de cada tabla para mejorar la legibilidad.
- Conserva las notas al pie de tabla como párrafo independiente que sigue a la tabla.
Este es un ejemplo:
<table>
<caption>Table 1. This is a demo table</caption>
<tr><th>Header</th><th>Header</th></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Footer</td><td>Footer</td></tr>
</table>
This is the footnote of the table.
Figura
La API de diseño conserva los elementos de las figuras:
- Encapsula el contenido de la figura en
<figure>
etiquetas para mantener la distinción semántica del texto circundante - Conserva los títulos de la figura con la
<figcaption>
etiqueta para proporcionar contexto importante. - Conserva las notas al pie de la figura como párrafos independientes después del contenedor de la figura
Este es un ejemplo:
<figure>
<figcaption>Figure 2 This is a figure</figcaption>
Values
300
200
100
0
Jan Feb Mar Apr May Jun Months
</figure>
This is footnote if the figure have.
Marca de selección
Las marcas de selección representan elementos similares a casillas en formularios y documentos. La API de diseño:
- Usa caracteres Unicode para mayor claridad visual: ☒ (activada) y ☐ (desactivada)
- Filtra las detecciones de casillas de confianza baja (por debajo de la confianza 0.1) para mejorar la confiabilidad.
- Mantiene la relación semántica entre las marcas de selección y su texto asociado.
Fórmula
Las fórmulas matemáticas se conservan con la sintaxis compatible con LaTeX que permite la representación de expresiones matemáticas complejas:
- Las fórmulas insertadas se incluyen en signos de dólar individuales (
$...$
) para mantener el flujo de texto - Las fórmulas de bloque usan signos de dólar dobles (
$$...$$
) para la visualización independiente. - Las fórmulas de varias líneas se representan como fórmulas de bloque consecutivas, conservando las relaciones matemáticas
- El espaciado original y el formato se mantienen para garantizar una representación precisa
Este es un ejemplo de fórmula insertada, bloque de fórmulas de una sola línea y bloque de fórmulas de varias líneas:
The mass-energy equivalence formula $E = m c ^ { 2 }$ is an example of an inline formula
$$\frac { n ! } { k ! \left( n - k \right) ! } = \binom { n } { k }$$
$$\frac { p _ { j } } { p _ { 1 } } = \prod _ { k = 1 } ^ { j - 1 } e ^ { - \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } }$$
$$= \exp \left[ - \sum _ { k = 1 } ^ { j - 1 } \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } \right] .$$
Código de barras
Los códigos de barras y los códigos QR se representan mediante la sintaxis de imagen de Markdown con información semántica agregada:
- Usa la sintaxis de Markdown de imagen estándar con atributos descriptivos
- Captura el tipo de código de barras (código QR, código de barras, etc.) y su valor codificado
- Conserva la relación semántica entre códigos de barras y contenido circundante.
Este es un ejemplo:



NúmeroDePágina/EncabezadoDePágina/PieDePágina
Los elementos de metadatos de página proporcionan contexto sobre la paginación de documentos, pero no están diseñados para mostrarse alineados con el contenido principal:
- Se incluye en comentarios HTML para conservar la información mientras se mantiene oculta de la representación estándar de Markdown
- Mantiene información de estructura de página original que podría ser valiosa para la reconstrucción de documentos
- Permite a las aplicaciones comprender la paginación de documentos sin interrumpir el flujo de contenido
Este es un ejemplo:
<!-- PageHeader="This is page header" -->
<!-- PageFooter="This is page footer" -->
<!-- PageNumber="1" -->
PageBreak
Para averiguar fácilmente qué elementos pertenecen a la base de página en el contenido de Markdown puro, presentamos PageBreak como delimitador de las páginas.
Este es un ejemplo:
<!-- PageBreak -->
KeyValuePairs/Language/Style
Para KeyValuePairs/Language/Style, los asignamos al cuerpo JSON de Analytics y no al contenido de Markdown.
Nota:
Para obtener más información sobre Markdown que se admite actualmente para el contenido del usuario en GitHub.com, consulteEspecificación de Markdown con estilo GitHub.
Conclusión
Los elementos Markdown de Document Intelligence proporcionan una manera eficaz de representar la estructura y el contenido de los documentos analizados. Al comprender y usar correctamente estos elementos Markdown, puede mejorar los flujos de trabajo de procesamiento de documentos y crear aplicaciones de extracción de contenido más sofisticadas.
Pasos siguientes
Pruebe a procesar los documentos con Document Intelligence Studio.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.