Bagikan melalui


Memahami Format Output Markdown API Tata Letak Kecerdasan Dokumen

API Tata Letak Kecerdasan Dokumen Azure AI dapat mengubah dokumen Anda menjadi Markdown yang kaya, mempertahankan struktur dan pemformatan aslinya. Cukup tentukan outputContentFormat=markdown dalam permintaan Anda untuk menerima konten terstruktur semantik yang mempertahankan paragraf, judul, tabel, dan elemen dokumen lainnya dalam hierarki yang tepat.

Output Markdown ini secara elegan menangkap organisasi asli dokumen sambil menyediakan konten standar yang mudah digunakan untuk aplikasi hilir. Struktur semantik yang dipertahankan memungkinkan alur kerja pemrosesan dokumen yang lebih canggih tanpa kehilangan konteks dan hubungan antara elemen dokumen.

Elemen Markdown didukung dalam Analisis Tata Letak

Elemen Markdown berikut disertakan dalam respons API Tata Letak:

  • Paragraf
  • Judul
  • Tabel
  • Perawakan
  • Tanda Seleksi
  • Rumus
  • Kode batang
  • PageNumber/PageHeader/PageFooter
  • Pemutus Halaman
  • KeyValuePairs/Bahasa/Gaya
  • Rentang dan Konten

Paragraf

Paragraf mewakili blok teks kohesif yang memiliki keterkaitan secara semantik. API Tata Letak mempertahankan integritas paragraf dengan:

  • Mempertahankan batas paragraf dengan baris kosong di antara paragraf terpisah
  • Menggunakan hentian baris dalam paragraf untuk mempertahankan struktur visual dokumen asli
  • Mempertahankan alur teks yang tepat yang menghormati urutan baca dokumen asli

Berikut adalah sebuah contoh:

This is paragraph 1.
This is still paragraph 1, even if in another Markdown line.

This is paragraph 2. There is a blank line between paragraph 1 and paragraph 2.

Judul

Judul menata konten dokumen ke dalam struktur hierarkis untuk mempermudah navigasi dan pemahaman. API Tata Letak memiliki kemampuan berikut:

  • Menggunakan sintaks judul Markdown standar dengan 1-6 simbol hash (#) yang sesuai dengan tingkat judul.
  • Mempertahankan penspasian yang tepat dengan dua baris kosong sebelum setiap judul untuk meningkatkan keterbacaan.

Berikut adalah sebuah contoh:

# This is a title

## This is heading 1

### This is heading 2

#### This is heading 3

Tabel

Tabel mempertahankan data terstruktur yang kompleks dalam format yang diatur secara visual. API Tata Letak menggunakan sintaks tabel HTML untuk keakuratan dan kompatibilitas maksimum:

  • Menerapkan markup tabel HTML lengkap (<table>, , <tr><th>, <td>) daripada tabel Markdown standar
  • Mempertahankan sel gabungan dengan atribut HTML rowspan dan colspan.
  • Mempertahankan keterangan tabel dengan <caption> tag untuk mempertahankan konteks dokumen
  • Menangani struktur tabel yang kompleks termasuk header, sel, dan footer
  • Mempertahankan penspasian yang tepat dengan dua baris kosong sebelum setiap tabel untuk meningkatkan keterbacaan
  • Mempertahankan catatan kaki tabel sebagai paragraf terpisah mengikuti tabel

Berikut adalah sebuah contoh:

<table>
<caption>Table 1. This is a demo table</caption>
<tr><th>Header</th><th>Header</th></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Cell</td><td>Cell</td></tr>
<tr><td>Footer</td><td>Footer</td></tr>
</table>
This is the footnote of the table.

Perawakan

API Tata Letak mempertahankan elemen gambar:

  • Merangkum konten gambar dalam <figure> tag untuk mempertahankan perbedaan semantik dari teks di sekitarnya
  • Mempertahankan keterangan gambar dengan <figcaption> tag untuk memberikan konteks penting
  • Mempertahankan catatan kaki gambar sebagai paragraf terpisah yang mengikuti wadah gambar.

Penting

Dalam kasus di mana kami mendeteksi komponen dokumen tertentu seperti judul bagian sebagai bagian dari gambar, output markdown tidak akan menyajikan angka dalam output dan menggunakan informasi untuk analisis struktur dokumen. Untuk kasus-kasus ini, hitung bidang angka di JSON untuk mengambil semua angka.

Berikut adalah sebuah contoh:

<figure>
<figcaption>Figure 2 This is a figure</figcaption>

Values
300
200
100
0

Jan Feb Mar Apr May Jun Months

</figure>

This is footnote if the figure have.

Tanda Seleksi

Tanda pilihan mewakili elemen seperti kotak centang dalam formulir dan dokumen. API Tata Letak:

  • Menggunakan karakter Unicode untuk kejelasan visual: ☒ (dicentang) dan ☐ (tidak dicentang)
  • Memfilter deteksi kotak centang keyakinan rendah (di bawah keyakinan 0,1) untuk meningkatkan keandalan
  • Mempertahankan hubungan semantik antara tanda pilihan dan teks terkaitnya

Rumus

Rumus matematika dipertahankan dengan sintaks yang kompatibel dengan LaTeX yang memungkinkan penyajian ekspresi matematika kompleks:

  • Rumus sebaris diapit dalam tanda dolar tunggal ($...$) untuk mempertahankan alur teks
  • Rumus blok menggunakan tanda dolar ganda ($$...$$) untuk tampilan mandiri
  • Rumus multibaris direpresentasikan sebagai rumus blok berturut-turut, mempertahankan hubungan matematika
  • Penspasian dan pemformatan asli dipertahankan untuk memastikan representasi yang akurat

Berikut adalah contoh rumus sebaris, blok rumus baris tunggal, dan blok rumus beberapa baris:

The mass-energy equivalence formula $E = m c ^ { 2 }$ is an example of an inline formula

$$\frac { n ! } { k ! \left( n - k \right) ! } = \binom { n } { k }$$

$$\frac { p _ { j } } { p _ { 1 } } = \prod _ { k = 1 } ^ { j - 1 } e ^ { - \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } }$$
$$= \exp \left[ - \sum _ { k = 1 } ^ { j - 1 } \beta _ { k , k + 1 } \Delta E _ { k , k + 1 } \right] .$$

Kode batang

Kode batang dan kode QR diwakili menggunakan sintaks gambar Markdown dengan informasi semantik tambahan:

  • Menggunakan sintaks markdown gambar standar dengan atribut deskriptif
  • Menangkap jenis kode batang (kode QR, kode batang, dll.) dan nilai yang dikodekan
  • Mempertahankan hubungan semantik antara kode batang dan konten di sekitarnya

Berikut adalah sebuah contoh:

![QRCode](barcodes/1.1 "https://www.microsoft.com")

![UPCA](barcodes/1.2 "012345678905")
 
![barcode type](barcodes/pagenumber.barcodenumber "barcode value/content")

Nomor Halaman/Header Halaman/Footer Halaman

Elemen metadata halaman menyediakan konteks tentang penomoran halaman dokumen tetapi tidak dimaksudkan untuk ditampilkan sebaris dengan konten utama:

  • Diapit dalam komentar HTML untuk mempertahankan informasi sambil menyembunyikannya dari penyajian Markdown standar
  • Mempertahankan informasi struktur halaman asli yang mungkin berharga untuk rekonstruksi dokumen
  • Memungkinkan aplikasi memahami penomoran halaman dokumen tanpa mengganggu alur konten

Berikut adalah sebuah contoh:

<!-- PageHeader="This is page header" -->

<!-- PageFooter="This is page footer" -->
<!-- PageNumber="1" -->


PageBreak

Untuk dengan mudah mengetahui bagian mana yang termasuk dalam basis halaman pada konten Markdown murni, kami memperkenalkan PageBreak sebagai pemisah halaman

Berikut adalah sebuah contoh:

<!-- PageBreak -->

KeyValuePairs/Bahasa/Gaya

Untuk KeyValuePairs/Language/Style, kami memetakannya ke isi Analytics JSON dan bukan di konten Markdown.

Nota

Untuk informasi selengkapnya tentang Markdown yang saat ini didukung untuk konten pengguna di GitHub.com, lihatSpesifikasi Markdown Khusus GitHub.

Kesimpulan

Elemen Markdown Kecerdasan Dokumen menyediakan cara yang ampuh untuk mewakili struktur dan konten dokumen yang dianalisis. Dengan memahami dan menggunakan elemen Markdown ini dengan benar, Anda dapat meningkatkan alur kerja pemrosesan dokumen dan membangun aplikasi ekstraksi konten yang lebih canggih.

Langkah selanjutnya