Keterampilan Tata Letak Dokumen
Catatan
Fitur ini masih dalam pratinjau umum. Pratinjau ini disediakan tanpa perjanjian tingkat layanan, dan tidak disarankan untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas. Untuk mengetahui informasi selengkapnya, lihat Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure.
Keterampilan Tata Letak Dokumen menganalisis dokumen untuk mengekstrak wilayah yang menarik dan hubungan antar-hubungannya untuk menghasilkan representasi sintis dokumen dalam format Markdown. Keterampilan ini menggunakan model tata letak Kecerdasan Dokumen yang disediakan dalam Kecerdasan Dokumen Azure AI.
Artikel ini adalah dokumentasi referensi untuk keterampilan Tata Letak Dokumen. Untuk informasi penggunaan, lihat Penggugusan dan vektorisasi yang sadar struktur.
Keterampilan Tata Letak Dokumen memanggil pratinjau Publik Kecerdasan Dokumen versi 2024-07-31-preview. Saat ini hanya tersedia di wilayah Azure berikut:
- AS Timur
- West US2
- Eropa Barat
- AS Tengah Bagian Utara
Format file yang didukung meliputi:
- PDF.
- .JPEG
- .JPG
- .PNG
- .BMP
- .TIFF
- .DOCX
- .XLSX
- .PPTX
- .HTML
Catatan
Keterampilan ini terikat ke layanan Azure AI dan memerlukan sumber daya yang dapat ditagih untuk transaksi yang melebihi 20 dokumen per pengindeks per hari. Eksekusi keterampilan bawaan dibebankan pada harga prabayar layanan Azure AI yang ada.
@odata.type
Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill
Batasan data
- Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
- Bahkan jika ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat azure AI Document Intelligence berbayar (S0) dan 4 MB untuk tingkat Azure AI Document Intelligence free (F0), pengindeksan tunduk pada batas pengindeks tingkat layanan pencarian Anda.
- Dimensi gambar harus antara 50 piksel x 50 piksel atau 10.000 piksel x 10.000 piksel.
- Jika PDF Anda dikunci kata sandi, hapus kunci sebelum menjalankan pengindeks.
Bahasa yang didukung
Lihat bahasa yang didukung model tata letak Azure AI Document Intelligence untuk teks yang dicetak.
Batasan
Selama pratinjau publik, keterampilan ini memiliki batasan berikut:
- Keterampilan tidak dapat mengekstrak gambar yang disematkan dalam dokumen.
- Nomor halaman tidak disertakan dalam output yang dihasilkan.
- Keterampilan ini tidak cocok untuk dokumen besar yang membutuhkan lebih dari 5 menit pemrosesan dalam model tata letak Kecerdasan Dokumen AI. Keterampilan akan kehabisan waktu, tetapi biaya masih akan berlaku untuk sumber daya multi-layanan Layanan AI jika dilampirkan ke set keterampilan untuk tujuan penagihan. Pastikan dokumen dioptimalkan untuk tetap berada dalam batas pemrosesan untuk menghindari biaya yang tidak perlu.
Parameter keterampilan
Parameternya peka huruf besar/kecil.
Nama Parameter | Nilai yang diizinkan | Deskripsi |
---|---|---|
outputMode |
oneToMany |
Mengontrol kardinalitas output yang dihasilkan oleh keterampilan. |
markdownHeaderDepth |
h1 , , h2 h3 , h4 , , h5 ,h6(default) |
Parameter ini menjelaskan tingkat bersarang terdalam yang harus dipertimbangkan. Misalnya, jika markdownHeaderDepth ditunjukkan sebagai "h3" bagian markdown apa pun yang lebih dalam dari h3 (yaitu, #### dan lebih dalam) dianggap sebagai "konten" yang perlu ditambahkan ke tingkat mana pun induknya berada. |
Input keterampilan
Masukkan nama | Deskripsi |
---|---|
file_data |
File yang kontennya harus diekstrak. |
Input "file_data" harus berupa objek yang didefinisikan sebagai:
{
"$type": "file",
"data": "BASE64 encoded string of the file"
}
Atau, dapat didefinisikan sebagai:
{
"$type": "file",
"url": "URL to download file",
"sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}
Objek referensi file dapat dihasilkan dengan salah satu cara berikut:
allowSkillsetToReadFileData
Mengatur parameter pada definisi pengindeks Anda ke true. Pengaturan ini membuat jalur/document/file_data
yang merupakan objek yang mewakili data file asli yang diunduh dari sumber data blob Anda. Parameter ini hanya berlaku untuk file di penyimpanan Azure Blob.Memiliki keterampilan kustom yang mengembalikan objek JSON yang ditentukan yang menyediakan
$type
, ,data
atauurl
dansastoken
. Parameter$type
harus diatur kefile
, dandata
harus berupa array byte dasar yang dikodekan 64 dari konten file. Parameterurl
harus berupa URL yang valid dengan akses untuk mengunduh file di lokasi tersebut.
Output keterampilan
Nama output | Deskripsi |
---|---|
markdown_document |
Kumpulan objek "bagian", yang mewakili setiap bagian individual dalam dokumen Markdown. |
Definisi sampel
{
"skills": [
{
"description": "Analyze a document",
"@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
"context": "/document",
"outputMode": "oneToMany",
"markdownHeaderDepth": "h3",
"inputs": [
{
"name": "file_data",
"source": "/document/file_data"
}
],
"outputs": [
{
"name": "markdown_document",
"targetName": "markdown_document"
}
]
}
]
}
Sampel output
{
"markdown_document": [
{
"content": "Hi this is Jim \r\nHi this is Joe",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": ""
},
"ordinal_position": 0
},
{
"content": "Hi this is Lance",
"sections": {
"h1": "Foo",
"h2": "Bar",
"h3": "Boo"
},
"ordinal_position": 1,
}
]
}
Nilai markdownHeaderDepth
mengontrol jumlah kunci dalam kamus "bagian". Dalam contoh definisi keterampilan, karena markdownHeaderDepth
adalah "h3", ada tiga kunci dalam kamus "bagian": h1, h2, h3.