Bagikan melalui


Keterampilan Tata Letak Dokumen

Catatan

Fitur ini masih dalam pratinjau umum. Pratinjau ini disediakan tanpa perjanjian tingkat layanan, dan tidak disarankan untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas. Untuk mengetahui informasi selengkapnya, lihat Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure.

Keterampilan Tata Letak Dokumen menganalisis dokumen untuk mengekstrak wilayah yang menarik dan hubungan antar-hubungannya untuk menghasilkan representasi sintis dokumen dalam format Markdown. Keterampilan ini menggunakan model tata letak Kecerdasan Dokumen yang disediakan dalam Kecerdasan Dokumen Azure AI.

Artikel ini adalah dokumentasi referensi untuk keterampilan Tata Letak Dokumen. Untuk informasi penggunaan, lihat Penggugusan dan vektorisasi yang sadar struktur.

Keterampilan Tata Letak Dokumen memanggil pratinjau Publik Kecerdasan Dokumen versi 2024-07-31-preview. Saat ini hanya tersedia di wilayah Azure berikut:

  • AS Timur
  • West US2
  • Eropa Barat
  • AS Tengah Bagian Utara

Format file yang didukung meliputi:

  • PDF.
  • .JPEG
  • .JPG
  • .PNG
  • .BMP
  • .TIFF
  • .DOCX
  • .XLSX
  • .PPTX
  • .HTML

Catatan

Keterampilan ini terikat ke layanan Azure AI dan memerlukan sumber daya yang dapat ditagih untuk transaksi yang melebihi 20 dokumen per pengindeks per hari. Eksekusi keterampilan bawaan dibebankan pada harga prabayar layanan Azure AI yang ada.

@odata.type

Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Batasan data

  • Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
  • Bahkan jika ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat azure AI Document Intelligence berbayar (S0) dan 4 MB untuk tingkat Azure AI Document Intelligence free (F0), pengindeksan tunduk pada batas pengindeks tingkat layanan pencarian Anda.
  • Dimensi gambar harus antara 50 piksel x 50 piksel atau 10.000 piksel x 10.000 piksel.
  • Jika PDF Anda dikunci kata sandi, hapus kunci sebelum menjalankan pengindeks.

Bahasa yang didukung

Lihat bahasa yang didukung model tata letak Azure AI Document Intelligence untuk teks yang dicetak.

Batasan

Selama pratinjau publik, keterampilan ini memiliki batasan berikut:

  • Keterampilan tidak dapat mengekstrak gambar yang disematkan dalam dokumen.
  • Nomor halaman tidak disertakan dalam output yang dihasilkan.
  • Keterampilan ini tidak cocok untuk dokumen besar yang membutuhkan lebih dari 5 menit pemrosesan dalam model tata letak Kecerdasan Dokumen AI. Keterampilan akan kehabisan waktu, tetapi biaya masih akan berlaku untuk sumber daya multi-layanan Layanan AI jika dilampirkan ke set keterampilan untuk tujuan penagihan. Pastikan dokumen dioptimalkan untuk tetap berada dalam batas pemrosesan untuk menghindari biaya yang tidak perlu.

Parameter keterampilan

Parameternya peka huruf besar/kecil.

Nama Parameter Nilai yang diizinkan Deskripsi
outputMode oneToMany Mengontrol kardinalitas output yang dihasilkan oleh keterampilan.
markdownHeaderDepth h1, , h2h3, h4, , h5,h6(default) Parameter ini menjelaskan tingkat bersarang terdalam yang harus dipertimbangkan. Misalnya, jika markdownHeaderDepth ditunjukkan sebagai "h3" bagian markdown apa pun yang lebih dalam dari h3 (yaitu, #### dan lebih dalam) dianggap sebagai "konten" yang perlu ditambahkan ke tingkat mana pun induknya berada.

Input keterampilan

Masukkan nama Deskripsi
file_data File yang kontennya harus diekstrak.

Input "file_data" harus berupa objek yang didefinisikan sebagai:

{
  "$type": "file",
  "data": "BASE64 encoded string of the file"
}

Atau, dapat didefinisikan sebagai:

{
  "$type": "file",
  "url": "URL to download file",
  "sasToken": "OPTIONAL: SAS token for authentication if the URL provided is for a file in blob storage"
}

Objek referensi file dapat dihasilkan dengan salah satu cara berikut:

  • allowSkillsetToReadFileData Mengatur parameter pada definisi pengindeks Anda ke true. Pengaturan ini membuat jalur /document/file_data yang merupakan objek yang mewakili data file asli yang diunduh dari sumber data blob Anda. Parameter ini hanya berlaku untuk file di penyimpanan Azure Blob.

  • Memiliki keterampilan kustom yang mengembalikan objek JSON yang ditentukan yang menyediakan $type, , dataatau url dan sastoken. Parameter $type harus diatur ke file, dan data harus berupa array byte dasar yang dikodekan 64 dari konten file. Parameter url harus berupa URL yang valid dengan akses untuk mengunduh file di lokasi tersebut.

Output keterampilan

Nama output Deskripsi
markdown_document Kumpulan objek "bagian", yang mewakili setiap bagian individual dalam dokumen Markdown.

Definisi sampel

{
  "skills": [
    {
      "description": "Analyze a document",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany", 
      "markdownHeaderDepth": "h3", 
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/file_data"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document", 
          "targetName": "markdown_document" 
        }
      ]
    }
  ]
}

Sampel output

{
  "markdown_document": [
    { 
      "content": "Hi this is Jim \r\nHi this is Joe", 
      "sections": { 
        "h1": "Foo", 
        "h2": "Bar", 
        "h3": "" 
      },
      "ordinal_position": 0
    }, 
    { 
      "content": "Hi this is Lance",
      "sections": { 
         "h1": "Foo", 
         "h2": "Bar", 
         "h3": "Boo" 
      },
      "ordinal_position": 1,
    } 
  ] 
}

Nilai markdownHeaderDepth mengontrol jumlah kunci dalam kamus "bagian". Dalam contoh definisi keterampilan, karena markdownHeaderDepth adalah "h3", ada tiga kunci dalam kamus "bagian": h1, h2, h3.

Lihat juga