Bagikan melalui


Menggunakan model pemrosesan dokumen di Power Automate

Catatan

Sejak Mei 2025, nama tindakan Ekstrak informasi dari dokumen adalah Proses dokumen.

Untuk menggunakan model Power Automate pemrosesan dokumen, ikuti langkah-langkah berikut.

  1. Masuk Power Automate.

  2. Pilih +Buat>alur cloud instan.

  3. Pilih Buat alur> secara manual.

  4. Pilih Memicu alur secara manual, lalu pilih +Tambahkan File>input di panel kiri.

  5. Di perancang, pilih + setelah Memicu alur secara manual, lalu pilih Proses dokumen dalam daftar tindakan.

  6. Pilih model pemrosesan dokumen yang ingin Anda gunakan, lalu pilih jenis dokumen.

  7. Di bidang Formulir , tambahkan File Content dari pemicu.

    Tangkapan layar 'Konten File' di bidang 'Formulir'.

  8. Dalam tindakan berturut-turut, Anda dapat menggunakan salah satu bidang dan tabel yang diekstrak oleh AI Builder model. Misalnya, katakanlah model Anda dilatih untuk mengekstrak InvoiceID nilai, dan nilainya Total . Anda juga ingin mempostingnya ke Microsoft Teams saluran setelah AI Builder mengekstraknya dari dokumen. Anda harus menambahkan pesan Posting dalam tindakan obrolan atau saluran , lalu bidang output dari AI Builder model.

    Catatan

    • Untuk mengambil nilai bidang, pilih <nilai> field_name.
    • Untuk mengambil skor keyakinan untuk item yang diekstrak, pilih <skor> keyakinan field_name.

    Tangkapan layar

Selamat! Anda membuat alur cloud yang menggunakan model pemrosesan AI Builder dokumen. Pilih Simpan di kanan atas, lalu pilih Uji untuk mencoba alur cloud Anda.

Rentang halaman

Untuk dokumen yang memiliki beberapa halaman, dimungkinkan untuk menentukan rentang halaman yang akan diproses.

  1. Pada kartu Proses dokumen , pilih Parameter lanjutan, lalu pilih Halaman.

  2. Dalam parameter Halaman , masukkan nilai halaman atau rentang halaman. Contoh: 1 atau 3-5.

    Tangkapan layar bidang Halaman tempat Anda memasukkan rentang halaman.

Catatan

Jika Anda memiliki dokumen besar hanya dengan satu formulir, kami sangat menyarankan Anda menggunakan parameter Pages . Melakukan ini dapat mengurangi biaya prediksi model, yang dapat meningkatkan performa. Namun, rentang halaman harus berisi formulir unik agar tindakan mengembalikan data yang benar.

Contoh: Dokumen berisi formulir pertama di halaman 2 dan formulir kedua yang mencakup halaman 3 dan 4:

  • Jika Anda memasukkan rentang halaman 2, itu akan mengembalikan data formulir pertama.
  • Jika Anda memasukkan rentang halaman 3-4, itu hanya mengembalikan data formulir kedua.
  • Jika Anda memasukkan rentang halaman 2-4, itu hanya mengembalikan sebagian data dari formulir pertama dan kedua (harus dihindari).

Parameter input

Nama Wajib Tipe Description Values
AI Model Ya model Model pemrosesan dokumen untuk digunakan untuk analisis Model pemrosesan dokumen yang dilatih dan diterbitkan
Jenis dokumen Ya daftar Jenis file formulir yang akan dianalisis Dokumen PDF (.pdf), Gambar JPEG (.jpeg), Gambar PNG (.png)
Bentuk Ya file Formulir untuk diproses
Halaman No string Rentang halaman untuk diproses

Parameter output

Nama Tipe Description Values
{field} nilai string Nilai yang diekstraksi oleh model AI
{field} Skor kepercayaan diri mengapung Seberapa yakin model dalam prediksinya Nilai dalam kisaran 0 hingga 1. Nilai yang mendekati 1 menunjukkan keyakinan yang lebih besar bahwa nilai yang diekstraksi akurat
{table}{column} nilai string Nilai yang diekstraksi oleh model AI untuk sel dalam tabel
{table}{column} Skor kepercayaan diri mengapung Seberapa yakin model dalam prediksinya Nilai dalam kisaran 0 hingga 1. Nilai mendekati 1 menunjukkan keyakinan yang lebih besar bahwa nilai sel yang diekstraksi akurat

Catatan

  • Lebih banyak parameter keluaran mungkin diusulkan seperti koordinat bidang, poligon, kotak pembatas, dan nomor halaman. Ini tidak terdaftar dengan sengaja karena dimaksudkan untuk penggunaan lanjutan.

  • Koordinat direpresentasikan sebagai persentase tinggi dan lebar dokumen, yang berasal dari sudut kiri atas. Misalnya, jika koordinat X = 0,10 dan Y = 0,20 diberikan, ini menandakan lokasi pada 10% lebar dokumen di sepanjang sumbu X dan 20% dari tingginya di sepanjang sumbu Y, keduanya diukur dari sudut kiri atas.

Kasus penggunaan umum

Mengulangi output tabel pemrosesan dokumen di Power Automate

Untuk mengilustrasikan prosedur ini, kami menggunakan contoh berikut di mana kami melatih model pemrosesan dokumen untuk mengekstrak tabel yang kami beri nama Item dengan tiga kolom: Kuantitas, Deskripsi , dan Total. Kami ingin menyimpan setiap item baris dari tabel ke dalam file Excel.

Tangkapan layar tabel yang diekstrak dengan pemrosesan dokumen.

  1. Pilih bidang yang ingin Anda tulis sel untuk tabel. Panel konten dinamis terbuka yang menunjukkan semua yang diketahui oleh model pemrosesan dokumen cara mengekstraknya. Telusuri {nama tabel Anda, nilai} {} namakolom Anda. Contoh kami menggunakan Items Quantity value.

    Tangkapan layar layar 'Proses dan simpan informasi dari formulir'.

  2. Setelah Anda menambahkan nilai ini, tindakan tempat Anda menambahkannya secara otomatis dimasukkan ke dalam Terapkan ke setiap kontrol. Dengan cara ini, setiap baris dalam tabel diproses saat alur cloud berjalan.

  3. Terus tambahkan kolom yang ingin Anda ulangi.

    Tangkapan layar kartu 'Tambahkan baris ke dalam tabel'.

Proses output kotak centang di Power Automate

Nilai kotak centang berjenis Boolean: true berarti kotak centang ditandai sebagai dipilih dalam dokumen, dan false berarti tidak.

Salah satu cara Anda dapat memeriksa nilainya adalah dengan tindakan Kondisi. Jika nilai kotak centang sama dengan true, jalankan satu tindakan. Jika nilainya, false jalankan tindakan yang berbeda. Ilustrasi berikut menunjukkan contoh.

Tangkapan layar mengambil nilai kotak centang dalam suatu kondisi.

Opsi lainnya adalah memetakan true/false output kotak centang ke nilai lain pilihan Anda dengan menggunakan ekspresi if . Misalnya, Anda mungkin memiliki kolom dalam file Excel tempat Anda ingin menulis 'Prioritas' jika salah satu kotak centang dalam dokumen dipilih, atau 'Non-prioritas' jika tidak dipilih. Untuk melakukan ini, Anda dapat menggunakan ekspresi berikut: if(<document processing output>, 'Priority', 'Non-priority'). Animasi berikut menunjukkan contoh.

Animasi yang menunjukkan cara menggunakan ekspresi untuk memetakan nilai Boolean yang dikembalikan oleh kotak centang.

Menghapus simbol mata uang (€, $,...) dalam output pemrosesan dokumen di Power Automate

Sebagai ilustrasi, nilai Total yang diekstraksi oleh model pemrosesan dokumen mungkin memiliki simbol mata uang, misalnya, $54. Untuk menghapus tanda $, atau simbol lain yang ingin Anda hilangkan, gunakan ekspresi replace untuk menghapusnya. Berikut caranya:

replace(<document processing output>, '$', '')

Animasi ekspresi Ganti mata uang.

Mengonversi string output pemrosesan dokumen menjadi angka di Power Automate

AI Builder Pemrosesan dokumen mengembalikan semua nilai yang diekstrak sebagai string. Jika tujuan tempat Anda ingin menyimpan nilai yang diekstrak oleh AI Builder pemrosesan dokumen memerlukan angka, Anda dapat mengonversi nilai menjadi angka menggunakan ekspresi int atau float . Gunakan int jika angka tidak memiliki desimal. Gunakan float jika angka memiliki desimal. Berikut adalah cara untuk melakukannya:

float('<document processing output>')

Animasi yang menunjukkan cara menambahkan ekspresi 'Konversi ke angka' ke bidang input tindakan di alur cloud Anda.

Hapus spasi kosong dalam output pemrosesan dokumen di Power Automate

Untuk menghapus spasi kosong dari nilai output, gunakan fungsi ganti :

replace(<document processing output>, ' ', '')

Animasi ekspresi Ganti spasi.

Mengonversi string output pemrosesan dokumen menjadi tanggal di Power Automate

AI Builder Pemrosesan dokumen mengembalikan semua output sebagai string. Jika tujuan tempat Anda ingin menyimpan nilai yang diekstrak oleh pemrosesan dokumen harus dalam format tanggal, Anda dapat mengonversi nilai yang berisi tanggal ke dalam format tanggal. Lakukan ini dengan menggunakan ekspresi formatDateTime . Berikut adalah cara untuk melakukannya:

formatDateTime(<document processing output>)

Animasi ekspresi formatDateTime.

Memfilter tanda tangan email dari alur sehingga tidak diproses oleh model pemrosesan dokumen (Microsoft 365 Outlook)

Untuk email masuk dari Microsoft 365 konektor Outlook, tanda tangan email diambil sebagai Power Automate lampiran. Untuk mencegah ini diproses oleh model pemrosesan dokumen, tambahkan kondisi ke alur cloud Anda yang memeriksa apakah output dari Microsoft 365 konektor Outlook bernama Lampiran adalah Sebaris sama dengan false. Di cabang Jika ya dari kondisi, tambahkan tindakan pemrosesan dokumen. Dengan ini, hanya lampiran email yang bukan tanda tangan sebaris yang diproses.

Tangkapan layar kondisi lampiran Filter.