Kongsi melalui


Tindakan PDF

Tindakan PDF membolehkan anda mengekstrak imej, teks dan jadual daripada fail PDF dan menyusun halaman untuk mencipta dokumen baharu.

Untuk mengekstrak teks daripada fail PDF, gunakan tindakan Ekstrak teks daripada PDF . Contoh berikut mengekstrak teks daripada julat halaman tertentu bagi fail yang dilindungi kata laluan. Kata laluan ditentukan dalam tetapan Lanjutan .

Untuk mengekstrak teks yang disusun dalam bentuk jadual, dayakan Optimumkan untuk data berstruktur untuk meningkatkan format dan ketepatan keputusan.

Tangkapan skrin Ekstrak teks daripada tindakan PDF.

Untuk mengekstrak jadual daripada fail PDF, gunakan tindakan Ekstrak jadual daripada PDF , pilih fail dan tentukan halaman untuk diekstrak.

Tindakan itu menghasilkan pembolehubah ExtractedPDFTables yang mengandungi senarai maklumat jadual PDF. Untuk mencari maklumat tentang senarai jenis ini, pergi ke Jenis data lanjutan.

Nota

  • Tindakan Ekstrak daripada PDF tidak menggunakan Pengecaman Aksara Optik (OCR), jadi anda tidak boleh mengekstrak teks yang tidak boleh disalin daripada PDF yang diimbas.
  • Pustaka di sebalik tindakan itu kadangkala mengekstrak data PDF tambahan yang bukan jadual. Fungsi ini meminimumkan risiko kehilangan jadual sebenar secara tidak sengaja.

Petikan skrin Ekstrak jadual daripada tindakan PDF.

Selain daripada mengekstrak maklumat daripada fail PDF, anda boleh membuat dokumen PDF baharu daripada fail sedia ada menggunakan Ekstrak halaman fail PDF ke fail PDF baharu tindakan.

Contoh berikut memilih gabungan halaman tertentu dan julat halaman.

Tangkapan skrin Ekstrak halaman fail PDF ke tindakan fail PDF baharu.

Ekstrak teks daripada PDF

Anda boleh mengekstrak teks daripada fail PDF dengan menggunakan tindakan "Ekstrak teks daripada PDF". Dalam sifat tindakan anda boleh menentukan fail PDF sumber dan halaman yang teks harus diekstrak. Di bawah sifat tindakan lanjutan anda boleh menentukan kata laluan sekiranya fail PDF dilindungi dan jika enjin perlu mengoptimumkan untuk data berstruktur atau tidak.

Parameter input

Argumen Pilihan Menerima Nilai Lalai Description
Fail PDF No Fail Fail PDF untuk mengekstrak teks daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks
Halaman untuk diekstrak T/B Semua, Bujang, Julat Semua Menentukan bilangan halaman untuk diekstrak: Semua halaman, satu halaman atau julat halaman
Nombor halaman tunggal No Nilai angka Nombor halaman tunggal untuk mengekstrak teks
Daripada nombor halaman No Nilai angka Nombor halaman pertama daripada julat halaman untuk mengekstrak teks
Hingga nombor halaman No Nilai angka Nombor halaman terakhir daripada julat halaman untuk mengekstrak teks
Kata laluan Ya Input disulitkan langsung atau Nilai teks Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan
Optimumkan untuk data berstruktur T/B Nilai Boolean Salah Tentukan sama ada untuk mengesan tataletak yang diformatkan dalam dokumen dan mengekstrak teks dengan sewajarnya atau tidak

Pemboleh ubah yang dihasilkan

Argumen Jenis Description
ExtractedPDFText Nilai teks Teks yang diekstrak

Pengecualian

Pengecualian Description
Fail PDF tidak wujud Fail tidak wujud pada laluan yang diberikan
Kata Laluan tidak sah Kata laluan yang diberikan tidak sah
Gagal mengekstrak teks Ralat semasa cuba mengekstrak teks

Ekstrak jadual daripada PDF

Anda boleh mengekstrak jadual yang terkandung dalam fail PDF dengan menggunakan tindakan Ekstrak jadual daripada PDF . Dalam sifat tindakan anda boleh menentukan fail PDF dan julat halaman yang jadual akan diekstrak. Di bawah sifat tindakan lanjutan anda boleh menentukan kata laluan sekiranya fail PDF dilindungi, tentukan sama ada jadual mempunyai pengepala atau tidak, dan akhirnya jika jadual yang merentas jidar halaman harus digabungkan atau tidak.

Parameter input

Argumen Pilihan Menerima Nilai Lalai Description
Fail PDF No Fail Fail PDF untuk mengekstrak jadual daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks
Halaman untuk diekstrak T/B Semua, Bujang, Julat Semua Menentukan bilangan halaman untuk diekstrakkan jadual: semua halaman, halaman tunggal atau julat halaman
Nombor halaman tunggal No Nilai angka Bilangan halaman tunggal untuk diekstrakkan jadual
Daripada nombor halaman No Nilai angka Nombor halaman pertama daripada julat halaman untuk diekstrakkan jadual
Hingga nombor halaman No Nilai angka Nombor halaman terakhir daripada julat halaman untuk diekstrakkan jadual
Kata laluan Ya Input disulitkan langsung atau Nilai teks Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan
Gabungkan jadual yang merentas jidar halaman T/B Nilai Boolean Benar Menentukan sama ada untuk menggabungkan jadual yang merentas jidar halaman dalam julat halaman yang ditentukan atau tidak
Baris pertama mengandungi nama lajur T/B Nilai Boolean Benar Menentukan sama ada baris pertama jadual mengandungi nama lajur atau tidak

Pemboleh ubah yang dihasilkan

Argumen Jenis Description
ExtractedPDFTables Senarai maklumat jadual PDF Jadual yang diekstrak dengan maklumatnya sebagai senarai

Pengecualian

Pengecualian Description
Fail PDF tidak wujud Fail tidak wujud pada laluan yang diberikan
Kata Laluan tidak sah Kata laluan yang diberikan tidak sah
Gagal mengekstrak jadual Ralat semasa cuba mengekstrak jadual

Ekstrak imej daripada PDF

Untuk mengekstrak imej daripada fail PDF, anda boleh menggunakan tindakan Ekstrak imej daripada PDF . Dalam parameter tindakan anda boleh menentukan fail PDF dan halaman untuk mengekstrak imej, konvensyen penamaan imej yang dikeluarkan dan lokasi sasaran imej yang disimpan. Anda juga boleh menentukan kata laluan jika fail PDF dilindungi di bawah tetapan lanjutan.

Parameter input

Argumen Pilihan Menerima Nilai Lalai Description
Fail PDF No Fail Fail PDF untuk mengekstrak imej daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks
Kata laluan Ya Input disulitkan langsung atau Nilai teks Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan
Halaman untuk diekstrak T/B Semua, Bujang, Julat Semua Menentukan bilangan halaman untuk diekstrak: Semua halaman, satu halaman atau julat halaman
Nombor halaman tunggal No Nilai angka Nombor halaman tunggal untuk mengekstrak imej
Daripada nombor halaman No Nilai angka Nombor halaman pertama daripada julat halaman untuk mengekstrak imej
Hingga nombor halaman No Nilai angka Nombor halaman terakhir daripada julat halaman untuk mengekstrak imej
Nama imej No Nilai teks Bagaimana nama imej bermula. Contoh nama imej yang diekstrak: GivenName_1, GivenName_2
Simpan imej kepada No folder Folder untuk menyimpan imej yang diekstrak sebagai fail png

Pemboleh ubah yang dihasilkan

Tindakan ini tidak menghasilkan sebarang pembolehubah.

Pengecualian

Pengecualian Description
Kata Laluan tidak sah Kata laluan yang diberikan tidak sah
Gagal mengekstrak imej Menunjukkan bahawa ralat berlaku semasa mengekstrak imej daripada halaman PDF yang diberikan
Folder tidak wujud Menunjukkan bahawa folder tidak wujud
Fail PDF tidak wujud Fail tidak wujud pada laluan yang diberikan

Ekstrak halaman fail PDF kepada fail PDF baharu

Anda boleh mencipta fail PDF baharu dengan mengekstrak halaman daripada fail PDF sedia ada dengan menggunakan halaman fail PDF kepada tindakan fail PDF baharu. Dalam parameter tindakan anda boleh menentukan fail PDF untuk mengekstrak halaman, halaman yang akan diekstrak, lokasi fail PDF baharu dan perkara yang perlu berlaku jika fail dengan nama dan sambungan yang sama sudah wujud. Akhir sekali, di bawah sifat lanjutan anda boleh menentukan kata laluan sekiranya PDF sumber dilindungi.

Parameter input

Argumen Pilihan Menerima Nilai Lalai Description
Fail PDF No Fail Fail PDF untuk mengekstrak halaman daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks
Kata laluan Ya Input disulitkan langsung atau Nilai teks Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan
Pemilihan halaman No Nilai teks Nombor indeks halaman yang perlu disimpan (contohnya, 1,3,17-24)
Laluan PDF yang diekstrak No Fail Laluan untuk menyimpan fail PDF yang diekstrak
Jika fail wujud T/B Timpang, Jangan timpa, Tambah akhiran berjujukan Tambah akhiran jujukan Menentukan perkara yang perlu dilakukan jika fail PDF output sudah wujud

Pemboleh ubah yang dihasilkan

Argumen Taip Description
DiekstrakPDF Fail Fail PDF baharu

Pengecualian

Pengecualian Description
Kata Laluan tidak sah Kata laluan yang diberikan tidak sah
Fail PDF tidak wujud Fail tidak wujud pada laluan yang diberikan
Halaman di luar sempadan Menunjukkan bahawa satu atau lebih halaman berada di luar had fail PDF
Pemilihan halaman tidak sah Menunjukkan bahawa halaman yang diberikan tidak sah untuk fail PDF
Gagal mengekstrak PDF baharu Menunjukkan bahawa ralat berlaku semasa cuba mengekstrak PDF baharu

Gabungkan fail PDF

Menggabungkan berbilang fail PDF menjadi fail yang baharu.

Anda boleh menggunakan tindakan Gabungkan fail PDF untuk mengambil dua atau lebih fail PDF dan menggabungkannya menjadi satu fail. Fail yang akan digabungkan boleh disediakan sama ada dalam bentuk senarai, atau disertakan dalam petikan berganda dan dipisahkan oleh pembatas. Anda juga boleh memberikan kata laluan untuk fail PDF, sekiranya ia dilindungi kata laluan.

Parameter input

Argumen Pilihan Menerima Nilai Lalai Description
Fail PDF No SenaraiFail Fail untuk digabungkan. Sertakan berbilang fail dalam petikan berganda (") dan pisahkannya dengan pembatas, atau gunakan senarai fail
Laluan PDF yang digabungkan No Fail Laluan untuk menyimpan fail PDF yang digabungkan
Jika fail wujud T/B Timpang, Jangan timpa, Tambah akhiran berjujukan Tambah akhiran jujukan Menentukan perkara yang perlu dilakukan jika fail destinasi sudah wujud
Kata Laluan Ya Input disulitkan langsung atau Nilai teks Kata laluan yang dibatasi. Susunan hendaklah sama dengan susunan PDF input. Biarkan ini kosong jika PDF tidak dilindungi kata laluan
Pembatas No Nilai teks , Pembatas kata laluan tersuai. Pemisah ini tidak sepatutnya menjadi sebahagian daripada mana-mana kata laluan

Pemboleh ubah yang dihasilkan

Argumen Taip Description
DigabungkanPDF Fail Fail PDF yang digabungkan

Pengecualian

Pengecualian Description
Fail PDF tidak wujud Fail tidak wujud pada laluan yang diberikan
Kata Laluan tidak sah Kata laluan yang diberikan tidak sah
Gagal menggabungkan fail PDF Menunjukkan bahawa ralat telah berlaku semasa menggabungkan fail

Nota

Apabila anda menggunakan tindakan "Gabungkan Fail PDF", jangan tetapkan destinasi untuk PDF yang digabungkan sebagai salah satu fail asal yang digabungkan. Ini boleh menyebabkan tindakan gagal dan mungkin memadamkan fail asal. Untuk melindungi dokumen asal anda, sentiasa pilih lokasi fail baharu atau yang sedia ada yang bukan antara fail asal yang digabungkan untuk output PDF yang digabungkan.