Nota
Capaian ke halaman ini memerlukan kebenaran. Anda boleh cuba mendaftar masuk atau menukar direktori.
Capaian ke halaman ini memerlukan kebenaran. Anda boleh cuba menukar direktori.
Tindakan PDF membolehkan anda mengekstrak imej, teks dan jadual daripada fail PDF dan menyusun halaman untuk mencipta dokumen baharu.
Untuk mengekstrak teks daripada fail PDF, gunakan tindakan Ekstrak teks daripada PDF . Contoh berikut mengekstrak teks daripada julat halaman tertentu bagi fail yang dilindungi kata laluan. Kata laluan ditentukan dalam tetapan Lanjutan .
Untuk mengekstrak teks yang disusun dalam bentuk jadual, dayakan Optimumkan untuk data berstruktur untuk meningkatkan format dan ketepatan keputusan.
Untuk mengekstrak jadual daripada fail PDF, gunakan tindakan Ekstrak jadual daripada PDF , pilih fail dan tentukan halaman untuk diekstrak.
Tindakan itu menghasilkan pembolehubah ExtractedPDFTables yang mengandungi senarai maklumat jadual PDF. Untuk mencari maklumat tentang senarai jenis ini, pergi ke Jenis data lanjutan.
Nota
- Tindakan Ekstrak daripada PDF tidak menggunakan Pengecaman Aksara Optik (OCR), jadi anda tidak boleh mengekstrak teks yang tidak boleh disalin daripada PDF yang diimbas.
- Pustaka di sebalik tindakan itu kadangkala mengekstrak data PDF tambahan yang bukan jadual. Fungsi ini meminimumkan risiko kehilangan jadual sebenar secara tidak sengaja.
Selain daripada mengekstrak maklumat daripada fail PDF, anda boleh membuat dokumen PDF baharu daripada fail sedia ada menggunakan Ekstrak halaman fail PDF ke fail PDF baharu tindakan.
Contoh berikut memilih gabungan halaman tertentu dan julat halaman.
Ekstrak teks daripada PDF
Anda boleh mengekstrak teks daripada fail PDF dengan menggunakan tindakan "Ekstrak teks daripada PDF". Dalam sifat tindakan anda boleh menentukan fail PDF sumber dan halaman yang teks harus diekstrak. Di bawah sifat tindakan lanjutan anda boleh menentukan kata laluan sekiranya fail PDF dilindungi dan jika enjin perlu mengoptimumkan untuk data berstruktur atau tidak.
Parameter input
Argumen | Pilihan | Menerima | Nilai Lalai | Description |
---|---|---|---|---|
Fail PDF | No | Fail | Fail PDF untuk mengekstrak teks daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks | |
Halaman untuk diekstrak | T/B | Semua, Bujang, Julat | Semua | Menentukan bilangan halaman untuk diekstrak: Semua halaman, satu halaman atau julat halaman |
Nombor halaman tunggal | No | Nilai angka | Nombor halaman tunggal untuk mengekstrak teks | |
Daripada nombor halaman | No | Nilai angka | Nombor halaman pertama daripada julat halaman untuk mengekstrak teks | |
Hingga nombor halaman | No | Nilai angka | Nombor halaman terakhir daripada julat halaman untuk mengekstrak teks | |
Kata laluan | Ya | Input disulitkan langsung atau Nilai teks | Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan | |
Optimumkan untuk data berstruktur | T/B | Nilai Boolean | Salah | Tentukan sama ada untuk mengesan tataletak yang diformatkan dalam dokumen dan mengekstrak teks dengan sewajarnya atau tidak |
Pemboleh ubah yang dihasilkan
Argumen | Jenis | Description |
---|---|---|
ExtractedPDFText | Nilai teks | Teks yang diekstrak |
Pengecualian
Pengecualian | Description |
---|---|
Fail PDF tidak wujud | Fail tidak wujud pada laluan yang diberikan |
Kata Laluan tidak sah | Kata laluan yang diberikan tidak sah |
Gagal mengekstrak teks | Ralat semasa cuba mengekstrak teks |
Ekstrak jadual daripada PDF
Anda boleh mengekstrak jadual yang terkandung dalam fail PDF dengan menggunakan tindakan Ekstrak jadual daripada PDF . Dalam sifat tindakan anda boleh menentukan fail PDF dan julat halaman yang jadual akan diekstrak. Di bawah sifat tindakan lanjutan anda boleh menentukan kata laluan sekiranya fail PDF dilindungi, tentukan sama ada jadual mempunyai pengepala atau tidak, dan akhirnya jika jadual yang merentas jidar halaman harus digabungkan atau tidak.
Parameter input
Argumen | Pilihan | Menerima | Nilai Lalai | Description |
---|---|---|---|---|
Fail PDF | No | Fail | Fail PDF untuk mengekstrak jadual daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks | |
Halaman untuk diekstrak | T/B | Semua, Bujang, Julat | Semua | Menentukan bilangan halaman untuk diekstrakkan jadual: semua halaman, halaman tunggal atau julat halaman |
Nombor halaman tunggal | No | Nilai angka | Bilangan halaman tunggal untuk diekstrakkan jadual | |
Daripada nombor halaman | No | Nilai angka | Nombor halaman pertama daripada julat halaman untuk diekstrakkan jadual | |
Hingga nombor halaman | No | Nilai angka | Nombor halaman terakhir daripada julat halaman untuk diekstrakkan jadual | |
Kata laluan | Ya | Input disulitkan langsung atau Nilai teks | Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan | |
Gabungkan jadual yang merentas jidar halaman | T/B | Nilai Boolean | Benar | Menentukan sama ada untuk menggabungkan jadual yang merentas jidar halaman dalam julat halaman yang ditentukan atau tidak |
Baris pertama mengandungi nama lajur | T/B | Nilai Boolean | Benar | Menentukan sama ada baris pertama jadual mengandungi nama lajur atau tidak |
Pemboleh ubah yang dihasilkan
Argumen | Jenis | Description |
---|---|---|
ExtractedPDFTables | Senarai maklumat jadual PDF | Jadual yang diekstrak dengan maklumatnya sebagai senarai |
Pengecualian
Pengecualian | Description |
---|---|
Fail PDF tidak wujud | Fail tidak wujud pada laluan yang diberikan |
Kata Laluan tidak sah | Kata laluan yang diberikan tidak sah |
Gagal mengekstrak jadual | Ralat semasa cuba mengekstrak jadual |
Ekstrak imej daripada PDF
Untuk mengekstrak imej daripada fail PDF, anda boleh menggunakan tindakan Ekstrak imej daripada PDF . Dalam parameter tindakan anda boleh menentukan fail PDF dan halaman untuk mengekstrak imej, konvensyen penamaan imej yang dikeluarkan dan lokasi sasaran imej yang disimpan. Anda juga boleh menentukan kata laluan jika fail PDF dilindungi di bawah tetapan lanjutan.
Parameter input
Argumen | Pilihan | Menerima | Nilai Lalai | Description |
---|---|---|---|---|
Fail PDF | No | Fail | Fail PDF untuk mengekstrak imej daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks | |
Kata laluan | Ya | Input disulitkan langsung atau Nilai teks | Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan | |
Halaman untuk diekstrak | T/B | Semua, Bujang, Julat | Semua | Menentukan bilangan halaman untuk diekstrak: Semua halaman, satu halaman atau julat halaman |
Nombor halaman tunggal | No | Nilai angka | Nombor halaman tunggal untuk mengekstrak imej | |
Daripada nombor halaman | No | Nilai angka | Nombor halaman pertama daripada julat halaman untuk mengekstrak imej | |
Hingga nombor halaman | No | Nilai angka | Nombor halaman terakhir daripada julat halaman untuk mengekstrak imej | |
Nama imej | No | Nilai teks | Bagaimana nama imej bermula. Contoh nama imej yang diekstrak: GivenName_1, GivenName_2 | |
Simpan imej kepada | No | folder | Folder untuk menyimpan imej yang diekstrak sebagai fail png |
Pemboleh ubah yang dihasilkan
Tindakan ini tidak menghasilkan sebarang pembolehubah.
Pengecualian
Pengecualian | Description |
---|---|
Kata Laluan tidak sah | Kata laluan yang diberikan tidak sah |
Gagal mengekstrak imej | Menunjukkan bahawa ralat berlaku semasa mengekstrak imej daripada halaman PDF yang diberikan |
Folder tidak wujud | Menunjukkan bahawa folder tidak wujud |
Fail PDF tidak wujud | Fail tidak wujud pada laluan yang diberikan |
Ekstrak halaman fail PDF kepada fail PDF baharu
Anda boleh mencipta fail PDF baharu dengan mengekstrak halaman daripada fail PDF sedia ada dengan menggunakan halaman fail PDF kepada tindakan fail PDF baharu. Dalam parameter tindakan anda boleh menentukan fail PDF untuk mengekstrak halaman, halaman yang akan diekstrak, lokasi fail PDF baharu dan perkara yang perlu berlaku jika fail dengan nama dan sambungan yang sama sudah wujud. Akhir sekali, di bawah sifat lanjutan anda boleh menentukan kata laluan sekiranya PDF sumber dilindungi.
Parameter input
Argumen | Pilihan | Menerima | Nilai Lalai | Description |
---|---|---|---|---|
Fail PDF | No | Fail | Fail PDF untuk mengekstrak halaman daripada. Masukkan laluan fail, pembolehubah yang mengandungi fail atau laluan teks | |
Kata laluan | Ya | Input disulitkan langsung atau Nilai teks | Kata laluan fail PDF. Biarkan ini kosong jika PDF tidak dilindungi kata laluan | |
Pemilihan halaman | No | Nilai teks | Nombor indeks halaman yang perlu disimpan (contohnya, 1,3,17-24) | |
Laluan PDF yang diekstrak | No | Fail | Laluan untuk menyimpan fail PDF yang diekstrak | |
Jika fail wujud | T/B | Timpang, Jangan timpa, Tambah akhiran berjujukan | Tambah akhiran jujukan | Menentukan perkara yang perlu dilakukan jika fail PDF output sudah wujud |
Pemboleh ubah yang dihasilkan
Argumen | Taip | Description |
---|---|---|
DiekstrakPDF | Fail | Fail PDF baharu |
Pengecualian
Pengecualian | Description |
---|---|
Kata Laluan tidak sah | Kata laluan yang diberikan tidak sah |
Fail PDF tidak wujud | Fail tidak wujud pada laluan yang diberikan |
Halaman di luar sempadan | Menunjukkan bahawa satu atau lebih halaman berada di luar had fail PDF |
Pemilihan halaman tidak sah | Menunjukkan bahawa halaman yang diberikan tidak sah untuk fail PDF |
Gagal mengekstrak PDF baharu | Menunjukkan bahawa ralat berlaku semasa cuba mengekstrak PDF baharu |
Gabungkan fail PDF
Menggabungkan berbilang fail PDF menjadi fail yang baharu.
Anda boleh menggunakan tindakan Gabungkan fail PDF untuk mengambil dua atau lebih fail PDF dan menggabungkannya menjadi satu fail. Fail yang akan digabungkan boleh disediakan sama ada dalam bentuk senarai, atau disertakan dalam petikan berganda dan dipisahkan oleh pembatas. Anda juga boleh memberikan kata laluan untuk fail PDF, sekiranya ia dilindungi kata laluan.
Parameter input
Argumen | Pilihan | Menerima | Nilai Lalai | Description |
---|---|---|---|---|
Fail PDF | No | SenaraiFail | Fail untuk digabungkan. Sertakan berbilang fail dalam petikan berganda (") dan pisahkannya dengan pembatas, atau gunakan senarai fail | |
Laluan PDF yang digabungkan | No | Fail | Laluan untuk menyimpan fail PDF yang digabungkan | |
Jika fail wujud | T/B | Timpang, Jangan timpa, Tambah akhiran berjujukan | Tambah akhiran jujukan | Menentukan perkara yang perlu dilakukan jika fail destinasi sudah wujud |
Kata Laluan | Ya | Input disulitkan langsung atau Nilai teks | Kata laluan yang dibatasi. Susunan hendaklah sama dengan susunan PDF input. Biarkan ini kosong jika PDF tidak dilindungi kata laluan | |
Pembatas | No | Nilai teks | , | Pembatas kata laluan tersuai. Pemisah ini tidak sepatutnya menjadi sebahagian daripada mana-mana kata laluan |
Pemboleh ubah yang dihasilkan
Argumen | Taip | Description |
---|---|---|
DigabungkanPDF | Fail | Fail PDF yang digabungkan |
Pengecualian
Pengecualian | Description |
---|---|
Fail PDF tidak wujud | Fail tidak wujud pada laluan yang diberikan |
Kata Laluan tidak sah | Kata laluan yang diberikan tidak sah |
Gagal menggabungkan fail PDF | Menunjukkan bahawa ralat telah berlaku semasa menggabungkan fail |
Nota
Apabila anda menggunakan tindakan "Gabungkan Fail PDF", jangan tetapkan destinasi untuk PDF yang digabungkan sebagai salah satu fail asal yang digabungkan. Ini boleh menyebabkan tindakan gagal dan mungkin memadamkan fail asal. Untuk melindungi dokumen asal anda, sentiasa pilih lokasi fail baharu atau yang sedia ada yang bukan antara fail asal yang digabungkan untuk output PDF yang digabungkan.