Бележка
Достъпът до тази страница изисква удостоверяване. Можете да опитате да влезете или да промените директориите.
Достъпът до тази страница изисква удостоверяване. Можете да опитате да промените директориите.
Действията в PDF формат ви позволяват да извличате изображения, текст и таблици от PDF файлове и да подреждате страници, за да създавате нови документи.
За да извлечете текст от PDF файл, използвайте действието Извличане на текст от PDF . Следният пример извлича текст от специфичен диапазон от страници на защитен с парола файл. Паролата е зададена в Разширените настройки.
За да извлечете текстове, подредени в таблична форма, активирайте „Оптимизиране за структурирани данни“, за да подобрите формата и точността на резултатите.
За да извлечете таблици от PDF файл, внедрете действието Извличане на таблици от PDF , изберете файла и посочете страниците, от които да се извлекат.
Действието създава променливата ExtractedPDFTables , която съдържа списък с информация за PDF таблици. За да намерите информация за този тип списък, отидете на Разширени типове данни.
Бележка
- Действието „Извличане на таблици от PDF“ не използва оптично разпознаване на символи (OCR), така че не можете да извличате некопируем текст от сканирани PDF файлове.
- Библиотеката, която стои зад действието, понякога извлича допълнителни PDF данни, които не са таблици. Тази функционалност минимизира риска от случайно пропускане на реална таблица.
Освен извличането на информация от PDF файлове, можете да създадете нов PDF документ от съществуващ файл, като използвате действието Извличане на страници от PDF файл в нов PDF файл .
Следният пример избира комбинация от конкретни страници и диапазон от страници.
Извличане на текст от PDF
Можете да извлечете текст от PDF файл, като използвате действието „Извличане на текст от PDF“. В свойствата на действието можете да дефинирате изходния PDF файл и страниците, от които текстът трябва да бъде извлечен. В разширените свойства на действието можете да дефинирате парола, в случай че PDF файлът е защитен и дали системата трябва да оптимизира за структурирани данни или не.
Входни параметри
Аргумент | Незадължителен | Приема | Стойност по подразбиране | Описание |
---|---|---|---|---|
PDF файл | No | Файл | PDF файлът, от който да се извлече текст. Въведете път до файла, променлива, съдържаща файл, или текстов път | |
Страница(и) за извличане | Неприложимо | Всички, Единични, Диапазон | Цялата | Указва колко страници да се извлекат: Всички страници, една страница или диапазон от страници |
Номер на единична страница | No | Числова стойност | Номерът на единичната страница, от която да се извлича текст | |
Номер на страницата „От“ | No | Числова стойност | Номерът на първата страница от обхвата от страници, от които да се извлича текст | |
Номер на страницата „До“ | No | Числова стойност | Номерът на последната страница от обхвата от страници, от които да се извлича текст | |
Парола | Да | Директно криптирано въвеждане или текстова стойност | Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола | |
Оптимизиране за структурирани данни | Неприложимо | Булева стойност | False | Укажете дали да се открие форматирано оформление в документа и да се извлече съответно текстът |
Създадени променливи
Аргумент | Тип | Описание |
---|---|---|
Извлечен PDF текст | Текстова стойност | Извлеченият текст |
Изключения
Изключение | Описание |
---|---|
PDF файлът не съществува | Файлът не съществува на дадения път |
Невалидна парола | Дадената парола е невалидна |
Извличането на текст е неуспешно | Грешка при опит за извличане на текст |
Извличане на таблици от PDF файл
Можете да извлечете таблици, които се съдържат в PDF файл, като използвате действието Извличане на таблици от PDF . В свойствата на действието можете да дефинирате PDF файла и диапазона от страници, от които ще бъдат извлечени таблиците. В разширените свойства на действието можете да дефинирате парола, в случай че PDF файлът е защитен, да определите дали таблицата има заглавки или не и накрая дали таблиците, които пресичат полетата на страницата, трябва да бъдат обединени или не.
Входни параметри
Аргумент | Незадължителен | Приема | Стойност по подразбиране | Описание |
---|---|---|---|---|
PDF файл | No | Файл | PDF файлът, от който да се извлекат таблици. Въведете път до файла, променлива, съдържаща файл, или текстов път | |
Страница(и) за извличане | Неприложимо | Всички, Единични, Диапазон | Цялата | Указва от колко страници да се извличат таблици: всички страници, единична страница или обхват от страници |
Номер на единична страница | No | Числова стойност | Номерът на единичната страница, от която да се извличат таблици | |
Номер на страницата „От“ | No | Числова стойност | Номерът на първата страница от обхвата от страници, от които да се извличат таблици | |
Номер на страницата „До“ | No | Числова стойност | Номерът на последната страница от обхвата от страници, от които да се извличат таблици | |
Парола | Да | Директно криптирано въвеждане или текстова стойност | Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола | |
Обединяване на таблици, преминаващи през полетата на страници | Неприложимо | Булева стойност | True | Указва дали да се обединяват таблици, преминаващи през полетата на страници, в посочения обхват от страници |
Първият ред съдържа имена на колони | Неприложимо | Булева стойност | True | Указва дали първият ред от таблицата съдържа имена на колони |
Създадени променливи
Аргумент | Тип | Описание |
---|---|---|
Извлечени PDF таблици | Списък с информация за PDF таблици | Извлечените таблици с информацията им като списък |
Изключения
Изключение | Описание |
---|---|
PDF файлът не съществува | Файлът не съществува на дадения път |
Невалидна парола | Дадената парола е невалидна |
Неуспешно извличане на таблици | Грешка при опит за извличане на таблици |
Извличане на изображения от PDF
За да извлечете изображения от PDF файл, можете да използвате действието Извличане на изображения от PDF . В параметрите на действието можете да дефинирате PDF файла и страниците, от които да се извличат изображения, конвенцията за именуване на извлечените изображения и целевото местоположение на запазените изображения. Можете също да зададете парола, ако PDF файлът е защитен в разширените настройки.
Входни параметри
Аргумент | Незадължителен | Приема | Стойност по подразбиране | Описание |
---|---|---|---|---|
PDF файл | No | Файл | PDF файлът, от който да се извлекат изображения. Въведете път до файла, променлива, съдържаща файл, или текстов път | |
Парола | Да | Директно криптирано въвеждане или текстова стойност | Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола | |
Страница(и) за извличане | Неприложимо | Всички, Единични, Диапазон | Цялата | Указва колко страници да се извлекат: Всички страници, една страница или диапазон от страници |
Номер на единична страница | No | Числова стойност | Номерът на единичната страница, от която да се извличат изображения | |
Номер на страницата „От“ | No | Числова стойност | Номерът на първата страница от диапазона страници, от които да се извлекат изображения | |
Номер на страницата „До“ | No | Числова стойност | Номерът на последната страница от диапазона страници, от които да се извлекат изображения | |
Име на изображението | No | Текстова стойност | Как започва името на изображенията. Примерно име на извлечени изображения: GivenName_1, GivenName_2 | |
Записване на изображения във | No | Папка | Папката за запазване на извлечените изображения като png файлове |
Създадени променливи
Това действие не води до никакви променливи.
Изключения
Изключение | Описание |
---|---|
Невалидна парола | Дадената парола е невалидна |
Неуспешно извличане на изображения | Показва, че е възникнала грешка при извличане на изображения от дадените страници на PDF файла |
Папката не съществува | Указва, че папката не съществува |
PDF файлът не съществува | Файлът не съществува на дадения път |
Извличане на страници на PDF файл в нов PDF файл
Можете да създадете нов PDF файл, като извлечете страници от съществуващ PDF файл, като използвате страниците на PDF файла към ново действие на PDF файл . В параметрите на действието можете да дефинирате PDF файла, от който да извлечете страниците, страниците за извличане, местоположението на новия PDF файл и какво трябва да се случи, ако вече съществува файл със същото име и разширение. И накрая, под разширените свойства можете да дефинирате парола, в случай че изходният PDF файл е защитен.
Входни параметри
Аргумент | Незадължителен | Приема | Стойност по подразбиране | Описание |
---|---|---|---|---|
PDF файл | No | Файл | PDF файла за извличане на страници. Въведете път до файла, променлива, съдържаща файл, или текстов път | |
Парола | Да | Директно криптирано въвеждане или текстова стойност | Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола | |
Избор на страница | No | Текстова стойност | Индексните номера на страниците, които трябва да се запазят (например 1,3,17-24) | |
Извлечен PDF път | No | Файл | Пътят за съхраняване на извлечения PDF файл | |
Ако файлът съществува | Неприложимо | Презаписване, Не презаписване, Добавяне на последователен суфикс | Добавете последващ суфикс | Указва какво да се направи, в случай че изходният PDF файл вече съществува |
Създадени променливи
Аргумент | Тип | Описание |
---|---|---|
ИзвлеченоPDF | Файл | Новият PDF файл |
Изключения
Изключение | Описание |
---|---|
Невалидна парола | Дадената парола е невалидна |
PDF файлът не съществува | Файлът не съществува на дадения път |
Страницата е извън границите | Показва, че една или повече страници са извън границите на PDF файла |
Невалиден избор на страница | Указва, че дадените страници не са валидни за PDF файла |
Неуспешно извличане на нов PDF файл | Показва, че е възникнала грешка при опит за извличане на нов PDF файл |
Обединяване на PDF файлове
Обединява няколко PDF файла в нов.
Можете да използвате действието Обединяване на PDF файлове , за да вземете два или повече PDF файла и да ги обедините в един файл. Файловете, които трябва да бъдат обединени, могат да бъдат предоставени или под формата на списък, или оградени в двойни кавички и разделени с разделител. Можете също така да предоставите пароли за PDF файловете, в случай че са защитени с парола.
Входни параметри
Аргумент | Незадължителен | Приема | Стойност по подразбиране | Описание |
---|---|---|---|---|
PDF файлове | No | Списък на файловете | Файловете за обединяване. Оградете няколко файла в двойни кавички (") и ги разделете с разделител или използвайте списък с файлове | |
Път на обединен PDF | No | Файл | Пътят за съхраняване на обединения PDF | |
Ако файлът съществува | Неприложимо | Презаписване, Не презаписване, Добавяне на последователен суфикс | Добавете последващ суфикс | Указва какво да се направи, в случай че целевият файл вече съществува |
Пароли | Да | Директно криптирано въвеждане или текстова стойност | Разписаните пароли. Редът трябва да бъде същият като реда на въведените PDF файлове. Оставете това празно, ако PDF файловете не са защитени с парола | |
Разделител | No | Текстова стойност | , | Персонализиран разделител на пароли. Този разделител не трябва да е част от никоя от паролите |
Създадени променливи
Аргумент | Тип | Описание |
---|---|---|
ОбединенPDF | Файл | Обединеният PDF файл |
Изключения
Изключение | Описание |
---|---|
PDF файлът не съществува | Файлът не съществува на дадения път |
Невалидна парола | Дадената парола е невалидна |
Обединяването на PDF файлове не бе успешно | Указва, че е възникнала грешка при опит за обединяване на файлове |
Бележка
Когато използвате действието "Обединяване на PDF файлове", не задавайте дестинацията за обединения PDF файл като един от оригиналните файлове, които се обединяват. Това може да доведе до неуспешно действие и може да изтрие оригиналния файл. За да защитите оригиналните си документи, винаги избирайте ново местоположение на файла или съществуващо, което не е сред оригиналните файлове, които се обединяват за обединения PDF изход.