Споделяне чрез


PDF действия

Действията в PDF формат ви позволяват да извличате изображения, текст и таблици от PDF файлове и да подреждате страници, за да създавате нови документи.

За да извлечете текст от PDF файл, използвайте действието Извличане на текст от PDF . Следният пример извлича текст от специфичен диапазон от страници на защитен с парола файл. Паролата е зададена в Разширените настройки.

За да извлечете текстове, подредени в таблична форма, активирайте „Оптимизиране за структурирани данни“, за да подобрите формата и точността на резултатите.

Екранна снимка на действието „Извличане на текст от PDF“.

За да извлечете таблици от PDF файл, внедрете действието Извличане на таблици от PDF , изберете файла и посочете страниците, от които да се извлекат.

Действието създава променливата ExtractedPDFTables , която съдържа списък с информация за PDF таблици. За да намерите информация за този тип списък, отидете на Разширени типове данни.

Бележка

  • Действието „Извличане на таблици от PDF“ не използва оптично разпознаване на символи (OCR), така че не можете да извличате некопируем текст от сканирани PDF файлове.
  • Библиотеката, която стои зад действието, понякога извлича допълнителни PDF данни, които не са таблици. Тази функционалност минимизира риска от случайно пропускане на реална таблица.

Екранна снимка на действието „Извличане на таблици от PDF“.

Освен извличането на информация от PDF файлове, можете да създадете нов PDF документ от съществуващ файл, като използвате действието Извличане на страници от PDF файл в нов PDF файл .

Следният пример избира комбинация от конкретни страници и диапазон от страници.

Екранна снимка на действието „Извличане на страници от PDF файл в нов PDF файл“.

Извличане на текст от PDF

Можете да извлечете текст от PDF файл, като използвате действието „Извличане на текст от PDF“. В свойствата на действието можете да дефинирате изходния PDF файл и страниците, от които текстът трябва да бъде извлечен. В разширените свойства на действието можете да дефинирате парола, в случай че PDF файлът е защитен и дали системата трябва да оптимизира за структурирани данни или не.

Входни параметри

Аргумент Незадължителен Приема Стойност по подразбиране Описание
PDF файл No Файл PDF файлът, от който да се извлече текст. Въведете път до файла, променлива, съдържаща файл, или текстов път
Страница(и) за извличане Неприложимо Всички, Единични, Диапазон Цялата Указва колко страници да се извлекат: Всички страници, една страница или диапазон от страници
Номер на единична страница No Числова стойност Номерът на единичната страница, от която да се извлича текст
Номер на страницата „От“ No Числова стойност Номерът на първата страница от обхвата от страници, от които да се извлича текст
Номер на страницата „До“ No Числова стойност Номерът на последната страница от обхвата от страници, от които да се извлича текст
Парола Да Директно криптирано въвеждане или текстова стойност Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола
Оптимизиране за структурирани данни Неприложимо Булева стойност False Укажете дали да се открие форматирано оформление в документа и да се извлече съответно текстът

Създадени променливи

Аргумент Тип Описание
Извлечен PDF текст Текстова стойност Извлеченият текст

Изключения

Изключение Описание
PDF файлът не съществува Файлът не съществува на дадения път
Невалидна парола Дадената парола е невалидна
Извличането на текст е неуспешно Грешка при опит за извличане на текст

Извличане на таблици от PDF файл

Можете да извлечете таблици, които се съдържат в PDF файл, като използвате действието Извличане на таблици от PDF . В свойствата на действието можете да дефинирате PDF файла и диапазона от страници, от които ще бъдат извлечени таблиците. В разширените свойства на действието можете да дефинирате парола, в случай че PDF файлът е защитен, да определите дали таблицата има заглавки или не и накрая дали таблиците, които пресичат полетата на страницата, трябва да бъдат обединени или не.

Входни параметри

Аргумент Незадължителен Приема Стойност по подразбиране Описание
PDF файл No Файл PDF файлът, от който да се извлекат таблици. Въведете път до файла, променлива, съдържаща файл, или текстов път
Страница(и) за извличане Неприложимо Всички, Единични, Диапазон Цялата Указва от колко страници да се извличат таблици: всички страници, единична страница или обхват от страници
Номер на единична страница No Числова стойност Номерът на единичната страница, от която да се извличат таблици
Номер на страницата „От“ No Числова стойност Номерът на първата страница от обхвата от страници, от които да се извличат таблици
Номер на страницата „До“ No Числова стойност Номерът на последната страница от обхвата от страници, от които да се извличат таблици
Парола Да Директно криптирано въвеждане или текстова стойност Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола
Обединяване на таблици, преминаващи през полетата на страници Неприложимо Булева стойност True Указва дали да се обединяват таблици, преминаващи през полетата на страници, в посочения обхват от страници
Първият ред съдържа имена на колони Неприложимо Булева стойност True Указва дали първият ред от таблицата съдържа имена на колони

Създадени променливи

Аргумент Тип Описание
Извлечени PDF таблици Списък с информация за PDF таблици Извлечените таблици с информацията им като списък

Изключения

Изключение Описание
PDF файлът не съществува Файлът не съществува на дадения път
Невалидна парола Дадената парола е невалидна
Неуспешно извличане на таблици Грешка при опит за извличане на таблици

Извличане на изображения от PDF

За да извлечете изображения от PDF файл, можете да използвате действието Извличане на изображения от PDF . В параметрите на действието можете да дефинирате PDF файла и страниците, от които да се извличат изображения, конвенцията за именуване на извлечените изображения и целевото местоположение на запазените изображения. Можете също да зададете парола, ако PDF файлът е защитен в разширените настройки.

Входни параметри

Аргумент Незадължителен Приема Стойност по подразбиране Описание
PDF файл No Файл PDF файлът, от който да се извлекат изображения. Въведете път до файла, променлива, съдържаща файл, или текстов път
Парола Да Директно криптирано въвеждане или текстова стойност Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола
Страница(и) за извличане Неприложимо Всички, Единични, Диапазон Цялата Указва колко страници да се извлекат: Всички страници, една страница или диапазон от страници
Номер на единична страница No Числова стойност Номерът на единичната страница, от която да се извличат изображения
Номер на страницата „От“ No Числова стойност Номерът на първата страница от диапазона страници, от които да се извлекат изображения
Номер на страницата „До“ No Числова стойност Номерът на последната страница от диапазона страници, от които да се извлекат изображения
Име на изображението No Текстова стойност Как започва името на изображенията. Примерно име на извлечени изображения: GivenName_1, GivenName_2
Записване на изображения във No Папка Папката за запазване на извлечените изображения като png файлове

Създадени променливи

Това действие не води до никакви променливи.

Изключения

Изключение Описание
Невалидна парола Дадената парола е невалидна
Неуспешно извличане на изображения Показва, че е възникнала грешка при извличане на изображения от дадените страници на PDF файла
Папката не съществува Указва, че папката не съществува
PDF файлът не съществува Файлът не съществува на дадения път

Извличане на страници на PDF файл в нов PDF файл

Можете да създадете нов PDF файл, като извлечете страници от съществуващ PDF файл, като използвате страниците на PDF файла към ново действие на PDF файл . В параметрите на действието можете да дефинирате PDF файла, от който да извлечете страниците, страниците за извличане, местоположението на новия PDF файл и какво трябва да се случи, ако вече съществува файл със същото име и разширение. И накрая, под разширените свойства можете да дефинирате парола, в случай че изходният PDF файл е защитен.

Входни параметри

Аргумент Незадължителен Приема Стойност по подразбиране Описание
PDF файл No Файл PDF файла за извличане на страници. Въведете път до файла, променлива, съдържаща файл, или текстов път
Парола Да Директно криптирано въвеждане или текстова стойност Паролата на PDF файла. Оставете това празно, ако PDF файлът не е защитен с парола
Избор на страница No Текстова стойност Индексните номера на страниците, които трябва да се запазят (например 1,3,17-24)
Извлечен PDF път No Файл Пътят за съхраняване на извлечения PDF файл
Ако файлът съществува Неприложимо Презаписване, Не презаписване, Добавяне на последователен суфикс Добавете последващ суфикс Указва какво да се направи, в случай че изходният PDF файл вече съществува

Създадени променливи

Аргумент Тип Описание
ИзвлеченоPDF Файл Новият PDF файл

Изключения

Изключение Описание
Невалидна парола Дадената парола е невалидна
PDF файлът не съществува Файлът не съществува на дадения път
Страницата е извън границите Показва, че една или повече страници са извън границите на PDF файла
Невалиден избор на страница Указва, че дадените страници не са валидни за PDF файла
Неуспешно извличане на нов PDF файл Показва, че е възникнала грешка при опит за извличане на нов PDF файл

Обединяване на PDF файлове

Обединява няколко PDF файла в нов.

Можете да използвате действието Обединяване на PDF файлове , за да вземете два или повече PDF файла и да ги обедините в един файл. Файловете, които трябва да бъдат обединени, могат да бъдат предоставени или под формата на списък, или оградени в двойни кавички и разделени с разделител. Можете също така да предоставите пароли за PDF файловете, в случай че са защитени с парола.

Входни параметри

Аргумент Незадължителен Приема Стойност по подразбиране Описание
PDF файлове No Списък на файловете Файловете за обединяване. Оградете няколко файла в двойни кавички (") и ги разделете с разделител или използвайте списък с файлове
Път на обединен PDF No Файл Пътят за съхраняване на обединения PDF
Ако файлът съществува Неприложимо Презаписване, Не презаписване, Добавяне на последователен суфикс Добавете последващ суфикс Указва какво да се направи, в случай че целевият файл вече съществува
Пароли Да Директно криптирано въвеждане или текстова стойност Разписаните пароли. Редът трябва да бъде същият като реда на въведените PDF файлове. Оставете това празно, ако PDF файловете не са защитени с парола
Разделител No Текстова стойност , Персонализиран разделител на пароли. Този разделител не трябва да е част от никоя от паролите

Създадени променливи

Аргумент Тип Описание
ОбединенPDF Файл Обединеният PDF файл

Изключения

Изключение Описание
PDF файлът не съществува Файлът не съществува на дадения път
Невалидна парола Дадената парола е невалидна
Обединяването на PDF файлове не бе успешно Указва, че е възникнала грешка при опит за обединяване на файлове

Бележка

Когато използвате действието "Обединяване на PDF файлове", не задавайте дестинацията за обединения PDF файл като един от оригиналните файлове, които се обединяват. Това може да доведе до неуспешно действие и може да изтрие оригиналния файл. За да защитите оригиналните си документи, винаги избирайте ново местоположение на файла или съществуващо, което не е сред оригиналните файлове, които се обединяват за обединения PDF изход.