Comparteix a través de


Accions del PDF

Les accions PDF us permeten extreure imatges, text i taules de fitxers PDF i organitzar pàgines per crear documents nous.

Per extreure text d'un fitxer PDF, utilitzeu l'acció Extreu text d'un PDF . L'exemple següent extreu text d'un interval específic de pàgines d'un fitxer protegit amb contrasenya. La contrasenya s'especifica a la configuració avançada .

Per extreure textos ordenats en forma de taula, activeu Optimitza per a dades estructurades per millorar el format i la precisió dels resultats.

Captura de pantalla de l'acció Extreu text del PDF.

Per extreure taules d'un fitxer PDF, implementeu l'acció Extreu taules d'un PDF , seleccioneu el fitxer i especifiqueu les pàgines de les quals voleu extreure'n.

L'acció produeix la variable ExtractedPDFTables que conté una llista d'informació de la taula PDF. Per trobar informació sobre aquest tipus de llista, aneu a Tipus de dades avançades.

Nota

  • L'acció "Extreu taules d'un PDF " no utilitza el reconeixement òptic de caràcters (OCR), de manera que no es pot extreure text que no es pugui copiar dels PDF escanejats.
  • La biblioteca que hi ha darrere de l'acció de tant en tant extreu dades PDF addicionals que no són taules. Aquesta funcionalitat minimitza el risc d'ometre accidentalment una taula real.

Captura de pantalla de l'acció Extreu taules del PDF.

A més d'extreure informació dels fitxers PDF, podeu crear un document PDF nou a partir d'un fitxer existent mitjançant l'acció Extreu les pàgines del fitxer PDF a un fitxer PDF nou.

L'exemple següent selecciona una combinació de pàgines específiques i un interval de pàgines.

Captura de pantalla de l'acció Extreu les pàgines del fitxer PDF a un fitxer PDF nou.

Extreu el text del PDF

Podeu extreure text d'un fitxer PDF mitjançant l'acció "Extreu text d'un PDF". A les propietats de l'acció podeu definir el fitxer PDF d'origen i les pàgines de les quals s'ha d'extreure el text. Sota les propietats de l'acció avançada podeu definir una contrasenya en cas que el fitxer PDF estigui protegit i si el motor ha d'optimitzar les dades estructurades o no.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF per extreure text. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text
Pàgines que s'extrauran N/A Tots, Únic, Gamma Totes Especifica quantes pàgines s'han d'extreure: Totes les pàgines, una sola pàgina o un interval de pàgines
Número de pàgina únic No Valor numèric Número de l'única pàgina de la qual s'ha d'extreure el text
Número de pàgina inicial No Valor numèric Número de la primera pàgina de l'interval de pàgines del qual s'ha d'extreure el text
Número de pàgina final No Valor numèric Número de l'última pàgina de l'interval de pàgines del qual s'ha d'extreure el text
Contrasenya Entrada xifrada directa o valor de text La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Optimitza per a les dades estructurades N/A Valor booleà Fals Especifiqueu si s'ha de detectar la disposició amb format al document i extreure'n el text en conseqüència

Variables generades

Argument Type Descripció
ExtractedPDFText Valor de text El text extret

Excepcions

Excepció Descripció
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'ha pogut extreure el text S'ha produït un error en intentar extreure el text

Extreu les taules del PDF

Podeu extreure taules contingudes en un fitxer PDF mitjançant l'acció Extreu taules del PDF . A les propietats de l'acció podeu definir el fitxer PDF i l'interval de pàgines de les quals s'extreuran les taules. Sota les propietats de l'acció avançada podeu definir una contrasenya en cas que un fitxer PDF estigui protegit, definir si la taula té capçaleres o no, i finalment si les taules que creuen els marges de la pàgina s'han de fusionar o no.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF per extreure taules. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text
Pàgines que s'extrauran N/A Tots, Únic, Gamma Totes Especifica de quantes pàgines s'extreuen les taules: totes les pàgines, una sola pàgina o un interval de pàgines
Número de pàgina únic No Valor numèric Número d'una sola pàgina de la qual s'extreuen les taules
Número de pàgina inicial No Valor numèric Número de la primera pàgina de l'interval de pàgines de les quals s'extreuen les taules
Número de pàgina final No Valor numèric L'últim número de pàgina de l'interval de pàgines de les quals s'extreuen les taules
Contrasenya Entrada xifrada directa o valor de text La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Combina les taules que creuen els marges de pàgina N/A Valor booleà Cert Especifica si s'han de combinar les taules que creuen els marges de pàgina a l'interval de pàgines especificat
La primera línia conté noms de columna N/A Valor booleà Cert Especifica si la primera línia de la taula conté noms de columna

Variables generades

Argument Type Descripció
ExtractedPDFTables Llista d'informació de la taula PDF Les taules extretes amb la seva informació com una llista

Excepcions

Excepció Descripció
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'han pogut extreure les taules S'ha produït un error mentre s'intentava extreure les taules

Extreu les imatges del PDF

Per extreure imatges d'un fitxer PDF, podeu utilitzar l'acció Extreu imatges d'un PDF . En els paràmetres d'acció podeu definir el fitxer PDF i les pàgines de les quals extreureu les imatges, la convenció de nomenclatura de les imatges extintes i la ubicació de destinació de les imatges desades. També podeu definir una contrasenya si el fitxer PDF està protegit amb la configuració avançada.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF per extreure imatges. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text
Contrasenya Entrada xifrada directa o valor de text La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Pàgines que s'extrauran N/A Tots, Únic, Gamma Totes Especifica quantes pàgines s'han d'extreure: Totes les pàgines, una sola pàgina o un interval de pàgines
Número de pàgina únic No Valor numèric Número de l'única pàgina de la qual s'han d'extreure les imatges
Número de pàgina inicial No Valor numèric El primer número de pàgina de l'interval de pàgines per extreure imatges
Número de pàgina final No Valor numèric L'últim número de pàgina de l'interval de pàgines de les quals s'extreuen imatges
Nom de les imatges No Valor de text Com comença el nom de les imatges. Exemple de nom d'imatges extretes: GivenName_1, GivenName_2
Desa les imatges a No Carpeta La carpeta per desar les imatges extretes com a fitxers png

Variables generades

Aquesta acció no produeix cap variable.

Excepcions

Excepció Descripció
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'han pogut extreure les imatges Indica que s'ha produït un error en extreure imatges de les pàgines donades del PDF
La carpeta no existeix Indica que la carpeta no existeix
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat

Extreu les pàgines del fitxer PDF a un fitxer PDF nou

Podeu crear un fitxer PDF nou extraient pàgines d'un fitxer PDF existent mitjançant l'acció Pàgines del fitxer PDF a un fitxer PDF nou. En els paràmetres d'acció podeu definir el fitxer PDF del qual extreure les pàgines, les pàgines a extreure, la ubicació del nou fitxer PDF i què hauria de passar si ja existeix un fitxer amb el mateix nom i extensió. Finalment, a les propietats avançades podeu definir una contrasenya en cas que el PDF d'origen estigui protegit.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxer PDF No Fitxer El fitxer PDF per extreure les pàgines. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text
Contrasenya Entrada xifrada directa o valor de text La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya
Selecció de pàgines No Valor de text Els números d'índex de les pàgines a conservar (per exemple, 1,3,17-24)
Ruta PDF extreta No Fitxer Camí on s'emmagatzemarà el fitxer PDF extret
Si l'arxiu existeix N/A Sobreescriure, No sobreescriure, afegir sufix seqüencial Afegeix sufix seqüencial Especifica què cal fer en cas que el fitxer PDF de sortida ja existeixi

Variables generades

Argument Type Descripció
Extret PDF Fitxer El nou fitxer PDF

Excepcions

Excepció Descripció
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Pàgina fora dels límits Indica que una o més pàgines estan fora dels límits del fitxer PDF
Selecció de pàgines no vàlida Indica que les pàgines proporcionades no són vàlides per al fitxer PDF
No s'ha pogut extreure el PDF nou Indica que s'ha produït un error en intentar extreure un PDF nou

Combina fitxers PDF

Combina diversos fitxers PDF en un de nou.

Pots utilitzar l'acció "Fusionar arxius PDF" per agafar dos o més arxius PDF i combinar-los en un sol arxiu. Els fitxers que s'han de fusionar es poden proporcionar en forma de llista o entre cometes dobles i separats per un delimitador. També podeu proporcionar contrasenyes per als fitxers PDF, en cas que estiguin protegits amb contrasenya.

Paràmetres d’entrada

Argument Opcional Accepta Valor per defecte Descripció
Fitxers PDF No Llista de fitxers Els fitxers que s'han de fusionar. Tancar diversos fitxers entre cometes dobles (") i separar-los per un delimitador, o utilitzar una llista de fitxers
Camí del PDF combinat No Fitxer Camí on s'emmagatzemarà el fitxer PDF combinat
Si l'arxiu existeix N/A Sobreescriure, No sobreescriure, afegir sufix seqüencial Afegeix sufix seqüencial Especifica què cal fer en cas que el fitxer de destinació ja existeixi
Contrasenyes Entrada xifrada directa o valor de text Les contrasenyes delimitades. L'ordre ha de ser el mateix que l'ordre dels PDF d'entrada. Deixeu-ho en blanc si els PDF no estan protegits amb contrasenya
Delimitador No Valor de text , Un delimitador de contrasenya personalitzat. Aquest delimitador no hauria de formar part de cap de les contrasenyes

Variables generades

Argument Type Descripció
FusionatPDF Fitxer Fitxer PDF combinat

Excepcions

Excepció Descripció
El fitxer PDF no existeix El fitxer no existeix al camí proporcionat
Contrasenya no vàlida La contrasenya proporcionada no és vàlida
No s'han pogut combinar els fitxers PDF Indica que s'ha produït un error mentre es combinaven els fitxers

Nota

Quan utilitzeu l'acció "Combina fitxers PDF", no definiu la destinació del PDF fusionat com un dels fitxers originals que s'estan fusionant. Això pot fer que l'acció falli i suprimeixi el fitxer original. Per protegir els documents originals, trieu sempre una ubicació de fitxer nova o una d'existent que no es trobi entre els fitxers originals que s'estan combinant per a la sortida del PDF combinat.