Nota
L'accés a aquesta pàgina requereix autorització. Podeu provar d'iniciar la sessió o de canviar els directoris.
L'accés a aquesta pàgina requereix autorització. Podeu provar de canviar els directoris.
Les accions PDF us permeten extreure imatges, text i taules de fitxers PDF i organitzar pàgines per crear documents nous.
Per extreure text d'un fitxer PDF, utilitzeu l'acció Extreu text d'un PDF . L'exemple següent extreu text d'un interval específic de pàgines d'un fitxer protegit amb contrasenya. La contrasenya s'especifica a la configuració avançada .
Per extreure textos ordenats en forma de taula, activeu Optimitza per a dades estructurades per millorar el format i la precisió dels resultats.
Per extreure taules d'un fitxer PDF, implementeu l'acció Extreu taules d'un PDF , seleccioneu el fitxer i especifiqueu les pàgines de les quals voleu extreure'n.
L'acció produeix la variable ExtractedPDFTables que conté una llista d'informació de la taula PDF. Per trobar informació sobre aquest tipus de llista, aneu a Tipus de dades avançades.
Nota
- L'acció "Extreu taules d'un PDF " no utilitza el reconeixement òptic de caràcters (OCR), de manera que no es pot extreure text que no es pugui copiar dels PDF escanejats.
- La biblioteca que hi ha darrere de l'acció de tant en tant extreu dades PDF addicionals que no són taules. Aquesta funcionalitat minimitza el risc d'ometre accidentalment una taula real.
A més d'extreure informació dels fitxers PDF, podeu crear un document PDF nou a partir d'un fitxer existent mitjançant l'acció Extreu les pàgines del fitxer PDF a un fitxer PDF nou.
L'exemple següent selecciona una combinació de pàgines específiques i un interval de pàgines.
Extreu el text del PDF
Podeu extreure text d'un fitxer PDF mitjançant l'acció "Extreu text d'un PDF". A les propietats de l'acció podeu definir el fitxer PDF d'origen i les pàgines de les quals s'ha d'extreure el text. Sota les propietats de l'acció avançada podeu definir una contrasenya en cas que el fitxer PDF estigui protegit i si el motor ha d'optimitzar les dades estructurades o no.
Paràmetres d’entrada
| Argument | Opcional | Accepta | Valor per defecte | Descripció |
|---|---|---|---|---|
| Fitxer PDF | No | Fitxer | El fitxer PDF per extreure text. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text | |
| Pàgines que s'extrauran | N/A | Tots, Únic, Gamma | Totes | Especifica quantes pàgines s'han d'extreure: Totes les pàgines, una sola pàgina o un interval de pàgines |
| Número de pàgina únic | No | Valor numèric | Número de l'única pàgina de la qual s'ha d'extreure el text | |
| Número de pàgina inicial | No | Valor numèric | Número de la primera pàgina de l'interval de pàgines del qual s'ha d'extreure el text | |
| Número de pàgina final | No | Valor numèric | Número de l'última pàgina de l'interval de pàgines del qual s'ha d'extreure el text | |
| Contrasenya | Sí | Entrada xifrada directa o valor de text | La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
| Optimitza per a les dades estructurades | N/A | Valor booleà | Fals | Especifiqueu si s'ha de detectar la disposició amb format al document i extreure'n el text en conseqüència |
Variables generades
| Argument | Type | Descripció |
|---|---|---|
| ExtractedPDFText | Valor de text | El text extret |
Excepcions
| Excepció | Descripció |
|---|---|
| El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
| Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
| No s'ha pogut extreure el text | S'ha produït un error en intentar extreure el text |
Extreu les taules del PDF
Podeu extreure taules contingudes en un fitxer PDF mitjançant l'acció Extreu taules del PDF . A les propietats de l'acció podeu definir el fitxer PDF i l'interval de pàgines de les quals s'extreuran les taules. Sota les propietats de l'acció avançada podeu definir una contrasenya en cas que un fitxer PDF estigui protegit, definir si la taula té capçaleres o no, i finalment si les taules que creuen els marges de la pàgina s'han de fusionar o no.
Paràmetres d’entrada
| Argument | Opcional | Accepta | Valor per defecte | Descripció |
|---|---|---|---|---|
| Fitxer PDF | No | Fitxer | El fitxer PDF per extreure taules. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text | |
| Pàgines que s'extrauran | N/A | Tots, Únic, Gamma | Totes | Especifica de quantes pàgines s'extreuen les taules: totes les pàgines, una sola pàgina o un interval de pàgines |
| Número de pàgina únic | No | Valor numèric | Número d'una sola pàgina de la qual s'extreuen les taules | |
| Número de pàgina inicial | No | Valor numèric | Número de la primera pàgina de l'interval de pàgines de les quals s'extreuen les taules | |
| Número de pàgina final | No | Valor numèric | L'últim número de pàgina de l'interval de pàgines de les quals s'extreuen les taules | |
| Contrasenya | Sí | Entrada xifrada directa o valor de text | La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
| Combina les taules que creuen els marges de pàgina | N/A | Valor booleà | Cert | Especifica si s'han de combinar les taules que creuen els marges de pàgina a l'interval de pàgines especificat |
| La primera línia conté noms de columna | N/A | Valor booleà | Cert | Especifica si la primera línia de la taula conté noms de columna |
Variables generades
| Argument | Type | Descripció |
|---|---|---|
| ExtractedPDFTables | Llista d'informació de la taula PDF | Les taules extretes amb la seva informació com una llista |
Excepcions
| Excepció | Descripció |
|---|---|
| El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
| Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
| No s'han pogut extreure les taules | S'ha produït un error mentre s'intentava extreure les taules |
Extreu les imatges del PDF
Per extreure imatges d'un fitxer PDF, podeu utilitzar l'acció Extreu imatges d'un PDF . En els paràmetres d'acció podeu definir el fitxer PDF i les pàgines de les quals extreureu les imatges, la convenció de nomenclatura de les imatges extintes i la ubicació de destinació de les imatges desades. També podeu definir una contrasenya si el fitxer PDF està protegit amb la configuració avançada.
Paràmetres d’entrada
| Argument | Opcional | Accepta | Valor per defecte | Descripció |
|---|---|---|---|---|
| Fitxer PDF | No | Fitxer | El fitxer PDF per extreure imatges. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text | |
| Contrasenya | Sí | Entrada xifrada directa o valor de text | La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
| Pàgines que s'extrauran | N/A | Tots, Únic, Gamma | Totes | Especifica quantes pàgines s'han d'extreure: Totes les pàgines, una sola pàgina o un interval de pàgines |
| Número de pàgina únic | No | Valor numèric | Número de l'única pàgina de la qual s'han d'extreure les imatges | |
| Número de pàgina inicial | No | Valor numèric | El primer número de pàgina de l'interval de pàgines per extreure imatges | |
| Número de pàgina final | No | Valor numèric | L'últim número de pàgina de l'interval de pàgines de les quals s'extreuen imatges | |
| Nom de les imatges | No | Valor de text | Com comença el nom de les imatges. Exemple de nom d'imatges extretes: GivenName_1, GivenName_2 | |
| Desa les imatges a | No | Carpeta | La carpeta per desar les imatges extretes com a fitxers png |
Variables generades
Aquesta acció no produeix cap variable.
Excepcions
| Excepció | Descripció |
|---|---|
| Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
| No s'han pogut extreure les imatges | Indica que s'ha produït un error en extreure imatges de les pàgines donades del PDF |
| La carpeta no existeix | Indica que la carpeta no existeix |
| El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
Extreu les pàgines del fitxer PDF a un fitxer PDF nou
Podeu crear un fitxer PDF nou extraient pàgines d'un fitxer PDF existent mitjançant l'acció Pàgines del fitxer PDF a un fitxer PDF nou. En els paràmetres d'acció podeu definir el fitxer PDF del qual extreure les pàgines, les pàgines a extreure, la ubicació del nou fitxer PDF i què hauria de passar si ja existeix un fitxer amb el mateix nom i extensió. Finalment, a les propietats avançades podeu definir una contrasenya en cas que el PDF d'origen estigui protegit.
Paràmetres d’entrada
| Argument | Opcional | Accepta | Valor per defecte | Descripció |
|---|---|---|---|---|
| Fitxer PDF | No | Fitxer | El fitxer PDF per extreure les pàgines. Introduïu un camí de fitxer, una variable que contingui un fitxer o un camí de text | |
| Contrasenya | Sí | Entrada xifrada directa o valor de text | La contrasenya del fitxer PDF. Deixeu-ho en blanc si el PDF no està protegit amb contrasenya | |
| Selecció de pàgines | No | Valor de text | Els números d'índex de les pàgines a conservar (per exemple, 1,3,17-24) | |
| Ruta PDF extreta | No | Fitxer | Camí on s'emmagatzemarà el fitxer PDF extret | |
| Si l'arxiu existeix | N/A | Sobreescriure, No sobreescriure, afegir sufix seqüencial | Afegeix sufix seqüencial | Especifica què cal fer en cas que el fitxer PDF de sortida ja existeixi |
Variables generades
| Argument | Type | Descripció |
|---|---|---|
| Extret PDF | Fitxer | El nou fitxer PDF |
Excepcions
| Excepció | Descripció |
|---|---|
| Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
| El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
| Pàgina fora dels límits | Indica que una o més pàgines estan fora dels límits del fitxer PDF |
| Selecció de pàgines no vàlida | Indica que les pàgines proporcionades no són vàlides per al fitxer PDF |
| No s'ha pogut extreure el PDF nou | Indica que s'ha produït un error en intentar extreure un PDF nou |
Combina fitxers PDF
Combina diversos fitxers PDF en un de nou.
Pots utilitzar l'acció "Fusionar arxius PDF" per agafar dos o més arxius PDF i combinar-los en un sol arxiu. Els fitxers que s'han de fusionar es poden proporcionar en forma de llista o entre cometes dobles i separats per un delimitador. També podeu proporcionar contrasenyes per als fitxers PDF, en cas que estiguin protegits amb contrasenya.
Paràmetres d’entrada
| Argument | Opcional | Accepta | Valor per defecte | Descripció |
|---|---|---|---|---|
| Fitxers PDF | No | Llista de fitxers | Els fitxers que s'han de fusionar. Tancar diversos fitxers entre cometes dobles (") i separar-los per un delimitador, o utilitzar una llista de fitxers | |
| Camí del PDF combinat | No | Fitxer | Camí on s'emmagatzemarà el fitxer PDF combinat | |
| Si l'arxiu existeix | N/A | Sobreescriure, No sobreescriure, afegir sufix seqüencial | Afegeix sufix seqüencial | Especifica què cal fer en cas que el fitxer de destinació ja existeixi |
| Contrasenyes | Sí | Entrada xifrada directa o valor de text | Les contrasenyes delimitades. L'ordre ha de ser el mateix que l'ordre dels PDF d'entrada. Deixeu-ho en blanc si els PDF no estan protegits amb contrasenya | |
| Delimitador | No | Valor de text | , | Un delimitador de contrasenya personalitzat. Aquest delimitador no hauria de formar part de cap de les contrasenyes |
Variables generades
| Argument | Type | Descripció |
|---|---|---|
| FusionatPDF | Fitxer | Fitxer PDF combinat |
Excepcions
| Excepció | Descripció |
|---|---|
| El fitxer PDF no existeix | El fitxer no existeix al camí proporcionat |
| Contrasenya no vàlida | La contrasenya proporcionada no és vàlida |
| No s'han pogut combinar els fitxers PDF | Indica que s'ha produït un error mentre es combinaven els fitxers |
Nota
Quan utilitzeu l'acció "Combina fitxers PDF", no definiu la destinació del PDF fusionat com un dels fitxers originals que s'estan fusionant. Això pot fer que l'acció falli i suprimeixi el fitxer original. Per protegir els documents originals, trieu sempre una ubicació de fitxer nova o una d'existent que no es trobi entre els fitxers originals que s'estan combinant per a la sortida del PDF combinat.