Partajați prin


Acțiuni PDF

Acțiunile PDF vă permit să extrageți imagini, text și tabele din fișiere PDF și să aranjați pagini pentru a crea documente noi.

Pentru a extrage text dintr-un fișier PDF, utilizați acțiunea Extrage text din PDF . Următorul exemplu extrage text dintr-un anumit interval de pagini ale unui fișier protejat prin parolă. Parola este specificată în setările Avansate .

Pentru a extrage texte aranjate sub formă de tabel, activați Optimizare pentru date structurate pentru a îmbunătăți formatul și acuratețea rezultatelor.

Captură de ecran a acțiunii Extragere text din PDF.

Pentru a extrage tabele dintr-un fișier PDF, implementați acțiunea Extragere tabele din PDF , selectați fișierul și specificați paginile din care se va extrage.

Acțiunea produce variabila ExtractedPDFTables care conține o listă de informații despre tabelul PDF. Pentru a găsi informații despre acest tip de listă, accesați Tipuri de date avansate.

Notă

  • Acțiunea Extragere tabele din PDF nu utilizează recunoașterea optică a caracterelor (OCR), deci nu puteți extrage text care nu poate fi copiat din PDF-urile scanate.
  • Biblioteca din spatele acțiunii extrage ocazional date PDF suplimentare care nu sunt tabele. Această funcționalitate minimizează riscul omiterii accidentale a unui tabel real.

Captură de ecran a acțiunii Extragere tabele din PDF.

Pe lângă extragerea informațiilor din fișierele PDF, puteți crea un nou document PDF dintr-un fișier existent utilizând acțiunea Extrage paginile fișierului PDF într-un fișier PDF nou .

Următorul exemplu selectează o combinație de pagini specifice și un interval de pagini.

Captură de ecran a acțiunii Extragere pagini fișier PDF într-un fișier PDF nou.

Extrageți text din PDF

Puteți extrage text dintr-un fișier PDF utilizând acțiunea „Extrage text din PDF”. În proprietățile acțiunii puteți defini fișierul PDF sursă și paginile din care trebuie extras textul. Sub proprietățile acțiunilor avansate puteți defini o parolă în cazul în care fișierul PDF este protejat și dacă motorul trebuie să se optimizeze pentru date structurate sau nu.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Fișier PDF No Fişier Fișierul PDF din care se va extrage textul. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text
Pagini de extras Nedisponibil Toate, Unică, Interval Tot Specifică câte pagini să fie extrase: Toate paginile, o singură pagină sau un interval de pagini
Număr pagină unică No Valoare numerică Numărul paginii unice din care se extrage textul
Numărul paginii De la No Valoare numerică Numărul primei pagini din intervalul de pagini din care se extrage textul
Numărul paginii Până la No Valoare numerică Numărul ultimei pagini din intervalul de pagini din care se extrage textul
Parolă Da Intrare criptată directă sau valoare text Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă.
Optimizare pentru datele structurate Nedisponibil Valoare booleană Fals Specificați dacă urmează să detectați aspectul formatat în document și să extrageți textul în mod corespunzător

Variabile produse

Argument Tipul Descriere
Text PDF extras Valoare text Textul extras

Excepții

Excepție Descriere
Fișierul PDF nu există Fișierul nu există pe calea specificată
Parolă nevalidă Parola specificată este nevalidă
Extragerea textului nu a reușit Eroare la încercarea de extragere a textului

Extrageți tabele din PDF

Puteți extrage tabele conținute într-un fișier PDF utilizând acțiunea Extrage tabele din PDF . În proprietățile acțiunii puteți defini fișierul PDF și intervalul de pagini din care vor fi extrase tabelele. Sub proprietățile acțiunilor avansate puteți defini o parolă în cazul în care fișierul PDF este protejat, puteți defini dacă tabelul are anteturi sau nu și, în final, dacă tabelele care depășesc marginile paginii ar trebui sau nu îmbinate.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Fișier PDF No Fişier Fișierul PDF din care se vor extrage tabelele. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text
Pagini de extras Nedisponibil Toate, Unică, Interval Tot Specifică din câte pagini vor fi extrase tabele: din toate paginile, dintr-o singură pagină sau dintr-un interval de pagini
Număr pagină unică No Valoare numerică Numărul unei singure pagini din care se extrag tabele
Numărul paginii De la No Valoare numerică Primul număr de pagină din intervalul de pagini din care extrageți tabele
Numărul paginii Până la No Valoare numerică Ultimul număr de pagină din intervalul de pagini din care se extrag tabelele
Parolă Da Intrare criptată directă sau valoare text Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă.
Îmbinare tabele care depășesc marginile paginilor Nedisponibil Valoare booleană Adevărat Specifică dacă doriți să îmbinați tabelele care depășesc marginile paginilor în intervalul de pagini specificat
Prima linie conține numele de coloane Nedisponibil Valoare booleană Adevărat Specifică dacă prima linie de tabel conține nume de coloane

Variabile produse

Argument Tipul Descriere
Tabele PDF extrase Listă de informații din tabelul PDF Tabelele extrase cu informațiile lor aranjate ca listă

Excepții

Excepție Descriere
Fișierul PDF nu există Fișierul nu există pe calea specificată
Parolă nevalidă Parola specificată este nevalidă
Nu a reușit extragerea tabelelor Eroare în timpul încercării de a extrage tabele

Extrageți imagini din PDF

Pentru a extrage imagini dintr-un fișier PDF, puteți utiliza acțiunea Extrage imagini din PDF . În parametrii acțiunii puteți defini fișierul PDF și paginile din care se vor extrage imagini, convenția de denumire a imaginilor extrase și locația țintă a imaginilor salvate. De asemenea, puteți defini o parolă dacă fișierul PDF este protejat în setările avansate.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Fișier PDF No Fişier Fișierul PDF din care se vor extrage imagini. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text
Parolă Da Intrare criptată directă sau valoare text Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă.
Pagini de extras Nedisponibil Toate, Unică, Interval Tot Specifică câte pagini să fie extrase: Toate paginile, o singură pagină sau un interval de pagini
Număr pagină unică No Valoare numerică Numărul paginii unice din care vor fi extrase imagini
Numărul paginii De la No Valoare numerică Primul număr de pagină din intervalul de pagini din care se vor extrage imagini
Numărul paginii Până la No Valoare numerică Ultimul număr de pagină din intervalul de pagini din care se vor extrage imagini
Numele imaginilor No Valoare text Cum începe numele imaginilor. Exemplu de nume pentru imagini extrase: GivenName_1, GivenName_2
Salvați imaginile în No Pliant Folderul pentru salvarea imaginilor extrase ca fișiere png

Variabile produse

Această acțiune nu produce nicio variabilă.

Excepții

Excepție Descriere
Parolă nevalidă Parola specificată este nevalidă
Extragerea imaginilor nu a reușit Indică faptul că a apărut o eroare la extragerea imaginilor din paginile specificate ale PDF-ului
Folderul nu există Indică faptul că folderul nu există
Fișierul PDF nu există Fișierul nu există pe calea specificată

Extrageți paginile unui fișier PDF într-un nou fișier PDF

Puteți crea un fișier PDF nou prin extragerea paginilor dintr-un fișier PDF existent utilizând acțiunea Pagini fișier PDF într-un fișier PDF nou . În parametrii acțiunii puteți defini fișierul PDF din care se vor extrage paginile, paginile care vor fi extrase, locația noului fișier PDF și ce ar trebui să se întâmple dacă există deja un fișier cu același nume și extensie. În cele din urmă, în secțiunea de proprietăți avansate puteți defini o parolă în cazul în care PDF-ul sursă este protejat.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Fișier PDF No Fişier Fișierul PDF din care se vor extrage pagini. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text
Parolă Da Intrare criptată directă sau valoare text Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă.
Selecție pagini No Valoare text Numerele de index ale paginilor de păstrat (de exemplu, 1, 3, 17-24)
Calea PDF extrasă No Fişier Calea de stocare a fișierului PDF extras
Dacă fișierul există Nedisponibil Suprascrie, Nu suprascrie, Adaugă sufix secvențial Adăugați un sufix secvențial Specifică modul în care se procedează în cazul în care fișierul PDF de ieșire există deja

Variabile produse

Argument Tipul Descriere
PDF extras Fişier Noul fișier PDF

Excepții

Excepție Descriere
Parolă nevalidă Parola specificată este nevalidă
Fișierul PDF nu există Fișierul nu există pe calea specificată
Pagină în afara limitelor Indică faptul că una sau mai multe pagini sunt în afara limitelor fișierului PDF
Selecție pagină nevalidă Indică faptul că paginile date nu sunt valide pentru fișierul PDF
Extragerea noului PDF nu a reușit Indică faptul că a apărut o eroare la încercarea de extragere a unui nou PDF

Îmbinare fișiere PDF

Îmbină mai multe fișiere PDF într-unul nou.

Puteți utiliza acțiunea Îmbinare fișiere PDF pentru a lua două sau mai multe fișiere PDF și a le îmbina într-un singur fișier. Fișierele care urmează să fie îmbinate pot fi furnizate fie sub forma unei liste, fie între ghilimele și separate printr-un delimitator. De asemenea, puteți furniza parole pentru fișierele PDF, în cazul în care acestea sunt protejate prin parolă.

Parametri de intrare

Argument Opțional Acceptă Valoare implicită Descriere
Fișiere PDF No Listă de fișiere... Fișierele de îmbinat. Încadrați mai multe fișiere între ghilimele (") și separați-le printr-un delimitator sau utilizați o listă de fișiere
Cale PDF îmbinat No Fişier Calea de stocare a fișierului PDF îmbinat
Dacă fișierul există Nedisponibil Suprascrie, Nu suprascrie, Adaugă sufix secvențial Adăugați un sufix secvențial Specifică modul în care se procedează în cazul în care fișierul de destinație există deja
Parole Da Intrare criptată directă sau valoare text Parolele delimitate. Ordinea trebuie să fie aceeași cu ordinea PDF-urilor de intrare. Lăsați acest câmp necompletat dacă fișierele PDF nu sunt protejate prin parolă
Delimitator No Valoare text . Un delimitator de parole personalizat. Acest delimitator nu ar trebui să facă parte din niciuna dintre parole

Variabile produse

Argument Tipul Descriere
PDF îmbinat Fişier Fișierul PDF îmbinat

Excepții

Excepție Descriere
Fișierul PDF nu există Fișierul nu există pe calea specificată
Parolă nevalidă Parola specificată este nevalidă
Îmbinarea fișierelor PDF nu a reușit Indică faptul că a apărut o eroare la îmbinarea fișierelor

Notă

Când utilizați acțiunea „Îmbinare fișiere PDF”, nu setați destinația pentru PDF-ul îmbinat ca fiind unul dintre fișierele originale care sunt îmbinate. Acest lucru poate duce la eșecul acțiunii și la ștergerea fișierului original. Pentru a proteja documentele originale, alegeți întotdeauna o locație nouă pentru fișiere sau una existentă, care nu se numără printre fișierele originale care sunt îmbinate pentru rezultatul PDF îmbinat.