Notă
Accesul la această pagină necesită autorizare. Puteți încerca să vă conectați sau să modificați directoarele.
Accesul la această pagină necesită autorizare. Puteți încerca să modificați directoarele.
Acțiunile PDF vă permit să extrageți imagini, text și tabele din fișiere PDF și să aranjați pagini pentru a crea documente noi.
Pentru a extrage text dintr-un fișier PDF, utilizați acțiunea Extrage text din PDF . Următorul exemplu extrage text dintr-un anumit interval de pagini ale unui fișier protejat prin parolă. Parola este specificată în setările Avansate .
Pentru a extrage texte aranjate sub formă de tabel, activați Optimizare pentru date structurate pentru a îmbunătăți formatul și acuratețea rezultatelor.
Pentru a extrage tabele dintr-un fișier PDF, implementați acțiunea Extragere tabele din PDF , selectați fișierul și specificați paginile din care se va extrage.
Acțiunea produce variabila ExtractedPDFTables care conține o listă de informații despre tabelul PDF. Pentru a găsi informații despre acest tip de listă, accesați Tipuri de date avansate.
Notă
- Acțiunea Extragere tabele din PDF nu utilizează recunoașterea optică a caracterelor (OCR), deci nu puteți extrage text care nu poate fi copiat din PDF-urile scanate.
- Biblioteca din spatele acțiunii extrage ocazional date PDF suplimentare care nu sunt tabele. Această funcționalitate minimizează riscul omiterii accidentale a unui tabel real.
Pe lângă extragerea informațiilor din fișierele PDF, puteți crea un nou document PDF dintr-un fișier existent utilizând acțiunea Extrage paginile fișierului PDF într-un fișier PDF nou .
Următorul exemplu selectează o combinație de pagini specifice și un interval de pagini.
Extrageți text din PDF
Puteți extrage text dintr-un fișier PDF utilizând acțiunea „Extrage text din PDF”. În proprietățile acțiunii puteți defini fișierul PDF sursă și paginile din care trebuie extras textul. Sub proprietățile acțiunilor avansate puteți defini o parolă în cazul în care fișierul PDF este protejat și dacă motorul trebuie să se optimizeze pentru date structurate sau nu.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Fișier PDF | No | Fişier | Fișierul PDF din care se va extrage textul. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text | |
Pagini de extras | Nedisponibil | Toate, Unică, Interval | Tot | Specifică câte pagini să fie extrase: Toate paginile, o singură pagină sau un interval de pagini |
Număr pagină unică | No | Valoare numerică | Numărul paginii unice din care se extrage textul | |
Numărul paginii De la | No | Valoare numerică | Numărul primei pagini din intervalul de pagini din care se extrage textul | |
Numărul paginii Până la | No | Valoare numerică | Numărul ultimei pagini din intervalul de pagini din care se extrage textul | |
Parolă | Da | Intrare criptată directă sau valoare text | Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă. | |
Optimizare pentru datele structurate | Nedisponibil | Valoare booleană | Fals | Specificați dacă urmează să detectați aspectul formatat în document și să extrageți textul în mod corespunzător |
Variabile produse
Argument | Tipul | Descriere |
---|---|---|
Text PDF extras | Valoare text | Textul extras |
Excepții
Excepție | Descriere |
---|---|
Fișierul PDF nu există | Fișierul nu există pe calea specificată |
Parolă nevalidă | Parola specificată este nevalidă |
Extragerea textului nu a reușit | Eroare la încercarea de extragere a textului |
Extrageți tabele din PDF
Puteți extrage tabele conținute într-un fișier PDF utilizând acțiunea Extrage tabele din PDF . În proprietățile acțiunii puteți defini fișierul PDF și intervalul de pagini din care vor fi extrase tabelele. Sub proprietățile acțiunilor avansate puteți defini o parolă în cazul în care fișierul PDF este protejat, puteți defini dacă tabelul are anteturi sau nu și, în final, dacă tabelele care depășesc marginile paginii ar trebui sau nu îmbinate.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Fișier PDF | No | Fişier | Fișierul PDF din care se vor extrage tabelele. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text | |
Pagini de extras | Nedisponibil | Toate, Unică, Interval | Tot | Specifică din câte pagini vor fi extrase tabele: din toate paginile, dintr-o singură pagină sau dintr-un interval de pagini |
Număr pagină unică | No | Valoare numerică | Numărul unei singure pagini din care se extrag tabele | |
Numărul paginii De la | No | Valoare numerică | Primul număr de pagină din intervalul de pagini din care extrageți tabele | |
Numărul paginii Până la | No | Valoare numerică | Ultimul număr de pagină din intervalul de pagini din care se extrag tabelele | |
Parolă | Da | Intrare criptată directă sau valoare text | Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă. | |
Îmbinare tabele care depășesc marginile paginilor | Nedisponibil | Valoare booleană | Adevărat | Specifică dacă doriți să îmbinați tabelele care depășesc marginile paginilor în intervalul de pagini specificat |
Prima linie conține numele de coloane | Nedisponibil | Valoare booleană | Adevărat | Specifică dacă prima linie de tabel conține nume de coloane |
Variabile produse
Argument | Tipul | Descriere |
---|---|---|
Tabele PDF extrase | Listă de informații din tabelul PDF | Tabelele extrase cu informațiile lor aranjate ca listă |
Excepții
Excepție | Descriere |
---|---|
Fișierul PDF nu există | Fișierul nu există pe calea specificată |
Parolă nevalidă | Parola specificată este nevalidă |
Nu a reușit extragerea tabelelor | Eroare în timpul încercării de a extrage tabele |
Extrageți imagini din PDF
Pentru a extrage imagini dintr-un fișier PDF, puteți utiliza acțiunea Extrage imagini din PDF . În parametrii acțiunii puteți defini fișierul PDF și paginile din care se vor extrage imagini, convenția de denumire a imaginilor extrase și locația țintă a imaginilor salvate. De asemenea, puteți defini o parolă dacă fișierul PDF este protejat în setările avansate.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Fișier PDF | No | Fişier | Fișierul PDF din care se vor extrage imagini. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text | |
Parolă | Da | Intrare criptată directă sau valoare text | Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă. | |
Pagini de extras | Nedisponibil | Toate, Unică, Interval | Tot | Specifică câte pagini să fie extrase: Toate paginile, o singură pagină sau un interval de pagini |
Număr pagină unică | No | Valoare numerică | Numărul paginii unice din care vor fi extrase imagini | |
Numărul paginii De la | No | Valoare numerică | Primul număr de pagină din intervalul de pagini din care se vor extrage imagini | |
Numărul paginii Până la | No | Valoare numerică | Ultimul număr de pagină din intervalul de pagini din care se vor extrage imagini | |
Numele imaginilor | No | Valoare text | Cum începe numele imaginilor. Exemplu de nume pentru imagini extrase: GivenName_1, GivenName_2 | |
Salvați imaginile în | No | Pliant | Folderul pentru salvarea imaginilor extrase ca fișiere png |
Variabile produse
Această acțiune nu produce nicio variabilă.
Excepții
Excepție | Descriere |
---|---|
Parolă nevalidă | Parola specificată este nevalidă |
Extragerea imaginilor nu a reușit | Indică faptul că a apărut o eroare la extragerea imaginilor din paginile specificate ale PDF-ului |
Folderul nu există | Indică faptul că folderul nu există |
Fișierul PDF nu există | Fișierul nu există pe calea specificată |
Extrageți paginile unui fișier PDF într-un nou fișier PDF
Puteți crea un fișier PDF nou prin extragerea paginilor dintr-un fișier PDF existent utilizând acțiunea Pagini fișier PDF într-un fișier PDF nou . În parametrii acțiunii puteți defini fișierul PDF din care se vor extrage paginile, paginile care vor fi extrase, locația noului fișier PDF și ce ar trebui să se întâmple dacă există deja un fișier cu același nume și extensie. În cele din urmă, în secțiunea de proprietăți avansate puteți defini o parolă în cazul în care PDF-ul sursă este protejat.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Fișier PDF | No | Fişier | Fișierul PDF din care se vor extrage pagini. Introduceți o cale de fișier, o variabilă care conține un fișier sau o cale de text | |
Parolă | Da | Intrare criptată directă sau valoare text | Parola fișierului PDF. Lăsați acest câmp necompletat dacă PDF-ul nu este protejat prin parolă. | |
Selecție pagini | No | Valoare text | Numerele de index ale paginilor de păstrat (de exemplu, 1, 3, 17-24) | |
Calea PDF extrasă | No | Fişier | Calea de stocare a fișierului PDF extras | |
Dacă fișierul există | Nedisponibil | Suprascrie, Nu suprascrie, Adaugă sufix secvențial | Adăugați un sufix secvențial | Specifică modul în care se procedează în cazul în care fișierul PDF de ieșire există deja |
Variabile produse
Argument | Tipul | Descriere |
---|---|---|
PDF extras | Fişier | Noul fișier PDF |
Excepții
Excepție | Descriere |
---|---|
Parolă nevalidă | Parola specificată este nevalidă |
Fișierul PDF nu există | Fișierul nu există pe calea specificată |
Pagină în afara limitelor | Indică faptul că una sau mai multe pagini sunt în afara limitelor fișierului PDF |
Selecție pagină nevalidă | Indică faptul că paginile date nu sunt valide pentru fișierul PDF |
Extragerea noului PDF nu a reușit | Indică faptul că a apărut o eroare la încercarea de extragere a unui nou PDF |
Îmbinare fișiere PDF
Îmbină mai multe fișiere PDF într-unul nou.
Puteți utiliza acțiunea Îmbinare fișiere PDF pentru a lua două sau mai multe fișiere PDF și a le îmbina într-un singur fișier. Fișierele care urmează să fie îmbinate pot fi furnizate fie sub forma unei liste, fie între ghilimele și separate printr-un delimitator. De asemenea, puteți furniza parole pentru fișierele PDF, în cazul în care acestea sunt protejate prin parolă.
Parametri de intrare
Argument | Opțional | Acceptă | Valoare implicită | Descriere |
---|---|---|---|---|
Fișiere PDF | No | Listă de fișiere... | Fișierele de îmbinat. Încadrați mai multe fișiere între ghilimele (") și separați-le printr-un delimitator sau utilizați o listă de fișiere | |
Cale PDF îmbinat | No | Fişier | Calea de stocare a fișierului PDF îmbinat | |
Dacă fișierul există | Nedisponibil | Suprascrie, Nu suprascrie, Adaugă sufix secvențial | Adăugați un sufix secvențial | Specifică modul în care se procedează în cazul în care fișierul de destinație există deja |
Parole | Da | Intrare criptată directă sau valoare text | Parolele delimitate. Ordinea trebuie să fie aceeași cu ordinea PDF-urilor de intrare. Lăsați acest câmp necompletat dacă fișierele PDF nu sunt protejate prin parolă | |
Delimitator | No | Valoare text | . | Un delimitator de parole personalizat. Acest delimitator nu ar trebui să facă parte din niciuna dintre parole |
Variabile produse
Argument | Tipul | Descriere |
---|---|---|
PDF îmbinat | Fişier | Fișierul PDF îmbinat |
Excepții
Excepție | Descriere |
---|---|
Fișierul PDF nu există | Fișierul nu există pe calea specificată |
Parolă nevalidă | Parola specificată este nevalidă |
Îmbinarea fișierelor PDF nu a reușit | Indică faptul că a apărut o eroare la îmbinarea fișierelor |
Notă
Când utilizați acțiunea „Îmbinare fișiere PDF”, nu setați destinația pentru PDF-ul îmbinat ca fiind unul dintre fișierele originale care sunt îmbinate. Acest lucru poate duce la eșecul acțiunii și la ștergerea fișierului original. Pentru a proteja documentele originale, alegeți întotdeauna o locație nouă pentru fișiere sau una existentă, care nu se numără printre fișierele originale care sunt îmbinate pentru rezultatul PDF îmbinat.