Deli putem


PDF radnje

PDF radnje vam omogućavaju da izdvojite slike, tekst i tabele iz PDF datoteka i rasporedite stranice za kreiranje novih dokumenata.

Da biste izdvojili tekst iz PDF fajla, koristite tekst Extract iz PDF radnje . Sledeći primer izdvaja tekst iz određenog opsega stranica datoteke zaštićene lozinkom. Lozinka je navedena u više opcija za postavke .

Da biste izdvojili tekstove raspoređene u tabelarnom obliku, omogućite opciju Optimizuj za strukturirane podatke da bi se poboljšao format i tačnost rezultata.

Snimak ekrana teksta

Da biste izdvojili tabele iz PDF datoteke, primenite tabele za izdvajanje iz PDF radnje , izaberite datoteku i navedite stranice iz kojih ćete je izdvojiti.

Radnja daje promenljivu ExtractedPDFTables koja sadrži listu informacija o PDF tabeli. Da biste pronašli informacije o ovom tipu liste, idite na opciju "Više opcija za tipove podataka".

Belešku

  • Tabele "Izdvajanje" iz PDF radnje ne koriste optičko prepoznavanje znakova (OCR), tako da ne možete da izdvojite tekst koji se ne može kopirati iz skeniranih PDF-ova.
  • Biblioteka koja stoji iza radnje povremeno izdvaja dodatne PDF podatke koji nisu tabele. Ova funkcionalnost smanjuje rizik slučajnog izostavšavanja prave tabele.

Snimak ekrana tabela

Osim izdvajanja informacija iz PDF fajlova, novi PDF dokument možete kreirati i od postojećeg fajla pomoću stranica Extract PDF fajla u novu radnju PDF fajla .

Sledeći primer bira kombinaciju određenih stranica i opsega stranica.

Snimak ekrana stranica

Izdvoj tekst iz PDF datoteke

Tekst iz PDF fajla možete izdvojiti pomoću radnje "Izdvoj tekst iz PDF-a". U svojstvima radnje možete definisati izvornu PDF datoteku i stranice sa kojih tekst treba izdvojiti. U okviru naprednih svojstava radnje možete definisati lozinku u slučaju da je PDF datoteka zaštićena i da li motor treba da optimizuje za strukturirane podatke ili ne.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
PDF datoteka No Datoteke PDF datoteka iz koje se izdvaja tekst. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju
Stranice za izdvajanje Nepoznato Sve, samac, domet Svi Određuje koliko stranica treba izdvojiti: sve stranice, jedna stranica ili opseg stranica
Broj jedne stranice No Numerička vrednost Broj jedne stranice sa koje se izdvaja tekst
Od stranice broj No Numerička vrednost Broj prve stranice iz opsega stranica sa kojih se izdvaja tekst
Broj krajnje stranice No Numerička vrednost Broj poslednje stranice iz opsega stranica sa kojih se izdvaja tekst
Lozinka Da Direktan šifrovani unos ili vrednost teksta Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom
Optimizacija za strukturirane podatke Nepoznato Logička vrednost Netačno Odredite da li u dokumentu treba otkriti oblikovani raspored i u skladu sa tim izdvojiti tekst

Proizvedene promenljive

Argument Tip Opis
IzdvojeniPDF tekst Tekstualna vrednost Izdvojeni tekst

Izuzeci

Izuzetak Opis
PDF datoteka ne postoji Datoteka ne postoji na navedenoj putanji
Nevažeća lozinka Navedena lozinka je nevažeća
Izdvajanje teksta nije uspelo Greška pri pokušaju izdvajanja teksta

Izdvojite tabele iz PDF dokumenta

Tabele koje se nalaze u PDF datoteci možete izdvojiti pomoću tabela "Izdvajanje" iz PDF radnje. U svojstvima radnje možete definisati PDF datoteku i opseg stranica iz kojih će tabele biti izdvojene. U okviru naprednih svojstava radnje možete definisati lozinku u slučaju da je PDF datoteka zaštićena, definisati da li tabela ima zaglavlja ili ne i na kraju da li tabele koje prelaze margine treba objediniti ili ne.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
PDF datoteka No Datoteke PDF datoteka iz koje se izdvajaju tabele. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju
Stranice za izdvajanje Nepoznato Sve, samac, domet Svi Opseg iz koliko stranica treba izdvojiti tabele: sve stranice, jednu stranicu ili opseg stranica
Broj jedne stranice No Numerička vrednost Broj pojedinačne stranice iz koje se izdvajaju tabele
Od stranice broj No Numerička vrednost Broj prve stranice iz opsega stranica iz kojeg se izdvajaju tabele
Broj krajnje stranice No Numerička vrednost Broj poslednje stranice iz opsega stranica sa kojih se izdvajaju tabele
Lozinka Da Direktan šifrovani unos ili vrednost teksta Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom
Objedinjavanje tabela koje prelaze margine stranice Nepoznato Logička vrednost Tačno Određuje da li treba objediniti tabele koje u navedenom opsegu stranica ukrštaju margine stranice
Prvi red sadrži nazive kolona Nepoznato Logička vrednost Tačno Određuje da li prvi red tabele sadrži nazive kolona

Proizvedene promenljive

Argument Tip Opis
IzdvojenePDF tabele Spisak informacija o PDF tabeli Izdvojene tabele sa informacijama u vidu liste

Izuzeci

Izuzetak Opis
PDF datoteka ne postoji Datoteka ne postoji na navedenoj putanji
Nevažeća lozinka Navedena lozinka je nevažeća
Izdvajanje tabela nije uspelo Greška tokom pokušaja izdvajanja tabela

Izdvoji slike iz PDF datoteke

Da biste izdvojili slike iz PDF fajla možete koristiti extract images iz PDF radnje. U parametrima radnje možete definisati PDF datoteku i stranice iz kojih ćete izdvojiti slike, konvenciju o imenovanju ekstaktovanih slika i ciljnu lokaciju sačuvanih slika. Lozinku možete definisati i ako je PDF datoteka zaštićena pod naprednim podešavanjima.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
PDF datoteka No Datoteke PDF datoteka iz koje se izdvajaju slike. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju
Lozinka Da Direktan šifrovani unos ili vrednost teksta Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom
Stranice za izdvajanje Nepoznato Sve, samac, domet Svi Određuje koliko stranica treba izdvojiti: sve stranice, jedna stranica ili opseg stranica
Broj jedne stranice No Numerička vrednost Broj jedne stranice sa koje se izdvajaju slike
Od stranice broj No Numerička vrednost Broj prve stranice iz opsega stranica iz kojeg se izdvajaju slike
Broj krajnje stranice No Numerička vrednost Poslednji broj stranice iz opsega stranica iz kojeg se izdvajaju slike
Ime slika No Tekstualna vrednost Kako počinje ime slika. Primer imena izdvojenih slika: GivenName_1, GivenName_2
Sačuvaj slike u No Fascikle Fascikla za čuvanje izdvojenih slika kao png datoteka

Proizvedene promenljive

Ova radnja ne proizvodi promenljive.

Izuzeci

Izuzetak Opis
Nevažeća lozinka Navedena lozinka je nevažeća
Izdvajanje slika nije uspelo Označava da je došlo do greške prilikom izdvajanja slika sa datih stranica PDF-a
Fascikla ne postoji Označava da fascikla ne postoji
PDF datoteka ne postoji Datoteka ne postoji na navedenoj putanji

Izdvoj stranice PDF datoteke u novu PDF datoteku

Novi PDF fajl možete kreirati izdvajanjem stranica iz postojećeg PDF fajla pomoću stranica PDF fajla u novu radnju PDF fajla . U parametrima radnje možete definisati PDF fajl sa kojeg ćete izdvojiti stranice, stranice koje treba izdvojiti, lokaciju novog PDF fajla i šta bi trebalo da se desi ako fajl sa istim imenom i oznakom tipa datoteke već postoji. Na kraju, u okviru naprednih svojstava možete definisati lozinku u slučaju da je izvorni PDF zaštićen.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
PDF datoteka No Datoteke PDF datoteka iz koje se izdvajaju stranice. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju
Lozinka Da Direktan šifrovani unos ili vrednost teksta Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom
Izbor stranica No Tekstualna vrednost Indeksni brojevi stranica koje treba zadržati (na primer, 1,3,17-24)
Izdvojena PDF putanja No Datoteke Putanja na kojoj treba uskladištiti izdvojenu PDF datoteku
Ako datoteka postoji Nepoznato Zameni, ne zamenjuj, dodaj sekvencijalni sufiks Dodaj sekvencijalni sufiks Određuje šta treba uraditi u slučaju da izlazna PDF datoteka već postoji

Proizvedene promenljive

Argument Tip Opis
IzdvojenoPDF Datoteke Nova PDF datoteka

Izuzeci

Izuzetak Opis
Nevažeća lozinka Navedena lozinka je nevažeća
PDF datoteka ne postoji Datoteka ne postoji na navedenoj putanji
Stranica izvan granica Označava da su neke stranice van granica PDF datoteke
Nevažeći izbor stranica Označava da date stranice nisu važeće za PDF datoteku
Izdvajanje novog PDF-a nije uspelo Označava da je došlo do greške tokom pokušaja izdvajanja novog PDF-a

Objedini PDF datoteke

Objedinjuje više PDF datoteka u novu.

Radnju objedinjavanja PDF datoteka možete da koristite da biste uzmu dve ili više PDF datoteka i objedinili ih u jednu datoteku. Datoteke koje treba objediniti mogu se obezbediti u obliku liste ili staviti u dvostruke navodnike i razdvojiti znakom razgraničavanja. Takođe možete da navedete lozinke za PDF datoteke, u slučaju da su zaštićene lozinkom.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
PDF datoteke No Listadatoteka Datoteke za objedinjavanje. Stavite više datoteka u dvostruke navodnike (") i razdvojite ih znakom razgraničavanja ili koristite listu datoteka
Putanja objedinjene PDF datoteke No Datoteke Putanja na kojoj treba uskladištiti objedinjenu PDF datoteku
Ako datoteka postoji Nepoznato Zameni, ne zamenjuj, dodaj sekvencijalni sufiks Dodaj sekvencijalni sufiks Određuje šta treba uraditi u slučaju da odredišna datoteka već postoji
Lozinke Da Direktan šifrovani unos ili vrednost teksta Razgraničene lozinke. Porudžbina bi trebalo da bude ista kao redosled ulaznih PDF-a. Ostavite ovo prazno ako PDF-ove nisu zaštićene lozinkom
Znak za razgraničavanje No Tekstualna vrednost . Prilagođeno znak razgraničavanja lozinke. Ovaj znak razgraničavanja ne bi trebalo da bude deo lozinke

Proizvedene promenljive

Argument Tip Opis
ObjedinjeniPDF Datoteke Objedinjena PDF datoteka

Izuzeci

Izuzetak Opis
PDF datoteka ne postoji Datoteka ne postoji na navedenoj putanji
Nevažeća lozinka Navedena lozinka je nevažeća
Objedinjavanje PDF datoteka nije uspelo Označava da je došlo do greške pri objedinjavanju datoteka