PDF radnje
PDF radnje vam omogućavaju da izdvojite slike, tekst i tabele iz PDF datoteka i rasporedite stranice za kreiranje novih dokumenata.
Da biste izdvojili tekst iz PDF fajla, koristite tekst Extract iz PDF radnje . Sledeći primer izdvaja tekst iz određenog opsega stranica datoteke zaštićene lozinkom. Lozinka je navedena u više opcija za postavke .
Da biste izdvojili tekstove raspoređene u tabelarnom obliku, omogućite opciju Optimizuj za strukturirane podatke da bi se poboljšao format i tačnost rezultata.
Da biste izdvojili tabele iz PDF datoteke, primenite tabele za izdvajanje iz PDF radnje , izaberite datoteku i navedite stranice iz kojih ćete je izdvojiti.
Radnja daje promenljivu ExtractedPDFTables koja sadrži listu informacija o PDF tabeli. Da biste pronašli informacije o ovom tipu liste, idite na opciju "Više opcija za tipove podataka".
Belešku
- Tabele "Izdvajanje" iz PDF radnje ne koriste optičko prepoznavanje znakova (OCR), tako da ne možete da izdvojite tekst koji se ne može kopirati iz skeniranih PDF-ova.
- Biblioteka koja stoji iza radnje povremeno izdvaja dodatne PDF podatke koji nisu tabele. Ova funkcionalnost smanjuje rizik slučajnog izostavšavanja prave tabele.
Osim izdvajanja informacija iz PDF fajlova, novi PDF dokument možete kreirati i od postojećeg fajla pomoću stranica Extract PDF fajla u novu radnju PDF fajla .
Sledeći primer bira kombinaciju određenih stranica i opsega stranica.
Izdvoj tekst iz PDF datoteke
Tekst iz PDF fajla možete izdvojiti pomoću radnje "Izdvoj tekst iz PDF-a". U svojstvima radnje možete definisati izvornu PDF datoteku i stranice sa kojih tekst treba izdvojiti. U okviru naprednih svojstava radnje možete definisati lozinku u slučaju da je PDF datoteka zaštićena i da li motor treba da optimizuje za strukturirane podatke ili ne.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
PDF datoteka | No | Datoteke | PDF datoteka iz koje se izdvaja tekst. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju | |
Stranice za izdvajanje | Nepoznato | Sve, samac, domet | Svi | Određuje koliko stranica treba izdvojiti: sve stranice, jedna stranica ili opseg stranica |
Broj jedne stranice | No | Numerička vrednost | Broj jedne stranice sa koje se izdvaja tekst | |
Od stranice broj | No | Numerička vrednost | Broj prve stranice iz opsega stranica sa kojih se izdvaja tekst | |
Broj krajnje stranice | No | Numerička vrednost | Broj poslednje stranice iz opsega stranica sa kojih se izdvaja tekst | |
Lozinka | Da | Direktan šifrovani unos ili vrednost teksta | Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom | |
Optimizacija za strukturirane podatke | Nepoznato | Logička vrednost | Netačno | Odredite da li u dokumentu treba otkriti oblikovani raspored i u skladu sa tim izdvojiti tekst |
Proizvedene promenljive
Argument | Tip | Opis |
---|---|---|
IzdvojeniPDF tekst | Tekstualna vrednost | Izdvojeni tekst |
Izuzeci
Izuzetak | Opis |
---|---|
PDF datoteka ne postoji | Datoteka ne postoji na navedenoj putanji |
Nevažeća lozinka | Navedena lozinka je nevažeća |
Izdvajanje teksta nije uspelo | Greška pri pokušaju izdvajanja teksta |
Izdvojite tabele iz PDF dokumenta
Tabele koje se nalaze u PDF datoteci možete izdvojiti pomoću tabela "Izdvajanje" iz PDF radnje. U svojstvima radnje možete definisati PDF datoteku i opseg stranica iz kojih će tabele biti izdvojene. U okviru naprednih svojstava radnje možete definisati lozinku u slučaju da je PDF datoteka zaštićena, definisati da li tabela ima zaglavlja ili ne i na kraju da li tabele koje prelaze margine treba objediniti ili ne.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
PDF datoteka | No | Datoteke | PDF datoteka iz koje se izdvajaju tabele. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju | |
Stranice za izdvajanje | Nepoznato | Sve, samac, domet | Svi | Opseg iz koliko stranica treba izdvojiti tabele: sve stranice, jednu stranicu ili opseg stranica |
Broj jedne stranice | No | Numerička vrednost | Broj pojedinačne stranice iz koje se izdvajaju tabele | |
Od stranice broj | No | Numerička vrednost | Broj prve stranice iz opsega stranica iz kojeg se izdvajaju tabele | |
Broj krajnje stranice | No | Numerička vrednost | Broj poslednje stranice iz opsega stranica sa kojih se izdvajaju tabele | |
Lozinka | Da | Direktan šifrovani unos ili vrednost teksta | Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom | |
Objedinjavanje tabela koje prelaze margine stranice | Nepoznato | Logička vrednost | Tačno | Određuje da li treba objediniti tabele koje u navedenom opsegu stranica ukrštaju margine stranice |
Prvi red sadrži nazive kolona | Nepoznato | Logička vrednost | Tačno | Određuje da li prvi red tabele sadrži nazive kolona |
Proizvedene promenljive
Argument | Tip | Opis |
---|---|---|
IzdvojenePDF tabele | Spisak informacija o PDF tabeli | Izdvojene tabele sa informacijama u vidu liste |
Izuzeci
Izuzetak | Opis |
---|---|
PDF datoteka ne postoji | Datoteka ne postoji na navedenoj putanji |
Nevažeća lozinka | Navedena lozinka je nevažeća |
Izdvajanje tabela nije uspelo | Greška tokom pokušaja izdvajanja tabela |
Izdvoji slike iz PDF datoteke
Da biste izdvojili slike iz PDF fajla možete koristiti extract images iz PDF radnje. U parametrima radnje možete definisati PDF datoteku i stranice iz kojih ćete izdvojiti slike, konvenciju o imenovanju ekstaktovanih slika i ciljnu lokaciju sačuvanih slika. Lozinku možete definisati i ako je PDF datoteka zaštićena pod naprednim podešavanjima.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
PDF datoteka | No | Datoteke | PDF datoteka iz koje se izdvajaju slike. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju | |
Lozinka | Da | Direktan šifrovani unos ili vrednost teksta | Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom | |
Stranice za izdvajanje | Nepoznato | Sve, samac, domet | Svi | Određuje koliko stranica treba izdvojiti: sve stranice, jedna stranica ili opseg stranica |
Broj jedne stranice | No | Numerička vrednost | Broj jedne stranice sa koje se izdvajaju slike | |
Od stranice broj | No | Numerička vrednost | Broj prve stranice iz opsega stranica iz kojeg se izdvajaju slike | |
Broj krajnje stranice | No | Numerička vrednost | Poslednji broj stranice iz opsega stranica iz kojeg se izdvajaju slike | |
Ime slika | No | Tekstualna vrednost | Kako počinje ime slika. Primer imena izdvojenih slika: GivenName_1, GivenName_2 | |
Sačuvaj slike u | No | Fascikle | Fascikla za čuvanje izdvojenih slika kao png datoteka |
Proizvedene promenljive
Ova radnja ne proizvodi promenljive.
Izuzeci
Izuzetak | Opis |
---|---|
Nevažeća lozinka | Navedena lozinka je nevažeća |
Izdvajanje slika nije uspelo | Označava da je došlo do greške prilikom izdvajanja slika sa datih stranica PDF-a |
Fascikla ne postoji | Označava da fascikla ne postoji |
PDF datoteka ne postoji | Datoteka ne postoji na navedenoj putanji |
Izdvoj stranice PDF datoteke u novu PDF datoteku
Novi PDF fajl možete kreirati izdvajanjem stranica iz postojećeg PDF fajla pomoću stranica PDF fajla u novu radnju PDF fajla . U parametrima radnje možete definisati PDF fajl sa kojeg ćete izdvojiti stranice, stranice koje treba izdvojiti, lokaciju novog PDF fajla i šta bi trebalo da se desi ako fajl sa istim imenom i oznakom tipa datoteke već postoji. Na kraju, u okviru naprednih svojstava možete definisati lozinku u slučaju da je izvorni PDF zaštićen.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
PDF datoteka | No | Datoteke | PDF datoteka iz koje se izdvajaju stranice. Unošenje putanje datoteke, promenljive koja sadrži datoteku ili tekstualnu putanju | |
Lozinka | Da | Direktan šifrovani unos ili vrednost teksta | Lozinka PDF datoteke. Ostavite ovo prazno ako PDF nije zaštićen lozinkom | |
Izbor stranica | No | Tekstualna vrednost | Indeksni brojevi stranica koje treba zadržati (na primer, 1,3,17-24) | |
Izdvojena PDF putanja | No | Datoteke | Putanja na kojoj treba uskladištiti izdvojenu PDF datoteku | |
Ako datoteka postoji | Nepoznato | Zameni, ne zamenjuj, dodaj sekvencijalni sufiks | Dodaj sekvencijalni sufiks | Određuje šta treba uraditi u slučaju da izlazna PDF datoteka već postoji |
Proizvedene promenljive
Argument | Tip | Opis |
---|---|---|
IzdvojenoPDF | Datoteke | Nova PDF datoteka |
Izuzeci
Izuzetak | Opis |
---|---|
Nevažeća lozinka | Navedena lozinka je nevažeća |
PDF datoteka ne postoji | Datoteka ne postoji na navedenoj putanji |
Stranica izvan granica | Označava da su neke stranice van granica PDF datoteke |
Nevažeći izbor stranica | Označava da date stranice nisu važeće za PDF datoteku |
Izdvajanje novog PDF-a nije uspelo | Označava da je došlo do greške tokom pokušaja izdvajanja novog PDF-a |
Objedini PDF datoteke
Objedinjuje više PDF datoteka u novu.
Radnju objedinjavanja PDF datoteka možete da koristite da biste uzmu dve ili više PDF datoteka i objedinili ih u jednu datoteku. Datoteke koje treba objediniti mogu se obezbediti u obliku liste ili staviti u dvostruke navodnike i razdvojiti znakom razgraničavanja. Takođe možete da navedete lozinke za PDF datoteke, u slučaju da su zaštićene lozinkom.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
PDF datoteke | No | Listadatoteka | Datoteke za objedinjavanje. Stavite više datoteka u dvostruke navodnike (") i razdvojite ih znakom razgraničavanja ili koristite listu datoteka | |
Putanja objedinjene PDF datoteke | No | Datoteke | Putanja na kojoj treba uskladištiti objedinjenu PDF datoteku | |
Ako datoteka postoji | Nepoznato | Zameni, ne zamenjuj, dodaj sekvencijalni sufiks | Dodaj sekvencijalni sufiks | Određuje šta treba uraditi u slučaju da odredišna datoteka već postoji |
Lozinke | Da | Direktan šifrovani unos ili vrednost teksta | Razgraničene lozinke. Porudžbina bi trebalo da bude ista kao redosled ulaznih PDF-a. Ostavite ovo prazno ako PDF-ove nisu zaštićene lozinkom | |
Znak za razgraničavanje | No | Tekstualna vrednost | . | Prilagođeno znak razgraničavanja lozinke. Ovaj znak razgraničavanja ne bi trebalo da bude deo lozinke |
Proizvedene promenljive
Argument | Tip | Opis |
---|---|---|
ObjedinjeniPDF | Datoteke | Objedinjena PDF datoteka |
Izuzeci
Izuzetak | Opis |
---|---|
PDF datoteka ne postoji | Datoteka ne postoji na navedenoj putanji |
Nevažeća lozinka | Navedena lozinka je nevažeća |
Objedinjavanje PDF datoteka nije uspelo | Označava da je došlo do greške pri objedinjavanju datoteka |