29Jun

Kako pretvoriti PDF datoteku u tekst koji se može uređivati ​​pomoću naredbenog retka u Linuxu

Postoje razni razlozi zašto biste htjeli pretvoriti PDF datoteku u tekst koji se može uređivati. Možda trebate izmijeniti stari dokument i sve što imate je PDF inačica. Pretvaranje PDF datoteka u sustavu Windows je jednostavno, ali što ako koristite Linux?

Nema brige. Pokazat ćemo vam kako jednostavno pretvoriti PDF datoteke u tekst koji se može uređivati ​​pomoću alata naredbenog retka pod nazivom pdftotext, koji je dio paketa "poppler-utils".Ovaj alat možda je već instaliran. Da biste provjerili je li pdftotext instaliran na vašem sustavu, pritisnite "Ctrl + Alt + T" da biste otvorili prozor terminala. Upišite sljedeću naredbu i pritisnite "Enter".

dpkg -s poppler-utils

NAPOMENA: Kada kažemo da nešto upišemo u ovom članku i postoje citati oko teksta, NEMOJTE upisati citate, osim ako ne navedemo drugačije.

Ako pdftotext nije instaliran, upišite sljedeću naredbu i pritisnite "Enter".

sudo apt-get install poppler-utils

Upišite svoju lozinku kada se to zatraži i pritisnite "Enter".

U poppler-utils paketu postoji nekoliko alata za pretvaranje PDF-a u različite formate, manipuliranje PDF datotekama i vađenje podataka iz datoteka.

Sljedeće je osnovna naredba za pretvaranje PDF datoteke u tekstualnu datoteku koja se može uređivati. Pritisnite "Ctrl + Alt + T" za otvaranje prozora terminala, upišite naredbu u brz i pritisnite "Enter".

pdftotext /home/lori/Documents/ Primjer.pdf /home/lori/Documents/ Sample.txt

Promijenite put do svake datoteke kako biste odgovarali lokaciji i nazivu izvorne PDF datoteke i gdje želite spremiti rezultirajuću tekstualnu datoteku. Također, promijenite nazive datoteka kako bi odgovarale imenima vaših datoteka.

Tekstna datoteka je stvorena i može se otvoriti baš kao što biste otvorili bilo koju drugu tekstualnu datoteku u Linuxu.

Pretvoreni tekst može imati prekidne linije na mjestima koja ne želite. Odluke linije unose se nakon svakog retka teksta u PDF datotekama.

Možete zadržati izgled dokumenta( zaglavlja, podnožja, paging itd.) Iz izvorne PDF datoteke u konvertiranoj tekstualnoj datoteci pomoću oznake "-layout".

pdftotext - /home/lori/Documents/ Primjer.pdf /home/lori/Documents/ Sample.txt

Ako želite pretvoriti samo raspon stranica u PDF datoteku, upotrijebite oznake "-f" i "-l"( mala slova "L") kako biste odrediliprve i zadnje stranice u rasponu koji želite pretvoriti.

pdftotext -f 5 -l 9 /home/lori/Documents/ Primjer.pdf /home/lori/Documents/ Sample.txt

Za pretvaranje PDF datoteke koja je zaštićena i šifrirana lozinkom vlasnika, upotrijebite zastavicu "-opw"( prvi znak u zastavici je mala slovo "O ", a ne nula).

pdftotext -opw 'lozinka' /home/lori/Documents/ Primjer.pdf /home/lori/Documents/ Sample.txt

Promijenite "lozinku" za onu koja se koristi za zaštitu izvorne PDF datoteke koja se pretvara. Provjerite jesu li pojedinačni citati, a ne dvostruki, oko "lozinke".

Ako je PDF datoteka zaštićena i šifrirana korisničkom lozinkom, upotrijebite oznaku "-upw" umjesto "-opw" oznake. Ostatak naredbe je isti.

Također možete odrediti vrstu krajnjeg retka koji se primjenjuje na konvertirani tekst. To je osobito korisno ako namjeravate pristupiti datoteci na drugom operativnom sustavu kao što je Windows ili Mac. Da biste to učinili, upotrijebite zastavicu "-eol"( srednji znak u zastavici je mala slovo "O", a ne nula) nakon kojeg slijedi razmak i vrsta krajnjeg retka koji želite upotrijebiti( "unix "," dos "ili" mac ").

NAPOMENA: Ako ne odredite naziv datoteke za tekstnu datoteku, pdftotext automatski koristi bazu naziva datoteke u PDF-u i dodaje proširenje ".txt".Na primjer, "file.pdf" pretvorit će se u "file.txt".Ako je tekstualna datoteka navedena kao "-", konvertirani tekst šalje se u stdout, što znači da se tekst prikazuje u prozoru terminala i da se ne sprema u datoteku.

Da biste zatvorili prozor terminala, kliknite gumb "X" u gornjem lijevom kutu.

Za više informacija o naredbi pdftotext, upišite "man page pdftotext" na upit u prozoru terminala.