29Jun

Ako previesť súbor PDF do editovateľného textu pomocou príkazového riadku v systéme Linux

Existujú rôzne dôvody, prečo by ste mohli konvertovať súbor PDF do upraviteľného textu. Možno budete musieť revidovať starý dokument a všetko, čo máte, je verzia vo formáte PDF.Konvertovanie súborov PDF v systéme Windows je jednoduché, ale čo ak používate systém Linux?

Žiadne obavy. Ukážeme vám, ako ľahko konvertovať súbory PDF na upraviteľný text pomocou nástroja príkazového riadku s názvom pdftotext, ktorý je súčasťou balíka "poppler-utils".Tento nástroj môže byť už nainštalovaný.Ak chcete skontrolovať, či je v systéme nainštalovaný pdftotext, stlačte "Ctrl + Alt + T" na otvorenie okna terminálu. Na výzvu zadajte nasledujúci príkaz a stlačte kláves Enter.

dpkg -s poppler-utils

POZNÁMKA: Keď povieme, že v tomto článku niečo napíšete a v texte sú citácie, NEVYPLAVTE úvodzovky, ak neurčíme inak.

Ak nie je nainštalovaný pdftotext, zadajte na výzvu nasledujúci príkaz a stlačte "Enter".

sudo apt-get nainštalovať poppler-utils

Po výzve zadajte svoje heslo a stlačte "Enter".

V balíku poppler-utils je k dispozícii niekoľko nástrojov na konverziu PDF do rôznych formátov, manipuláciu so súbormi PDF a extrakciu informácií zo súborov.

Nasledujúci je základný príkaz na konverziu súboru PDF do editovateľného textového súboru. Stlačením klávesov "Ctrl + Alt + T" otvorte okno Terminál, napíšte príkaz na výzvu a stlačte "Enter".

pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Zmeňte cestu ku každému súboru tak, aby zodpovedala umiestneniu a názvu pôvodného súboru PDF a kam chcete uložiť výsledný textový súbor. Zmeniť názvy súborov tak, aby zodpovedali menám vašich súborov.

Textový súbor je vytvorený a môže byť otvorený rovnako, ako by ste otvorili ľubovoľný iný textový súbor v systéme Linux.

Konvertovaný text môže mať zlomky riadkov na miestach, ktoré nechcete. Prerušenie riadkov sa vkladá za každý riadok textu do súboru PDF.

Rozloženie dokumentu( hlavičky, päty, stránkovanie atď.) Z pôvodného súboru PDF v konvertovanom textovom súbore môžete zachovať pomocou príznaku "-layout".

pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Ak chcete previesť celý rad strán do súboru PDF, použite príznaky "-f" a "-l"( malé písmeno "L") na zadanieprvú a poslednú stranu v rozsahu, ktorý chcete konvertovať.

pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Ak chcete previesť súbor PDF, ktorý je chránený a zašifrovaný heslom vlastníka, použite príznak "-opw"( prvý znak vo vlajke je malé písmeno "O ", nie je nula).

pdftotext -opw 'heslo' /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Zmeňte "heslo" na heslo použité na ochranu pôvodného PDF súboru, ktorý sa prevádza. Uistite sa, že existujú jednoduché úvodzovky, nie dvojité, okolo "hesla".

Ak je súbor PDF chránený a šifrovaný heslom používateľa, použite príznak "-upw" namiesto príznaku "-opw".Zvyšok príkazu je rovnaký.

Môžete tiež určiť typ koncového znaku, ktorý sa použije na prekonvertovaný text. To je obzvlášť užitočné, ak plánujete prístup k súboru v inom operačnom systéme, ako je Windows alebo Mac. Použite príznak "-eol"( stredný znak vo vlajke je malé písmeno "O", nie nula), za ktorým nasleduje medzera a typ znaku na konci riadku, ktorý chcete použiť( "unix "," dos "alebo" mac ").

POZNÁMKA: Ak nezadáte názov súboru pre textový súbor, pdftotext automaticky použije základňu súboru PDF a pridá príponu ".txt".Napríklad "file.pdf" sa skonvertuje na "file.txt".Ak je textový súbor zadaný ako "-", prevedený text sa odošle do stdout, čo znamená, že text sa zobrazí v okne Terminál a nie je uložený do súboru.

Ak chcete zatvoriť okno Terminál, kliknite na tlačidlo "X" v ľavom hornom rohu.

Ďalšie informácie o príkaze pdftotext zadajte v okne Terminál na výzvu "man page pdftotext".