29Jun

Jak převést soubor PDF na upravitelný text pomocí příkazového řádku v systému Linux

Existují různé důvody, proč můžete převést soubor PDF do upravitelného textu. Možná budete muset revidovat starý dokument a vše, co máte, je jeho verze PDF.Převod souborů PDF v systému Windows je snadný, ale co když používáte systém Linux?

Žádné obavy. Ukážeme vám, jak snadno převést soubory PDF do upravitelného textu pomocí nástroje příkazového řádku s názvem pdftotext, který je součástí balíčku "poppler-utils".Tento nástroj může být již nainstalován. Chcete-li zkontrolovat, zda je ve vašem systému nainstalován pdftotext, otevřete okno terminálu stisknutím klávesy "Ctrl + Alt + T".Na výzvu zadejte následující příkaz a stiskněte "Enter".

dpkg -s poppler-utils

POZNÁMKA: Když řekneme něco napsat v tomto článku a v textu jsou citace, NEVIDÍTE citace, pokud nestanovíme jinak.

Pokud není nainstalován pdftotext, zadejte na výzvu následující příkaz a stiskněte "Enter".

sudo apt-get nainstalovat poppler-utils

Po zadání výzvy zadejte své heslo a stiskněte "Enter".

V balíčku poppler-utils je k dispozici několik nástrojů pro konverzi PDF do různých formátů, manipulaci se soubory PDF a extrahování informací ze souborů.

Následuje základní příkaz pro konverzi souboru PDF do upravitelného textového souboru. Stisknutím tlačítka "Ctrl + Alt + T" otevřete okno Terminál, zadejte příkaz na výzvu a stiskněte tlačítko "Enter".

pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Změňte cestu ke každému souboru tak, aby odpovídala umístění a názvu původního souboru PDF a kam chcete uložit výsledný textový soubor. Změňte také názvy souborů tak, aby odpovídaly názvům souborů.

Textový soubor je vytvořen a lze ho otevřít stejně jako byste otevřeli libovolný jiný textový soubor v systému Linux.

Převedený text může mít řádky v místech, která nechcete.Řádky se vkládají po každém řádku textu do souboru PDF.

Rozložení dokumentu( záhlaví, zápatí, stránkování atd.) Můžete zachovat z původního souboru PDF v převedeném textovém souboru pomocí příznaku "-layout".

pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Chcete-li převést rozsah stránek pouze v souboru PDF, použijte příznaky "-f" a "-l"( malé písmeno "L") pro zadáníprvní a poslední stránky v rozsahu, který chcete převést.

pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Chcete-li převést soubor PDF, který je chráněn a šifrován heslem vlastníka, použijte příznak "-opw"( první znak ve vlajce je malá písmena "O ", nikoli nula).

pdftotext -opw 'heslo' /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Změna hesla na heslo použité k ochraně původního převedeného PDF souboru. Ujistěte se, že existují jednoduché uvozovky, nikoliv dvojnásobné, kolem "hesla".

Pokud je soubor PDF chráněn a šifrován heslem uživatele, použijte příznak "-upw" namísto příznaku "-opw".Zbytek příkazu je stejný.

Také můžete zadat typ znaku konce řádku, který je použit pro převedený text. To je obzvláště užitečné, pokud plánujete přistupovat k souboru v jiném operačním systému, jako je Windows nebo Mac. Chcete-li to provést, použijte příznak "-eol"( střední znak ve vlajce je malé písmeno "O", nikoliv nula), za kterým následuje mezera a typ znaku konce řádku, který chcete použít( "unix "," dos "nebo" mac ").

POZNÁMKA: Pokud nezadáte název souboru pro textový soubor, pdftotext automaticky použije základnu souboru PDF a přidá příponu ".txt".Například "file.pdf" bude převeden na "file.txt".Pokud je textový soubor zadán jako "-", převedený text je odeslán do stdout, což znamená, že text je zobrazen v okně Terminál a není uložen do souboru.

K zavření okna Terminál klepněte na tlačítko "X" v levém horním rohu.

Další informace o příkazu pdftotext zadejte příkaz "man page pdftotext" na výzvu v okně Terminal.