15Sep
Můžete snadno převést soubory PDF do editovatelného textu v systému Linux pomocí nástroje příkazového řádku "pdftotext".Pokud však v původním souboru PDF existují nějaké obrázky, nejsou vyčerpány. Chcete-li extrahovat obrázky ze souboru PDF, můžete použít jiný nástroj příkazového řádku s názvem "pdfimages".
POZNÁMKA: Když řekneme, že v tomto článku něco napíšete a v textu jsou citace, NEVYPLAJTE citace, pokud nestanovíme jinak.
Nástroj "pdfimages" je součástí balíčku poppler-utils. Můžete zkontrolovat, zda je nainstalován v systému a případně jej nainstalovat podle kroků popsaných v tomto článku.
Chcete-li extrahovat obrázky ze souboru PDF pomocí pdfimages, stiskněte "Ctrl + Alt + T" a otevřete okno Terminál. Na výzvu zadejte následující příkaz.
pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ obrázek
Poznámka: U všech příkazů uvedených v tomto článku nahraďte první cestu v příkazu a název souboru PDF cestu a název souboru původního souboru PDF.Druhá cesta by měla být cesta k kořenové složce, do které chcete ukládat extrahované obrázky. Slovo "obrázek" na konci druhé cesty představuje to, co chcete předat s vaším názvem souboru. Názvy souborů snímků jsou automaticky číslovány( 000, 001, 002, 003 atd.).Chcete-li přidat text na začátek každého obrázku, zadejte tento text na konci druhé cesty. V našem příkladu bude každý název souboru obrázku začínat "obrazem", jako je image-001.ppm, image-002.ppm atd. Mezi text, který zadáte, a číslo přidáte pomlčku.
Výchozí formát obrázku je PPM( přenosný pixmap) pro non-monochromatické obrázky nebo PBM( přenosné bitmapy) pro monochromatické obrázky. Tyto formáty jsou navrženy pro snadnou výměnu mezi platformami.
POZNÁMKA: V souboru PDF můžete získat dva soubory obrázků pro každý obrázek. Druhý snímek pro každý snímek je prázdný, takže budete moci zjistit, které obrázky obsahují obrázky ze souboru podle miniatury v souboru ve Správci souborů.
Chcete-li vytvořit soubory obrázků. jpg, přidejte k příkazu příkaz "-j", jak je uvedeno níže.
pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image
POZNÁMKA: Výchozí výstup můžete také změnit na PNG pomocí volby "-png" nebo TIFF pomocí volby "-tiff".
Hlavní obrazový soubor pro každý snímek je uložen jako soubor. jpg. Druhý prázdný snímek je stále soubor. ppm nebo. pbm.
Pokud chcete pouze převést obrázky na určitou stránku a po ní, použijte volbu "-f" číslem, abyste označili první stránku, kterou chcete převést, jak je uvedeno níže v příkladu příkazu.
pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image
POZNÁMKA: Kombinovali jsme volbu "-j" s volbou "-f", abychom získali obrázky. jpg a udělali totéž s volbou "-l"níže.
Chcete-li převést všechny snímky před a na určité stránce, použijte volbu "-l"( malá písmena "L", nikoliv číslo "1") s číslem, která označuje poslední stránku, kterou chcete převést, jak je uvedeno níže.
pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ obrázek
POZNÁMKA: Možnosti "-f" a "-l" můžete použít k převodu obrázků v určitém rozsahu stránek ve středu dokumentu.
Pokud v souboru PDF existuje heslo majitele, použijte volbu "-opw" a heslo v jednoduchých uvozovkách, jak je uvedeno níže. Pokud je heslo v souboru PDF uživatelským heslem, použijte volbu "-upw" místo hesla.
POZNÁMKA: Ujistěte se, že v příkazu je k dispozici jedno uvozovky kolem vašeho hesla.
pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image
Další informace o použití příkazu pdfimages zadejte příkaz "pdfimages" v okně Terminál a stiskněte "Enter".Zobrazí se použití příkazu se seznamem možností dostupných pro použití v příkazu.