15Sep

Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux

Můžete snadno převést soubory PDF do editovatelného textu v systému Linux pomocí nástroje příkazového řádku "pdftotext".Pokud však v původním souboru PDF existují nějaké obrázky, nejsou vyčerpány. Chcete-li extrahovat obrázky ze souboru PDF, můžete použít jiný nástroj příkazového řádku s názvem "pdfimages".

POZNÁMKA: Když řekneme, že v tomto článku něco napíšete a v textu jsou citace, NEVYPLAJTE citace, pokud nestanovíme jinak.

Nástroj "pdfimages" je součástí balíčku poppler-utils. Můžete zkontrolovat, zda je nainstalován v systému a případně jej nainstalovat podle kroků popsaných v tomto článku.

Chcete-li extrahovat obrázky ze souboru PDF pomocí pdfimages, stiskněte "Ctrl + Alt + T" a otevřete okno Terminál. Na výzvu zadejte následující příkaz.

pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ obrázek

Poznámka: U všech příkazů uvedených v tomto článku nahraďte první cestu v příkazu a název souboru PDF cestu a název souboru původního souboru PDF.Druhá cesta by měla být cesta k kořenové složce, do které chcete ukládat extrahované obrázky. Slovo "obrázek" na konci druhé cesty představuje to, co chcete předat s vaším názvem souboru. Názvy souborů snímků jsou automaticky číslovány( 000, 001, 002, 003 atd.).Chcete-li přidat text na začátek každého obrázku, zadejte tento text na konci druhé cesty. V našem příkladu bude každý název souboru obrázku začínat "obrazem", jako je image-001.ppm, image-002.ppm atd. Mezi text, který zadáte, a číslo přidáte pomlčku.

Výchozí formát obrázku je PPM( přenosný pixmap) pro non-monochromatické obrázky nebo PBM( přenosné bitmapy) pro monochromatické obrázky. Tyto formáty jsou navrženy pro snadnou výměnu mezi platformami.

POZNÁMKA: V souboru PDF můžete získat dva soubory obrázků pro každý obrázek. Druhý snímek pro každý snímek je prázdný, takže budete moci zjistit, které obrázky obsahují obrázky ze souboru podle miniatury v souboru ve Správci souborů.

Chcete-li vytvořit soubory obrázků. jpg, přidejte k příkazu příkaz "-j", jak je uvedeno níže.

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

POZNÁMKA: Výchozí výstup můžete také změnit na PNG pomocí volby "-png" nebo TIFF pomocí volby "-tiff".

Hlavní obrazový soubor pro každý snímek je uložen jako soubor. jpg. Druhý prázdný snímek je stále soubor. ppm nebo. pbm.

Pokud chcete pouze převést obrázky na určitou stránku a po ní, použijte volbu "-f" číslem, abyste označili první stránku, kterou chcete převést, jak je uvedeno níže v příkladu příkazu.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

POZNÁMKA: Kombinovali jsme volbu "-j" s volbou "-f", abychom získali obrázky. jpg a udělali totéž s volbou "-l"níže.

Chcete-li převést všechny snímky před a na určité stránce, použijte volbu "-l"( malá písmena "L", nikoliv číslo "1") s číslem, která označuje poslední stránku, kterou chcete převést, jak je uvedeno níže.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ obrázek

POZNÁMKA: Možnosti "-f" a "-l" můžete použít k převodu obrázků v určitém rozsahu stránek ve středu dokumentu.

Pokud v souboru PDF existuje heslo majitele, použijte volbu "-opw" a heslo v jednoduchých uvozovkách, jak je uvedeno níže. Pokud je heslo v souboru PDF uživatelským heslem, použijte volbu "-upw" místo hesla.

POZNÁMKA: Ujistěte se, že v příkazu je k dispozici jedno uvozovky kolem vašeho hesla.

pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

Další informace o použití příkazu pdfimages zadejte příkaz "pdfimages" v okně Terminál a stiskněte "Enter".Zobrazí se použití příkazu se seznamem možností dostupných pro použití v příkazu.