15Sep

Ako extrahovať a ukladať obrázky zo súboru PDF v systéme Linux

Pomocou príkazového riadku "pdftotext" môžete ľahko konvertovať súbory PDF na editovateľný text v systéme Linux. Ak však v pôvodnom súbore PDF existujú nejaké obrázky, nie sú extrahované.Ak chcete extrahovať obrázky zo súboru PDF, môžete použiť iný nástroj príkazového riadku s názvom "pdfimages".

POZNÁMKA: Keď povieme napísať niečo v tomto článku a tam sú úvodzovky okolo textu, NEVYKLADAJTE citácie, ak neurčíme inak.

Nástroj "pdfimages" je súčasťou balíka poppler-utils. Môžete skontrolovať, či je nainštalovaný v systéme a prípadne ho nainštalovať podľa krokov popísaných v tomto článku.

Ak chcete extrahovať obrázky zo súboru PDF pomocou pdfimages, stlačte "Ctrl + Alt + T" na otvorenie okna Terminálu. Na výzvu zadajte nasledujúci príkaz.

pdfimages /home/lori/Documents/ SampleWithImages.pdf Obrázok /home/lori/Documents/ExtractedImages/

POZNÁMKA: Pre všetky príkazy uvedené v tomto článku nahraďte prvú cestu v príkaze a názov súboru PDF cestu a názov súboru pre pôvodný súbor PDF.Druhá cesta by mala byť cesta k koreňovému priečinku, do ktorého chcete uložené obrázky uložiť.Slovo "obrázok" na konci druhej cesty predstavuje čokoľvek, čo chcete predvolať s vaším názvom súboru. Názvy súborov obrázkov sú očíslované automaticky( 000, 001, 002, 003 atď.).Ak chcete na začiatok každého obrázka pridať text, zadajte tento text na konci druhej cesty. V našom príklade začína každý názov súboru s obrázkom, napríklad image-001.ppm, image-002.ppm atď. Medzi zadaným textom a číslom sa pridá pomlčka.

Predvolený formát obrázka je PPM( prenosný pixmap) pre non-monochromatické obrázky alebo PBM( prenosné bitmapy) pre monochromatické obrázky. Tieto formáty sú navrhnuté tak, aby boli ľahko vymeniteľné medzi platformami.

POZNÁMKA: V súbore PDF môžete získať dva obrazové súbory pre každý obrázok. Druhý obrázok pre každý obrázok je prázdny, takže budete môcť zistiť, ktoré obrázky obsahujú obrázky zo súboru podľa miniatúry v súbore v Správcovi súborov.

Ak chcete vytvoriť obrazové súbory. jpg, pridajte príkaz "-j" príkazu, ako je uvedené nižšie.

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

POZNÁMKA: Môžete tiež zmeniť predvolený výstup na PNG pomocou voľby "-png" alebo TIFF pomocou voľby "-tif".

Hlavný obrazový súbor pre každý obrázok sa uloží ako súbor. jpg. Druhý prázdny obrázok je stále súborom. ppm alebo. pbm.

Ak chcete len previesť obrázky na určitú stránku a po nej, použite voľbu "-f" číslom, aby ste označili prvú stránku na konverziu, ako je uvedené v príklade príkladu nižšie.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

POZNÁMKA: Kombinovali sme voľbu "-j" s voľbou "-f", takže sme získali obrázky. jpg a urobili to isté s voľbou "-l"nižšie.

Ak chcete previesť všetky obrázky pred a na určitej stránke, použite voľbu "-l"( malé písmeno "L", nie číslo "1") s číslom označujúcim poslednú stránku, ktorú chcete previesť, ako je uvedené nižšie.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

POZNÁMKA: Možnosti "-f" a "-l" môžete použiť na konverziu obrázkov v určitom rozsahu stránok uprostred dokumentu.

Ak je v súbore PDF zadané heslo majiteľa, použite voľbu "-opw" a heslo v jednoduchých úvodzovkách, ako je uvedené nižšie. Ak je heslo v súbore PDF používateľským heslom, použite namiesto toho heslo "-upw".

POZNÁMKA: Uistite sa, že v príkaze máte okolo hesla jednotlivé citácie.

pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

Pre viac informácií o použití príkazu pdfimages zadajte "pdfimages" na výzvu v okne terminálu a stlačte "Enter".Použitie príkazu sa zobrazí so zoznamom možností dostupných pre použitie v príkaze.