15Sep

Képek kivonatolása és mentése PDF fájlból Linux alatt

A PDF fájlokat szerkeszthető szöveggé konvertálhatja Linux alatt a "pdftotext" parancssori eszköz használatával. Azonban, ha az eredeti PDF-fájlban bármilyen kép található, azok nem lesznek kibontva. A képek PDF fájlból történő kivételéhez használhat egy másik, a "pdfimages" nevű parancssori eszközt.

MEGJEGYZÉS: Ha azt mondjuk, hogy írunk valamit ebben a cikkben, és idézőjelek vannak a szöveg körül, NE írja be az idézőjeleket, hacsak másképp nem jelöljük.

A "pdfimages" eszköz a poppler-utils csomag része. Ellenőrizheti, hogy telepítve van-e a rendszerében, és ha szükséges, telepítse a cikkben ismertetett lépéseket.

A PDF-fájlok PDF-fájlból történő kivágásához nyomja meg a "Ctrl + Alt + T" billentyűt a Terminal ablak megnyitásához.Írja be a következő parancsot a parancssorba.

pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ kép

MEGJEGYZÉS: A cikkben ismertetett parancsok helyett a parancs első elérési útját és a PDF fájlnevet az eredeti PDF fájl elérési útjára és fájlnevére cserélje. A második elérési utat a gyökérkönyvtár elérési útvonalának kell lennie, amelybe a kivont képeket el kívánja menteni. A második kép végén a "kép" szó azt jelöli, amit a filenévvel előzetesen meg akarsz előterjeszteni. A képek fájlnevei automatikusan számozásra kerülnek( 000, 001, 002, 003, stb.).Ha szöveget szeretne felvenni az egyes képek elejére, adja meg azt a szöveget a második elérési út végén. A példánkban minden képfájlnév "kép" -el kezdődik, például a 001.ppm, image-002.ppm stb. Segítségével. Egy kötőjelet ad meg a megadott szöveg és a szám között.

Az alapértelmezett képformátum PPM( hordozható pixmap) nem monokróm képekhez vagy PBM( hordozható bitkép) a monokróm képekhez. Ezeket a formátumokat úgy tervezték, hogy könnyen cserélhetők platformok között.

MEGJEGYZÉS: Két képfájlt kaphat minden képhez a PDF fájlban. A második kép minden egyes kép esetében üres, ezért meg tudja adni, hogy a fájlok mely képeket tartalmazzák a fájlban a fájlkezelőben lévő fájl miniatűrje alapján.

A. jpg képfájlok létrehozásához a "-j" opciót kell hozzáadni a parancshoz, az alábbiak szerint.

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ kép

MEGJEGYZÉS: Az alapértelmezett kimenetet PNG-vel is megváltoztathatja a "-png" vagy a TIFF használatával a "-tiff" opció használatával.

Az egyes képek fő képfájljai. jpg fájlként vannak elmentve. A második üres kép még mindig egy. ppm vagy. pbm fájl.

Ha csak egy bizonyos oldalra és egy bizonyos oldalra szeretné konvertálni a képeket, akkor használja a "-f" opciót egy számmal, hogy jelezze az első átkonvertált oldalt, amint az az alábbi példában látható.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ kép

MEGJEGYZÉS: A "-j" opciót a "-f" opcióval kombináltuk, így a. jpg képeket kaptuk, és ugyanezt tettük az "-l" opcióvalalább is.

Az összes kép előtti és egy adott oldalra történő konvertálásához használja az "-l"( kisbetűs "L", nem az "1" szám) lehetőséget egy számmal, hogy jelezze az utolsó átváltandó oldalt, az alábbiak szerint.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ kép

MEGJEGYZÉS: A "-f" és a "-l" opciókat együtt használva a képeket egy adott oldaltartományban a dokumentum közepén konvertálhatja.

Ha a tulajdonos jelszava a PDF-fájlban található, használja az "-opw" opciót és a jelszót egyetlen idézőjelben, az alábbiak szerint. Ha a PDF-fájlban lévő jelszó egy felhasználói jelszó, használja a "-upw" opciót a jelszóval.

MEGJEGYZÉS: Győződjön meg róla, hogy a parancsban egyetlen jelszó található a jelszó körül.

pdfimages -opw 'jelszó' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

A pdfimages parancs használatával kapcsolatos további információkért írja be a "pdfimages" parancsot a terminál ablakában és nyomja meg az "Enter" billentyűt. A parancs használata a parancsban használható opciók listájával jelenik meg.