15Sep
Voit helposti muuntaa PDF-tiedostot muokattavaksi tekstiksi Linuxissa käyttäen "pdftotext" -komennon työkalua. Jos alkuperäisessä PDF-tiedostossa on kuitenkin kuvia, niitä ei pureta. Jos haluat purkaa kuvia PDF-tiedostosta, voit käyttää toista komentorivityökalua nimeltä "pdfimages".
HUOMAUTUS: Kun sanomme kirjoittavan jotain tässä artikkelissa ja tekstiä on lainauksia, älä kirjoita lainauksia, ellei toisin mainita.
"pdfimages" -työkalu on osa poppler-utils-pakettia. Voit tarkistaa, onko se asennettu järjestelmään ja asenna se tarvittaessa tässä artikkelissa kuvattuihin vaiheisiin.
Jos haluat poimia kuvia PDF-tiedostosta käyttäen pdf-kuvia, avaa Terminal-ikkuna painamalla "Ctrl + Alt + T".Kirjoita seuraava komento kehotteeseen.
pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/-kuva
HUOMAUTUS: Korvaa tässä artikkelissa näkyvät komennot komentorivin ja PDF-tiedoston ensimmäisen polun alkuperäisen PDF-tiedoston polulle ja tiedostonimelle. Toisen polun pitäisi olla polku juurikansioon, johon haluat tallentaa otetut kuvat. Sana "kuva" toisen polun lopussa edustaa sitä mitä haluat esitellä tiedostonimesi kanssa. Kuvien tiedostonimet on numeroitu automaattisesti( 000, 001, 002, 003, jne.).Jos haluat lisätä tekstiä kunkin kuvan alkuun, kirjoita tämä teksti toisen polun loppuun. Esimerkissämme jokainen kuvatiedoston nimi alkaa kuvasta, kuten kuvasta 001.ppm, image-002.ppm, jne. Lisäämällä tekstin ja numeron väliin lisätään viiva.
Oletuskuvaformaatti on PPM( kannettava pikakuva) ei-monokromaattisille kuville tai PBM( kannettava bittikartta) monokromaattisille kuville. Nämä muodot on suunniteltu helposti vaihdettaviksi alustojen välillä.
HUOMAUTUS: Voit saada kaksi kuvatiedostoa kutakin kuvaa varten PDF-tiedostossasi. Toinen kuva jokaiselle kuvalle on tyhjä, joten voit selvittää, mitkä kuvat sisältävät tiedoston tiedostot tiedostopäällikön tiedostossa olevasta pienoiskuvasta.
Voit luoda. jpg kuvatiedostoja lisäämällä komentoon "-j" -vaihtoehdon, kuten alla on esitetty.
pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/-kuva
HUOMAUTUS: Voit myös muuttaa oletuslähtöä PNG-muotoon käyttämällä "-png" -vaihtoehtoa tai TIFF-asetusta käyttämällä "-tiff" -vaihtoehtoa.
Jokaisen kuvan pääkuvatiedosto tallennetaan. jpg-tiedostoksi. Toinen tyhjä kuva on edelleen. ppm- tai. pbm-tiedosto.
Jos haluat muuttaa kuvia vain tietyn sivun jälkeen, käytä "-f" -vaihtoehtoa numerolla, joka ilmoittaa ensimmäisen sivun muunnettavaksi, kuten alla olevassa esimerkkikomennossa on esitetty.
pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/-kuva
HUOMAA: Yhdistimme "-j" -vaihtoehdon "-f" -vaihtoehdolla, jotta saisimme. jpg kuvia ja teimme samoin mainitun "-l" -vaihtoehdon kanssaalla.
Muuntaa kaikki kuvat ennen tietyn sivun ja tiettyä sivua käyttämällä "-l"( pieniä "L", ei numeroa "1") vaihtoehtoa, jossa on numero, joka ilmoittaa viimeisen sivun muunnettavaksi alla olevan kuvan mukaisesti.
pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/-kuva
HUOMAUTUS: Voit käyttää "-f" ja "-l" -vaihtoehtoja yhdessä muuntamalla kuvat tiettyyn sivualueeseen asiakirjan keskellä.
Jos PDF-tiedostossa on omistajan salasana, käytä "-opw" -vaihtoehtoa ja salasanaa yksittäisissä lainauksissa alla kuvatulla tavalla. Jos PDF-tiedoston salasana on käyttäjän salasana, käytä "-upw" -vaihtoehtoa salasanan sijasta.
HUOMAUTUS: Varmista, että komennossa on yksi lainausmerkkejä salasanasi ympärille.
pdfimages -pw 'salasana' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/-kuva
Lisätietoja pdfimages-komennon kirjoittamisesta kirjoitetaan "pdfimages" Terminal-ikkunan kehotteeseen ja paina Enter. Komennon käyttö näkyy luettelossa komennossa käytettävissä olevista vaihtoehdoista.