15Sep

Sådan udtrækkes og gemmes billeder fra en PDF-fil i Linux

Du kan nemt konvertere PDF-filer til redigerbar tekst i Linux ved hjælp af kommandolinjeværktøjet "pdftotext".Men hvis der er billeder i den oprindelige PDF-fil, bliver de ikke ekstraheret. For at udtrække billeder fra en PDF-fil, kan du bruge et andet kommandolinjeværktøj kaldet "pdfimages".

BEMÆRK: Når vi siger at skrive noget i denne artikel, og der er citater omkring teksten, skriv IKKE citaterne, medmindre vi angiver andet.

Værktøjet "pdfimages" er en del af poppler-utils-pakken. Du kan kontrollere, om det er installeret på dit system, og installer det om nødvendigt ved hjælp af de trin, der er beskrevet i denne artikel.

Hvis du vil hente billeder fra en PDF-fil ved hjælp af pdfimages, skal du trykke på "Ctrl + Alt + T" for at åbne et Terminal vindue. Skriv følgende kommando ved prompten.

pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede

BEMÆRK: For alle de kommandoer, der vises i denne artikel, skal du erstatte den første sti i kommandoen og PDF-filnavnet til stien og filnavnet til din oprindelige PDF-fil. Den anden vej skal være stien til rodmappen, som du vil gemme de uddragne billeder i. Ordet "billede" i slutningen af ​​den anden sti repræsenterer hvad du vil forord dit filnavn med. Filnavnet på billederne nummereres automatisk( 000, 001, 002, 003 osv.).Hvis du vil tilføje tekst til begyndelsen af ​​hvert billede, skal du indtaste den pågældende tekst i slutningen af ​​den anden vej. I vores eksempel starter hvert billedfilnavn med "billede", som f.eks. Image-001.ppm, image-002.ppm osv. Der indsættes et dash mellem den tekst, du angiver, og nummeret.

Standardbilledformatet er PPM( bærbar pixmap) til ikke-monokrome billeder eller PBM( bærbar bitmap) til monokrome billeder. Disse formater er designet til nemt at udveksle mellem platforme.

BEMÆRK: Du kan få to billedfiler til hvert billede i din PDF-fil. Det andet billede for hvert billede er tomt, så du kan se, hvilke billeder der indeholder billederne fra filen ved hjælp af miniaturebilledet på filen i Filhåndtering.

For at oprette. jpg billedfiler, tilføj "-j" til kommandoen, som vist nedenfor.

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede

BEMÆRK: Du kan også ændre standard output til PNG ved hjælp af alternativet "-png" eller TIFF ved hjælp af "-tiff" -alternativet.

Hovedbilledfilen for hvert billede gemmes som en. jpg-fil. Det andet blanke billede er stadig en. ppm eller. pbm-fil.

Hvis du kun vil konvertere billeder på og efter en bestemt side, skal du bruge "-f" med et nummer til at angive den første side, der skal konverteres, som vist i eksemplet nedenfor.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede

BEMÆRK: Vi kombinerede "-j" -alternativet med "-f" indstillingen, så vi ville få. jpg billeder og gjorde det samme med den "nedenfor også.

Hvis du vil konvertere alle billeder før og på en bestemt side, skal du bruge "-l"( en lille "L", ikke nummeret "1") med et nummer for at angive den sidste side, der skal konverteres, som vist nedenfor.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede

BEMÆRK: Du kan bruge indstillingerne "-f" og "-l" sammen til at konvertere billeder i et bestemt sidevalg i midten af ​​dit dokument.

Hvis der er et ejeradgangskode på PDF-filen, skal du bruge "-opw" og passwordet i enkelte citater, som vist nedenfor. Hvis adgangskoden i PDF-filen er en brugeradgangskode, skal du bruge "-upw" i stedet med adgangskoden.

BEMÆRK: Sørg for, at der er enkelte citater omkring dit kodeord i kommandoen.

pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede

For mere information om brug af pdfimages-kommandoen, skriv "pdfimages" i prompt i et Terminal vindue og tryk "Enter".Kommandoforbruget vises med en liste over tilgængelige muligheder til brug i kommandoen.