15Sep
Du kan nemt konvertere PDF-filer til redigerbar tekst i Linux ved hjælp af kommandolinjeværktøjet "pdftotext".Men hvis der er billeder i den oprindelige PDF-fil, bliver de ikke ekstraheret. For at udtrække billeder fra en PDF-fil, kan du bruge et andet kommandolinjeværktøj kaldet "pdfimages".
BEMÆRK: Når vi siger at skrive noget i denne artikel, og der er citater omkring teksten, skriv IKKE citaterne, medmindre vi angiver andet.
Værktøjet "pdfimages" er en del af poppler-utils-pakken. Du kan kontrollere, om det er installeret på dit system, og installer det om nødvendigt ved hjælp af de trin, der er beskrevet i denne artikel.
Hvis du vil hente billeder fra en PDF-fil ved hjælp af pdfimages, skal du trykke på "Ctrl + Alt + T" for at åbne et Terminal vindue. Skriv følgende kommando ved prompten.
pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede
BEMÆRK: For alle de kommandoer, der vises i denne artikel, skal du erstatte den første sti i kommandoen og PDF-filnavnet til stien og filnavnet til din oprindelige PDF-fil. Den anden vej skal være stien til rodmappen, som du vil gemme de uddragne billeder i. Ordet "billede" i slutningen af den anden sti repræsenterer hvad du vil forord dit filnavn med. Filnavnet på billederne nummereres automatisk( 000, 001, 002, 003 osv.).Hvis du vil tilføje tekst til begyndelsen af hvert billede, skal du indtaste den pågældende tekst i slutningen af den anden vej. I vores eksempel starter hvert billedfilnavn med "billede", som f.eks. Image-001.ppm, image-002.ppm osv. Der indsættes et dash mellem den tekst, du angiver, og nummeret.
Standardbilledformatet er PPM( bærbar pixmap) til ikke-monokrome billeder eller PBM( bærbar bitmap) til monokrome billeder. Disse formater er designet til nemt at udveksle mellem platforme.
BEMÆRK: Du kan få to billedfiler til hvert billede i din PDF-fil. Det andet billede for hvert billede er tomt, så du kan se, hvilke billeder der indeholder billederne fra filen ved hjælp af miniaturebilledet på filen i Filhåndtering.
For at oprette. jpg billedfiler, tilføj "-j" til kommandoen, som vist nedenfor.
pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede
BEMÆRK: Du kan også ændre standard output til PNG ved hjælp af alternativet "-png" eller TIFF ved hjælp af "-tiff" -alternativet.
Hovedbilledfilen for hvert billede gemmes som en. jpg-fil. Det andet blanke billede er stadig en. ppm eller. pbm-fil.
Hvis du kun vil konvertere billeder på og efter en bestemt side, skal du bruge "-f" med et nummer til at angive den første side, der skal konverteres, som vist i eksemplet nedenfor.
pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede
BEMÆRK: Vi kombinerede "-j" -alternativet med "-f" indstillingen, så vi ville få. jpg billeder og gjorde det samme med den "nedenfor også.
Hvis du vil konvertere alle billeder før og på en bestemt side, skal du bruge "-l"( en lille "L", ikke nummeret "1") med et nummer for at angive den sidste side, der skal konverteres, som vist nedenfor.
pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede
BEMÆRK: Du kan bruge indstillingerne "-f" og "-l" sammen til at konvertere billeder i et bestemt sidevalg i midten af dit dokument.
Hvis der er et ejeradgangskode på PDF-filen, skal du bruge "-opw" og passwordet i enkelte citater, som vist nedenfor. Hvis adgangskoden i PDF-filen er en brugeradgangskode, skal du bruge "-upw" i stedet med adgangskoden.
BEMÆRK: Sørg for, at der er enkelte citater omkring dit kodeord i kommandoen.
pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ billede
For mere information om brug af pdfimages-kommandoen, skriv "pdfimages" i prompt i et Terminal vindue og tryk "Enter".Kommandoforbruget vises med en liste over tilgængelige muligheder til brug i kommandoen.