15Sep

Så här extraheras och sparas bilder från en PDF-fil i Linux

Du kan enkelt konvertera PDF-filer till redigerbar text i Linux med hjälp av kommandoradsverktyget "pdftotext".Om det emellertid finns några bilder i den ursprungliga PDF-filen extraheras de inte. För att extrahera bilder från en PDF-fil kan du använda ett annat kommandoradsverktyg som heter "pdfimages".

OBS! När vi säger att du skriver något i den här artikeln och det finns citat runt texten, skriv INTE citat, såvida vi inte anger något annat.

"pdfimages" -verktyget är en del av poppler-utils-paketet. Du kan kontrollera om den är installerad på ditt system och installera den om det behövs med hjälp av de steg som beskrivs i den här artikeln.

För att extrahera bilder från en PDF-fil med pdfimages, tryck "Ctrl + Alt + T" för att öppna ett terminalfönster. Skriv följande kommando vid prompten.

pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild

OBS! För alla kommandon som visas i den här artikeln, ersätt den första sökvägen i kommandot och PDF-filnamnet till sökvägen och filnamnet för din ursprungliga PDF-fil. Den andra sökvägen ska vara sökvägen till rotmappen i vilken du vill spara de extraherade bilderna. Ordet "bild" i slutet av den andra sökvägen representerar vad du vill förorda ditt filnamn med. Filnamn på bilderna numreras automatiskt( 000, 001, 002, 003, etc.).Om du vill lägga till text i början av varje bild anger du den texten i slutet av den andra sökvägen. I vårt exempel börjar varje bildfilnamn med "bild", till exempel bild-001.ppm, bild-002.ppm etc. En streck läggs till mellan den text du anger och numret.

Standardbildformatet är PPM( portabel pixmap) för icke-monokroma bilder, eller PBM( bärbar bitmapp) för monokroma bilder. Dessa format är utformade för att enkelt bytas mellan plattformar.

OBS! Du kan få två bildfiler för varje bild i din PDF-fil. Den andra bilden för varje bild är tom, så du kan se vilka bilder som innehåller bilderna från filen med miniatyren i filen i Filhanteraren.

För att skapa. jpg-bildfiler, lägg till alternativet "-j" till kommandot, som visas nedan.

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild

OBS! Du kan också ändra standardutgången till PNG med alternativet "-png" eller TIFF med alternativet "-tiff".

Huvudbildfilen för varje bild sparas som en. jpg-fil. Den andra tomma bilden är fortfarande en. ppm eller. pbm-fil.

Om du bara vill konvertera bilder på och efter en viss sida, använd alternativet "-f" med ett nummer för att ange den första sidan som ska konverteras, som visas i exemplet nedan.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild

OBS: Vi kombinerade alternativet "-j" med alternativet "-f" så att vi skulle få. jpg-bilder och gjorde detsamma med alternativet "-l" som nämnsnedan också.

För att konvertera alla bilder före och på en viss sida, använd "-l"( ett litet "L", inte nummeret "1") med ett nummer för att indikera den sista sidan som ska konverteras, som visas nedan.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild

OBS! Du kan använda alternativen "-f" och "-l" tillsammans för att konvertera bilder i ett visst sidintervall i mitten av ditt dokument.

Om det finns ett ägarlösenord i PDF-filen, använd alternativet "-opw" och lösenordet i enkla citat, enligt nedan. Om lösenordet i PDF-filen är ett användarlösenord, använd alternativet "-upw" istället med lösenordet.

OBS! Se till att det finns enkla citat runt ditt lösenord i kommandot.

pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild

För mer information om hur du använder pdfimages-kommandot skriver du "pdfimages" i snabbmeddelandet i ett Terminal-fönster och trycker på "Enter".Kommandotillgången visas med en lista över alternativ som är tillgängliga för kommandot.