15Sep
Du kan enkelt konvertera PDF-filer till redigerbar text i Linux med hjälp av kommandoradsverktyget "pdftotext".Om det emellertid finns några bilder i den ursprungliga PDF-filen extraheras de inte. För att extrahera bilder från en PDF-fil kan du använda ett annat kommandoradsverktyg som heter "pdfimages".
OBS! När vi säger att du skriver något i den här artikeln och det finns citat runt texten, skriv INTE citat, såvida vi inte anger något annat.
"pdfimages" -verktyget är en del av poppler-utils-paketet. Du kan kontrollera om den är installerad på ditt system och installera den om det behövs med hjälp av de steg som beskrivs i den här artikeln.
För att extrahera bilder från en PDF-fil med pdfimages, tryck "Ctrl + Alt + T" för att öppna ett terminalfönster. Skriv följande kommando vid prompten.
pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild
OBS! För alla kommandon som visas i den här artikeln, ersätt den första sökvägen i kommandot och PDF-filnamnet till sökvägen och filnamnet för din ursprungliga PDF-fil. Den andra sökvägen ska vara sökvägen till rotmappen i vilken du vill spara de extraherade bilderna. Ordet "bild" i slutet av den andra sökvägen representerar vad du vill förorda ditt filnamn med. Filnamn på bilderna numreras automatiskt( 000, 001, 002, 003, etc.).Om du vill lägga till text i början av varje bild anger du den texten i slutet av den andra sökvägen. I vårt exempel börjar varje bildfilnamn med "bild", till exempel bild-001.ppm, bild-002.ppm etc. En streck läggs till mellan den text du anger och numret.
Standardbildformatet är PPM( portabel pixmap) för icke-monokroma bilder, eller PBM( bärbar bitmapp) för monokroma bilder. Dessa format är utformade för att enkelt bytas mellan plattformar.
OBS! Du kan få två bildfiler för varje bild i din PDF-fil. Den andra bilden för varje bild är tom, så du kan se vilka bilder som innehåller bilderna från filen med miniatyren i filen i Filhanteraren.
För att skapa. jpg-bildfiler, lägg till alternativet "-j" till kommandot, som visas nedan.
pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild
OBS! Du kan också ändra standardutgången till PNG med alternativet "-png" eller TIFF med alternativet "-tiff".
Huvudbildfilen för varje bild sparas som en. jpg-fil. Den andra tomma bilden är fortfarande en. ppm eller. pbm-fil.
Om du bara vill konvertera bilder på och efter en viss sida, använd alternativet "-f" med ett nummer för att ange den första sidan som ska konverteras, som visas i exemplet nedan.
pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild
OBS: Vi kombinerade alternativet "-j" med alternativet "-f" så att vi skulle få. jpg-bilder och gjorde detsamma med alternativet "-l" som nämnsnedan också.
För att konvertera alla bilder före och på en viss sida, använd "-l"( ett litet "L", inte nummeret "1") med ett nummer för att indikera den sista sidan som ska konverteras, som visas nedan.
pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild
OBS! Du kan använda alternativen "-f" och "-l" tillsammans för att konvertera bilder i ett visst sidintervall i mitten av ditt dokument.
Om det finns ett ägarlösenord i PDF-filen, använd alternativet "-opw" och lösenordet i enkla citat, enligt nedan. Om lösenordet i PDF-filen är ett användarlösenord, använd alternativet "-upw" istället med lösenordet.
OBS! Se till att det finns enkla citat runt ditt lösenord i kommandot.
pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ bild
För mer information om hur du använder pdfimages-kommandot skriver du "pdfimages" i snabbmeddelandet i ett Terminal-fönster och trycker på "Enter".Kommandotillgången visas med en lista över alternativ som är tillgängliga för kommandot.