15Sep

So extrahieren und speichern Sie Bilder aus einer PDF-Datei in Linux

click fraud protection

Mit dem Befehlszeilenprogramm "pdftotext" können Sie PDF-Dateien unter Linux in bearbeitbaren Text umwandeln. Wenn jedoch Bilder in der ursprünglichen PDF-Datei vorhanden sind, werden sie nicht extrahiert. Um Bilder aus einer PDF-Datei zu extrahieren, können Sie ein anderes Befehlszeilenwerkzeug namens "pdfimages" verwenden.

HINWEIS: Wenn wir in diesem Artikel etwas eingeben und den Text in Anführungszeichen setzen, geben Sie die Anführungszeichen NICHT ein, es sei denn, wir geben etwas anderes an.

Das Tool "pdfimages" ist Teil des Pakets poppler-utils. Sie können überprüfen, ob es auf Ihrem System installiert ist, und es gegebenenfalls mit den in diesem Artikel beschriebenen Schritten installieren.

Um Bilder aus einer PDF-Datei mit Hilfe von PDF-Bildern zu extrahieren, drücken Sie "Strg + Alt + T", um ein Terminal-Fenster zu öffnen. Geben Sie den folgenden Befehl an der Eingabeaufforderung ein.

pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

instagram viewer

HINWEIS: Ersetzen Sie für alle in diesem Artikel gezeigten Befehle den ersten Pfad im Befehl und den PDF-Dateinamen durch den Pfad und Dateinamen für Ihre ursprüngliche PDF-Datei. Der zweite Pfad sollte der Pfad zum Stammordner sein, in dem die extrahierten Bilder gespeichert werden sollen. Das Wort "image" am Ende des zweiten Pfads steht für alles, was Sie Ihrem Dateinamen vorsetzen möchten. Die Dateinamen der Bilder werden automatisch nummeriert( 000, 001, 002, 003 usw.).Wenn Sie am Anfang jedes Bildes Text hinzufügen möchten, geben Sie diesen Text am Ende des zweiten Pfads ein. In unserem Beispiel beginnt jeder Bilddateiname mit "image", z. B. image-001.ppm, image-002.ppm usw. Zwischen dem angegebenen Text und der Nummer wird ein Bindestrich eingefügt.

Das Standardbildformat ist PPM( Portable Pixmap) für nicht monochrome Bilder oder PBM( Portable Bitmap) für monochrome Bilder. Diese Formate sind so konzipiert, dass sie einfach zwischen Plattformen ausgetauscht werden können.

HINWEIS: Sie können für jedes Bild in Ihrer PDF-Datei zwei Bilddateien erhalten. Das zweite Bild für jedes Bild ist leer. Daher können Sie anhand der Miniaturansicht der Datei im Datei-Manager feststellen, welche Bilder die Bilder aus der Datei enthalten.

Um. jpg Bilddateien zu erstellen, fügen Sie dem Befehl die Option "-j" hinzu( siehe unten).

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

HINWEIS: Sie können die Standardausgabe auch in PNG mit der Option "-png" oder TIFF mit der Option "-tiff" ändern.

Die Hauptbilddatei für jedes Bild wird als JPG-Datei gespeichert. Das zweite leere Bild ist immer noch eine. ppm- oder. pbm-Datei.

Wenn Sie nur Bilder auf und nach einer bestimmten Seite konvertieren möchten, verwenden Sie die Option "-f" mit einer Zahl, um die erste zu konvertierende Seite anzuzeigen, wie im folgenden Beispiel gezeigt.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ Bild

HINWEIS: Wir haben die Option "-j" mit der Option "-f" kombiniert, so dass wir. jpg Bilder erhalten und dasselbe mit der Option "-l" gemacht habenunten auch.

Um alle Bilder vor und auf einer bestimmten Seite zu konvertieren, verwenden Sie die Option "-l"( ein Kleinbuchstabe "L", nicht die Zahl "1") mit einer Zahl zur Angabe der letzten umzuwandelnden Seite, wie unten gezeigt.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/-Bild

HINWEIS: Sie können die Optionen "-f" und "-l" zusammen verwenden, um Bilder in einem bestimmten Seitenbereich in der Mitte des Dokuments zu konvertieren.

Wenn für die PDF-Datei ein Besitzerkennwort vorhanden ist, verwenden Sie die Option "-opw" und das Passwort in Anführungszeichen, wie unten dargestellt. Wenn das Kennwort für die PDF-Datei ein Benutzerkennwort ist, verwenden Sie die Option "-upw" anstelle des Kennworts.

HINWEIS: Stellen Sie sicher, dass in Ihrem Befehl einfache Anführungszeichen um Ihr Passwort stehen.

pdfimages -opw 'Passwort' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ Bild

Um weitere Informationen über den Befehl pdfimages zu erhalten, geben Sie "pdfimages" an der Eingabeaufforderung in einem Terminal-Fenster ein und drücken Sie "Enter".Die Befehlsverwendung wird mit einer Liste von Optionen angezeigt, die im Befehl verwendet werden können.