29Jun

So konvertieren Sie eine PDF-Datei in bearbeitbaren Text über die Befehlszeile in Linux

click fraud protection

Es gibt verschiedene Gründe, warum Sie eine PDF-Datei in bearbeitbaren Text konvertieren möchten. Vielleicht müssen Sie ein altes Dokument überarbeiten, und alles, was Sie haben, ist die PDF-Version davon. Konvertieren von PDF-Dateien in Windows ist einfach, aber was ist, wenn Sie Linux verwenden?

Keine Sorge. Wir zeigen Ihnen, wie Sie PDF-Dateien mithilfe eines Befehlszeilenprogramms namens pdftotext, das Teil des Pakets "poppler-utils" ist, problemlos in bearbeitbaren Text konvertieren können. Dieses Tool ist möglicherweise bereits installiert. Um zu prüfen, ob pdftotext auf Ihrem System installiert ist, drücken Sie "Strg + Alt + T", um ein Terminalfenster zu öffnen. Geben Sie den folgenden Befehl an der Eingabeaufforderung ein und drücken Sie "Enter".

dpkg -s poppler-utils

HINWEIS: Wenn wir in diesem Artikel etwas eingeben und der Text in Anführungszeichen gesetzt wird, geben Sie die Anführungszeichen NICHT ein, es sei denn, wir geben etwas anderes an.

Wenn pdftotext nicht installiert ist, geben Sie den folgenden Befehl an der Eingabeaufforderung ein und drücken Sie "Enter".

instagram viewer

sudo apt-get installieren poppler-utils

Geben Sie Ihr Passwort ein, wenn Sie dazu aufgefordert werden, und drücken Sie "Enter".

Im Paket poppler-utils stehen verschiedene Werkzeuge zur Verfügung, um PDF in verschiedene Formate zu konvertieren, PDF-Dateien zu bearbeiten und Informationen aus Dateien zu extrahieren.

Der folgende Befehl ist der grundlegende Befehl zum Konvertieren einer PDF-Datei in eine bearbeitbare Textdatei. Drücken Sie "Strg + Alt + T", um ein Terminalfenster zu öffnen, geben Sie den Befehl an der Eingabeaufforderung ein und drücken Sie "Enter".

pdftotext /home/lori/Documents/ Beispiel.pdf /home/lori/Documents/ Beispiel.txt

Ändern Sie den Pfad zu jeder Datei so, dass sie dem Speicherort und dem Namen Ihrer ursprünglichen PDF-Datei entspricht und wo Sie die resultierende Textdatei speichern möchten.Ändern Sie außerdem die Dateinamen so, dass sie den Namen Ihrer Dateien entsprechen.

Die Textdatei wird erstellt und kann wie jede andere Textdatei in Linux geöffnet werden.

Der konvertierte Text enthält möglicherweise Zeilenumbrüche an nicht gewünschten Stellen. Zeilenumbrüche werden nach jeder Textzeile in der PDF-Datei eingefügt.

Sie können das Layout Ihres Dokuments( Kopf- und Fußzeilen, Paging usw.) aus der ursprünglichen PDF-Datei in der konvertierten Textdatei mit dem Flag "-layout" beibehalten.

pdftotext -layout /home/lori/Documents/ Beispiel.pdf /home/lori/Documents/ Beispiel.txt

Wenn Sie nur eine Reihe von Seiten in eine PDF-Datei konvertieren möchten, verwenden Sie die Flags "-f" und "-l"( ein Kleinbuchstabe "L"), um anzugebenerste und letzte Seite in dem Bereich, den Sie konvertieren möchten.

pdftotext -f 5 -l 9 /home/lori/Documents/ Beispiel.pdf /home/lori/Documents/ Sample.txt

Um eine PDF-Datei zu konvertieren, die geschützt und mit einem Besitzer-Passwort verschlüsselt ist, verwenden Sie das Flag "-opw"( das erste Zeichen in der Flagge ist ein Kleinbuchstabe)O ", keine Null).

pdftotext -opw 'Kennwort' /home/lori/Documents/ Beispiel.pdf /home/lori/Documents/ Beispiel.txt

Ändern Sie "Kennwort" in das Kennwort, das zum Schützen der ursprünglichen PDF-Datei verwendet wird, die konvertiert wird. Stellen Sie sicher, dass es einfache Anführungszeichen, nicht doppelt, um "Passwort" gibt.

Wenn die PDF-Datei mit einem Benutzerkennwort geschützt und verschlüsselt ist, verwenden Sie das Flag "-upw" anstelle des Flags "-opw".Der Rest des Befehls ist der gleiche.

Sie können auch den Typ des Zeilenendes angeben, der auf den konvertierten Text angewendet wird. Dies ist besonders nützlich, wenn Sie auf die Datei auf einem anderen Betriebssystem wie Windows oder Mac zugreifen möchten. Verwenden Sie dazu das Flag "-eol"( das mittlere Zeichen in der Flagge ist ein Kleinbuchstabe "O", keine Null), gefolgt von einem Leerzeichen und dem Typ des Zeilenendes, das Sie verwenden möchten( "unix "," dos "oder" mac ").

HINWEIS: Wenn Sie keinen Dateinamen für die Textdatei angeben, verwendet pdftotext automatisch die Basis des PDF-Dateinamens und fügt die Erweiterung ".txt" hinzu. Zum Beispiel wird "file.pdf" in "file.txt" konvertiert. Wenn die Textdatei als "-" angegeben wird, wird der konvertierte Text an stdout gesendet, was bedeutet, dass der Text im Terminalfenster angezeigt und nicht in einer Datei gespeichert wird.

Um das Terminalfenster zu schließen, klicken Sie auf die Schaltfläche "X" in der oberen linken Ecke.

Weitere Informationen zum Befehl pdftotext erhalten Sie, wenn Sie in einem Terminalfenster an der Eingabeaufforderung "man page pdftotext" eingeben.