15Sep

Πώς να εξαγάγετε και να αποθηκεύσετε εικόνες από ένα αρχείο PDF σε Linux

click fraud protection

Μπορείτε εύκολα να μετατρέψετε αρχεία PDF σε επεξεργάσιμο κείμενο σε Linux χρησιμοποιώντας το εργαλείο γραμμής εντολών "pdftotext".Ωστόσο, εάν υπάρχουν εικόνες στο αρχικό αρχείο PDF, δεν εξάγονται.Για να εξαγάγετε εικόνες από ένα αρχείο PDF, μπορείτε να χρησιμοποιήσετε ένα άλλο εργαλείο γραμμής εντολών που ονομάζεται "pdfimages".

ΣΗΜΕΙΩΣΗ: Όταν λέμε να πληκτρολογήσετε κάτι σε αυτό το άρθρο και υπάρχουν εισαγωγικά γύρω από το κείμενο, ΜΗΝ πληκτρολογείτε τα αποσπάσματα, εκτός αν προσδιορίζουμε διαφορετικά.

Το εργαλείο "pdfimages" είναι μέρος του πακέτου poppler-utils.Μπορείτε να ελέγξετε εάν είναι εγκατεστημένο στο σύστημά σας και να το εγκαταστήσετε αν είναι απαραίτητο, χρησιμοποιώντας τα βήματα που περιγράφονται σε αυτό το άρθρο.

Για να εξαγάγετε εικόνες από ένα αρχείο PDF χρησιμοποιώντας pdfimages, πιέστε "Ctrl + Alt + T" για να ανοίξετε ένα παράθυρο τερματικού.Πληκτρολογήστε την ακόλουθη εντολή στη γραμμή εντολών.

pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ εικόνα

instagram viewer

ΣΗΜΕΙΩΣΗ: Για όλες τις εντολές που εμφανίζονται σε αυτό το άρθρο, αντικαταστήστε την πρώτη διαδρομή στην εντολή και το όνομα αρχείου PDF στη διαδρομή και το όνομα αρχείου για το αρχικό αρχείο PDF.Η δεύτερη διαδρομή θα πρέπει να είναι η διαδρομή προς τον ριζικό φάκελο στον οποίο θέλετε να αποθηκεύσετε τις εικόνες που έχουν εξαχθεί.Η λέξη "εικόνα" στο τέλος της δεύτερης διαδρομής αντιπροσωπεύει ό, τι θέλετε να προφέρετε το όνομα αρχείου σας με.Τα ονόματα αρχείων των εικόνων αριθμούνται αυτόματα( 000, 001, 002, 003, κλπ.).Αν θέλετε να προσθέσετε κείμενο στην αρχή κάθε εικόνας, πληκτρολογήστε το κείμενο στο τέλος της δεύτερης διαδρομής.Στο παράδειγμά μας, κάθε όνομα αρχείου εικόνας θα ξεκινά με "εικόνα", όπως image-001.ppm, image-002.ppm, κλπ. Προστίθεται μια παύλα ανάμεσα στο κείμενο που ορίζετε και τον αριθμό.

Η προεπιλεγμένη μορφή εικόνας είναι PPM( φορητή pixmap) για μη μονόχρωμες εικόνες ή PBM( φορητό bitmap) για μονόχρωμες εικόνες.Αυτές οι μορφές έχουν σχεδιαστεί έτσι ώστε να ανταλλάσσονται εύκολα μεταξύ των πλατφορμών.

ΣΗΜΕΙΩΣΗ: Μπορείτε να λάβετε δύο αρχεία εικόνων για κάθε εικόνα στο αρχείο PDF.Η δεύτερη εικόνα για κάθε εικόνα είναι κενή, επομένως, θα μπορείτε να προσδιορίσετε ποιες εικόνες περιέχουν τις εικόνες από το αρχείο με τη μικρογραφία του αρχείου στο File Manager.

Για να δημιουργήσετε αρχεία εικόνας. jpg, προσθέστε την επιλογή "-j" στην εντολή, όπως φαίνεται παρακάτω.

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf Εικόνα /home/lori/Documents/ExtractedImages/

ΣΗΜΕΙΩΣΗ: Μπορείτε επίσης να αλλάξετε την προεπιλεγμένη έξοδο στο PNG χρησιμοποιώντας την επιλογή "-png" ή TIFF χρησιμοποιώντας την επιλογή "-tiff".

Το κύριο αρχείο εικόνας για κάθε εικόνα αποθηκεύεται ως αρχείο. jpg.Η δεύτερη κενή εικόνα εξακολουθεί να είναι αρχείο. ppm ή. pbm.

Εάν θέλετε να μετατρέψετε μόνο εικόνες σε μια συγκεκριμένη σελίδα και μετά από αυτήν, χρησιμοποιήστε την επιλογή "-f" με έναν αριθμό για να υποδείξετε την πρώτη σελίδα που θέλετε να μετατρέψετε, όπως φαίνεται στην παρακάτω εντολή παράδειγμα.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf Εικόνα /home/lori/Documents/ExtractedImages/

ΣΗΜΕΙΩΣΗ: Συνδυάσαμε την επιλογή "-j" με την επιλογή "-f" έτσι ώστε να έχουμε εικόνες. jpg και να κάνουμε το ίδιο με την επιλογή "-l"κατωτέρω.

Για να μετατρέψετε όλες τις εικόνες πριν και σε μια συγκεκριμένη σελίδα, χρησιμοποιήστε την επιλογή "-l"( πεζά γράμματα "L", όχι το νούμερο "1") με έναν αριθμό που υποδεικνύει την τελευταία σελίδα που θέλετε να μετατρέψετε, όπως φαίνεται παρακάτω.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ εικόνα

ΣΗΜΕΙΩΣΗ: Μπορείτε να χρησιμοποιήσετε μαζί τις επιλογές "-f" και "-l" για να μετατρέψετε εικόνες σε ένα συγκεκριμένο εύρος σελίδων στο μέσο του εγγράφου σας.

Εάν υπάρχει ένας κωδικός πρόσβασης κατόχου στο αρχείο PDF, χρησιμοποιήστε την επιλογή "-opw" και τον κωδικό πρόσβασης σε απλά εισαγωγικά, όπως φαίνεται παρακάτω.Εάν ο κωδικός πρόσβασης στο αρχείο PDF είναι κωδικός πρόσβασης χρήστη, χρησιμοποιήστε την επιλογή "-upw" αντί για τον κωδικό πρόσβασης.

ΣΗΜΕΙΩΣΗ: Βεβαιωθείτε ότι υπάρχουν μόνο αποσπάσματα γύρω από τον κωδικό σας στην εντολή.

pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf Εικόνα /home/lori/Documents/ExtractedImages/

Για περισσότερες πληροφορίες σχετικά με τη χρήση της εντολής pdfimages, πληκτρολογήστε "pdfimages" στη γραμμή εντολών σε ένα τερματικό παράθυρο και πατήστε "Enter".Εμφανίζεται η εντολή χρήσης με μια λίστα επιλογών διαθέσιμων για χρήση στην εντολή.