15Sep

Cara Mengekstrak dan Menyimpan Gambar dari File PDF di Linux

Anda dapat dengan mudah mengonversi file PDF ke teks yang dapat diedit di Linux menggunakan alat baris perintah "pdftotext".Namun, jika ada gambar dalam file PDF asli, namun tidak diekstraksi. Untuk mengekstrak gambar dari file PDF, Anda bisa menggunakan tool baris perintah lain yang disebut "pdfimages".CATATAN

: Ketika kita mengatakan untuk mengetik sesuatu di artikel ini dan ada kutipan seputar teks, JANGAN ketik tanda kutip, kecuali jika kita menentukan sebaliknya.

Alat "pdfimages" adalah bagian dari paket poppler-utils. Anda dapat memeriksa apakah sudah terinstal di sistem Anda dan menginstalnya jika perlu dengan menggunakan langkah-langkah yang dijelaskan di artikel ini.

Untuk mengekstrak gambar dari file PDF menggunakan pdfimages, tekan "Ctrl + Alt + T" untuk membuka jendela Terminal. Ketik perintah berikut pada prompt.

pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

CATATAN: Untuk semua perintah yang ditunjukkan pada artikel ini, ganti jalan pertama di perintah dan nama file PDF ke path dan nama file untuk file PDF asli Anda. Jalan kedua harus menjadi jalan menuju folder akar tempat Anda ingin menyimpan gambar yang diekstraksi. Kata "gambar" di akhir jalur kedua mewakili apa pun yang ingin Anda sampaikan dengan nama filename Anda. Nama file gambar diberi nomor secara otomatis( 000, 001, 002, 003, dst.).Jika Anda ingin menambahkan teks ke awal setiap gambar, masukkan teks itu di akhir jalur kedua. Dalam contoh kita, setiap namafile gambar akan dimulai dengan "gambar", seperti gambar-001.ppm, image-002.ppm, dll. Tanda hubung ditambahkan di antara teks yang Anda tentukan dan nomornya.

Format gambar defaultnya adalah PPM( pixmap portabel) untuk gambar non-monokrom, atau PBM( bitmap portabel) untuk gambar monokrom. Format ini dirancang agar mudah dipertukarkan antar platform. CATATAN

: Anda bisa mendapatkan dua file gambar untuk setiap gambar dalam file PDF Anda. Gambar kedua untuk setiap gambar kosong, jadi Anda bisa membedakan mana gambar yang berisi gambar dari file tersebut dengan gambar kecil pada file di File Manager.

Untuk membuat file gambar. jpg, tambahkan opsi "-j" ke perintah, seperti yang ditunjukkan di bawah ini.

pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

CATATAN: Anda juga dapat mengubah output default ke PNG menggunakan opsi "-png" atau TIFF menggunakan opsi "-tiff".

File gambar utama untuk setiap gambar disimpan sebagai file. jpg. Gambar kosong kedua masih berupa berkas. ppm atau. pbm.

Jika Anda hanya ingin mengubah gambar dan setelah halaman tertentu, gunakan opsi "-f" dengan nomor untuk menunjukkan halaman pertama yang akan dikonversi, seperti yang ditunjukkan pada contoh perintah di bawah ini.

pdfimages -f 2 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

CATATAN: Kami menggabungkan opsi "-j" dengan opsi "-f" jadi kami akan mendapatkan gambar jpg dan melakukan hal yang sama dengan opsi "-l" yang disebutkandi bawah juga

Untuk mengkonversi semua gambar sebelum dan pada halaman tertentu, gunakan tombol "-l"( huruf kecil "L", bukan pilihan nomor 1 ") dengan nomor yang menunjukkan halaman terakhir untuk dikonversi, seperti yang ditunjukkan di bawah ini.

pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

CATATAN: Anda dapat menggunakan opsi "-f" dan "-l" untuk mengkonversi gambar dalam rentang halaman tertentu di tengah dokumen Anda.

Jika ada kata kunci pemilik pada file PDF, gunakan opsi "-opw" dan kata kunci dalam tanda petik tunggal, seperti gambar di bawah ini. Jika kata sandi pada file PDF adalah kata sandi pengguna, gunakan opsi "-upw" sebagai ganti dengan kata sandinya. CATATAN

: Pastikan ada tanda petik tunggal di sekitar kata sandi Anda di perintah.

pdfimages -opw 'password' -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image

Untuk informasi lebih lanjut tentang penggunaan perintah pdfimages, ketik "pdfimages" pada prompt di jendela Terminal dan tekan "Enter".Penggunaan perintah ditampilkan dengan daftar opsi yang tersedia untuk digunakan dalam perintah.