29Jun

Cara Mengkonversi File PDF ke Teks yang Dapat Diedit Menggunakan Baris Perintah di Linux

click fraud protection

Ada berbagai alasan mengapa Anda ingin mengkonversi file PDF ke teks yang dapat diedit. Mungkin Anda perlu merevisi dokumen lama dan yang Anda miliki hanyalah versi PDFnya. Mengkonversi file PDF di Windows itu mudah, tapi bagaimana jika Anda menggunakan Linux?

Jangan khawatir. Kami akan menunjukkan cara mudah mengkonversi file PDF ke teks yang dapat diedit menggunakan alat baris perintah yang disebut pdftotext, yang merupakan bagian dari paket "poppler-utils".Alat ini mungkin sudah terpasang. Untuk memeriksa apakah pdftotext terpasang pada sistem Anda, tekan "Ctrl + Alt + T" untuk membuka jendela terminal. Ketik perintah berikut pada prompt dan tekan "Enter".

dpkg -s poppler-utils

CATATAN: Ketika kita mengatakan untuk mengetik sesuatu di artikel ini dan ada tanda petik di sekitar teks, JANGAN ketik tanda petik, kecuali jika kita menentukan sebaliknya.

Jika pdftotext tidak terpasang, ketik perintah berikut pada prompt dan tekan "Enter".

sudo apt-get install poppler-utils

instagram viewer

Ketikkan kata sandi Anda saat diminta dan tekan "Enter".

Ada beberapa alat yang tersedia dalam paket poppler-utils untuk mengkonversi PDF ke format yang berbeda, memanipulasi file PDF, dan mengekstrak informasi dari file.

Berikut ini adalah perintah dasar untuk mengkonversi file PDF ke file teks yang dapat diedit. Tekan "Ctrl + Alt + T" untuk membuka jendela Terminal, ketik perintah pada prompt, dan tekan "Enter".

pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Mengubah jalur ke setiap file agar sesuai dengan lokasi dan nama file PDF asli Anda dan di mana Anda ingin menyimpan file teks yang dihasilkan. Juga, ganti nama file agar sesuai dengan nama file Anda.

File teks dibuat dan bisa dibuka sama seperti Anda akan membuka file teks lainnya di Linux.

Teks yang dikonversi mungkin memiliki jeda baris di tempat yang tidak Anda inginkan. Jeda baris dimasukkan setelah setiap baris teks dalam file PDF.

Anda dapat melestarikan tata letak dokumen Anda( header, footer, paging, dll.) Dari file PDF asli dalam file teks yang dikonversi menggunakan bendera "-layout".

pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Jika Anda ingin hanya mengubah berbagai halaman dalam file PDF, gunakan tanda "-f" dan "-l"( huruf kecil "L") untuk menentukanhalaman pertama dan terakhir dalam kisaran yang akan dikonversi.

pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Untuk mengkonversi file PDF yang dilindungi dan dienkripsi dengan kata sandi pemilik, gunakan bendera "-opw"( karakter pertama pada bendera adalah huruf kecil "O ", bukan nol).

pdftotext -opw 'password' /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Mengubah "kata sandi" ke file yang digunakan untuk melindungi file PDF asli yang dikonversi. Pastikan ada tanda kutip tunggal, tidak double, sekitar "password".

Jika file PDF dilindungi dan dienkripsi dengan kata sandi pengguna, gunakan tanda "-upw" dan bukan bendera "-opw".Sisa dari perintah adalah sama.

Anda juga dapat menentukan jenis karakter end-of-line yang diterapkan pada teks yang dikonversi. Ini sangat berguna jika Anda berencana untuk mengakses file pada sistem operasi yang berbeda seperti Windows atau Mac. Untuk melakukan ini, gunakan tanda "-eol"( karakter tengah di bendera adalah huruf kecil "O", bukan nol) diikuti oleh spasi dan jenis karakter end-of-line yang ingin Anda gunakan( "unix "," dos ", atau" mac ").CATATAN

: Jika Anda tidak menentukan nama file untuk file teks, pdftotext secara otomatis menggunakan basis nama file PDF dan menambahkan ekstensi ".txt".Misalnya, "file.pdf" akan dikonversi menjadi "file.txt".Jika file teks ditentukan sebagai "-", teks yang dikonversi dikirim ke stdout, yang berarti teks ditampilkan di jendela Terminal dan tidak disimpan ke file.

Untuk menutup jendela Terminal, klik tombol "X" di pojok kiri atas.

Untuk informasi lebih lanjut tentang perintah pdftotext, ketik "man page pdftotext" pada prompt di jendela Terminal.