29Jun
Bir PDF dosyasını düzenlenebilir metne dönüştürmek isteyebileceğiniz çeşitli nedenler vardır. Belki eski bir belgeyi gözden geçirmeniz gerekir ve sahip olduğunuz PDF versiyonudur. PDF dosyalarını Windows'ta dönüştürmek kolaydır; ancak Linux kullanıyorsanız ne olacak?
Endişelenme yok."Poppler-utils" paketinin bir parçası olan pdftotext adlı bir komut satırı aracını kullanarak PDF dosyalarını düzenlenebilir metne kolayca nasıl dönüştüreceğinizi göstereceğiz. Bu araç zaten yüklenmiş olabilir. Pdftotext'in sisteminize kurulup kurulmadığını kontrol etmek için bir terminal penceresi açmak için "Ctrl + Alt + T" tuşlarına basın. Komutta aşağıdaki komutu yazın ve "Enter" tuşuna basın.
dpkg -s poppler-utils
NOT: Bu makalede bir şeyler yazmak istediğimizde ve metnin üzerinde tırnak işareti varsa, aksini belirtmediğimiz sürece tırnak işaretleri yazmayın.
Eğer pdftotext kurulu değilse, istemde aşağıdaki komutu yazıp "Enter" tuşuna basın.
sudo apt-get install poppler-utils
İstendiğinde şifrenizi yazın ve "Enter" tuşuna basın.
PDF'yi farklı biçime dönüştürmek, PDF dosyalarını değiştirmek ve dosyalardan bilgi ayıklamak için poppler-utils paketinde bulunan birçok araç bulunmaktadır.
Aşağıda, bir PDF dosyasını düzenlenebilir bir metin dosyasına dönüştürmek için kullanılan temel komuttur. Bir Terminal penceresi açmak için "Ctrl + Alt + T" tuşlarına basın, istemde komutu yazın ve "Enter" tuşuna basın.
pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Orijinal dosyanızın ve PDF dosyanızın adını ve konumunu ve elde edilen metin dosyasını kaydetmek istediğiniz yere karşılık gelecek şekilde her dosyanın yolunu değiştirin. Ayrıca, dosya adlarını dosyalarınızın adlarına uygun olacak şekilde değiştirin.
Metin dosyası oluşturulur ve Linux'ta başka bir metin dosyasını açtığınız gibi açılabilir.
Dönüştürülen metinde, istemediğiniz yerlerde satır sonları olabilir. Satır sonları, PDF dosyasındaki her metin satırından sonra eklenir.
"-layout" bayrağını kullanarak, belgenizin düzenini( üstbilgi, altbilgi, sayfalama, vb.) Orijinal PDF dosyasından dönüştürülmüş metin dosyasında koruyabilirsiniz.
pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Sadece bir PDF dosyasındaki bir dizi sayfayı dönüştürmek istiyorsanız, "-f" ve "-l"( küçük "L") bayrakları kullanın. Dönüştürmek istediğiniz aralıktaki ilk ve son sayfalar.
pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Korunan ve bir kullanıcı parolasıyla şifrelenmiş bir PDF dosyasını dönüştürmek için "-opw" işaretini kullanın( bayrağın ilk harfi küçük harf "O ", sıfır değil).
pdftotext -opw 'parola' /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Dönüştürülen orijinal PDF dosyasını korumak için kullanılan parolayı değiştirin."Parola" etrafında çift değil, tek tırnak işareti olduğundan emin olun.
PDF dosyası bir kullanıcı parolasıyla korunuyorsa ve şifrelenmişse, "-opw" bayrağı yerine "-upw" bayrağını kullanın. Komutanın geri kalan kısmı aynıdır.
Dönüştürülen metne uygulanan satır sonu karakterinin türünü de belirleyebilirsiniz. Bu, Windows veya Mac gibi farklı bir işletim sisteminde dosyaya erişmeyi planlıyorsanız, özellikle yararlıdır. Bunu yapmak için, "-eol" bayrağını kullanın( bayrağın orta karakteri sıfırdan küçük harf "O") ve ardından boşluk karakteri ve kullanmak istediğiniz satırın sonu türü( "unix "," dos "veya" mac ").
NOT: Metin dosyası için bir dosya adı belirtmezseniz, pdftotext otomatik olarak PDF dosya adının tabanını kullanır ve ".txt" uzantısını ekler.Örneğin, "file.pdf", "file.txt" e dönüştürülecektir. Metin dosyası "-" olarak belirtilmişse, dönüştürülen metin stdout'a gönderilir; bu, metin Terminal penceresinde görüntülenir ve bir dosyaya kaydedilmemiş demektir.
Terminal penceresini kapatmak için, sol üst köşedeki "X" düğmesini tıklayın.
Pdftotext komutu hakkında daha fazla bilgi için, Terminal penceresinde istemde "man page pdftotext" yazın.