29Jun
Obstaja več razlogov, zakaj želite pretvoriti datoteko PDF v besedilo, ki ga je mogoče urejati. Morda boste morali spremeniti starejši dokument in vse, kar imate, je različica PDF.Pretvarjanje datotek PDF v operacijskem sistemu Windows je preprosto, toda kaj, če uporabljate Linux?
Brez skrbi. Pokazali vam bomo, kako preprosto pretvoriti datoteke PDF v besedilo, ki ga je mogoče urejati, z uporabo ukazne vrstice z imenom pdftotext, ki je del paketa "poppler-utils".To orodje je morda že nameščeno.Če želite preveriti, ali je v vašem sistemu nameščen pdftotext, pritisnite »Ctrl + Alt + T«, da odprete terminalsko okno. Na poziv vpišite naslednji ukaz in pritisnite "Enter".
dpkg -s poppler-utils
OPOMBA: Ko rečemo, da nekaj vnesemo v ta članek in obstajajo citati okrog besedila, NE vnesite ponudb, razen če ne določimo drugače.
Če pdftotext ni nameščen, v pozivu vnesite naslednji ukaz in pritisnite "Enter".
sudo apt-get namestite poppler-utils
Vnesite geslo, ko ste pozvani, in pritisnite "Enter".
V paketu poppler-utils je na voljo več orodij za pretvorbo PDF v različne oblike, manipuliranje datotek PDF in pridobivanje informacij iz datotek.
Sledi osnovni ukaz za pretvorbo datoteke PDF v urejevalno besedilno datoteko. Pritisnite "Ctrl + Alt + T", da odprete terminalsko okno, v ukazu vnesite ukaz in pritisnite "Enter".
pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Spremenite pot do vsake datoteke, da ustreza lokaciji in imenu izvorne datoteke PDF in kje želite shraniti nastalo besedilno datoteko. Prav tako spremenite imena datotek, da ustrezajo imenom datotek.
Besedilna datoteka je ustvarjena in jo lahko odprete tako, kot bi odprla katero koli drugo besedilno datoteko v Linuxu.
Pretvorjeno besedilo ima lahko prelome vrstic na mestih, ki jih ne želite. Prekinitve vrstic se vstavijo za vsako vrstico besedila v datoteki PDF.
Ohranite postavitev vašega dokumenta( glave, noge, ostrine itd.) Iz izvirne datoteke PDF v pretvorjeni tekstovni datoteki z uporabo "-layout" zastave.
pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Če želite pretvoriti le vrsto strani v datoteko PDF, uporabite oznake »-f« in »-l«( majhne črke »L«), da določiteprve in zadnje strani v obsegu, ki ga želite pretvoriti.
pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Če želite pretvoriti datoteko PDF, ki je zaščitena in šifrirana z geslom lastnika, uporabite zastavico "-opw"( prvi znak v zastavi je majhna črka "O ", ne nič).
pdftotext -opw 'geslo' /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
Spremenite "geslo" na tisto, ki se uporablja za zaščito izvirne PDF datoteke, ki se pretvori. Poskrbite, da obstajajo enojni koti, ne pa dvojni, okrog »gesla«.
Če je datoteka PDF zaščitena in šifrirana z uporabniškim geslom, uporabite zastavo "-upw" namesto "-opw" zastave. Preostali del ukaza je enak.
Določite lahko tudi vrsto končnega črtnega znaka, ki se uporablja za pretvorjeno besedilo. To je še posebej uporabno, če nameravate dostopati do datoteke v drugem operacijskem sistemu, kot sta Windows ali Mac.Če želite to narediti, uporabite zastavico »-eol«( srednji znak v zastavi je majhna črka »O«, ne pa nič), ki ji sledi presledek in vrsta znaka za konec črte, ki ga želite uporabiti( »unix "," dos "ali" mac ").
OPOMBA: Če ne navedete imena datoteke za besedilno datoteko, pdftotext samodejno uporabi bazo datoteke PDF in dodaja razširitev ».txt«.Na primer, "file.pdf" bo pretvorjen v "file.txt".Če je besedilna datoteka podana kot "-", se pretvorjeno besedilo pošlje v stdout, kar pomeni, da je besedilo prikazano v oknu Terminal in ni shranjeno v datoteko.
Če želite zapreti okno Terminal, kliknite gumb "X" v zgornjem levem kotu.
Za več informacij o ukazu pdftotext vnesite »man page pdftotext« na poziv v oknu Terminal.