29Jun

Kaip konvertuoti PDF failą į redaguojamą tekstą naudojant komandinę eilutę Linux

Yra keletas priežasčių, kodėl galbūt norėsite konvertuoti PDF rinkmeną į redaguojamą tekstą.Galbūt jūs turėsite peržiūrėti seną dokumentą, o visa tai yra PDF versija."PDF" failų konvertavimas "Windows" yra lengvas, bet kas, jei naudojate "Linux"?

Nesijaudink. Mes parodysime, kaip lengvai konvertuoti PDF failus į redaguojamąjį tekstą naudodami komandinės eilutės įrankį pdftotext, kuris yra "poppler-utils" paketo dalis.Šis įrankis jau gali būti įdiegtas. Norėdami patikrinti, ar jūsų sistemoje įdiegta pdftotext, paspauskite "Ctrl + Alt + T", kad atidarytumėte terminalo langą.Lauke įveskite šią komandą ir paspauskite "Enter".

dpkg -s poppler-utils

PASTABA: kai mes sakome įvesti kažką šiame straipsnyje ir yra kabučių aplink tekstą, NENURODYKITE citatos, nebent nurodome kitaip.

Jei pdftotext neįdiegtas, įveskite šią komandą eilutėje ir paspauskite "Enter".

sudo apt-get install poppler-utils

Įveskite savo slaptažodį, kai pasirodys pranešimas ir paspauskite "Enter".

Poppler-utils paketui yra keli įrankiai, skirti konvertuoti PDF į įvairius formatus, manipuliuoti PDF failais ir išgauti informaciją iš failų.

Toliau pateikiama pagrindinė komanda, skirta PDF failo konvertavimui į redaguojamą teksto failą.Paspauskite "Ctrl + Alt + T", kad atidarytumėte terminalo langą, įveskite komandą eilutėje ir paspauskite "Enter".

pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Keiskite kiekvieno failo kelią, kad jis atitiktų pradinio PDF failo vietą ir pavadinimą, ir kur norite išsaugoti gaunamą teksto failą.Taip pat pakeiskite failų vardus, kad jie atitiktų jūsų failų pavadinimus.

Teksto failas yra sukurtas ir jį galima atidaryti taip, kaip atidarote bet kurį kitą tekstinį failą Linux.

Pertvarkytas tekstas gali turėti eilučių pertraukas tose vietose, kuriose nenorite. Linijos pertraukos įterpiamos po kiekvienos PDF teksto eilutės teksto.

Jūs galite išsaugoti savo dokumento išdėstymą( antraštes, poraštes, ieškos ir tt) iš originalaus PDF failo konvertuotame tekstiniame faile naudodami vėliavėlę "-layout".

pdftotext-layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Jei norite tik konvertuoti puslapių asortimentą į PDF failą, naudokite flags "-f" ir "-l"( mažosios raidės "L"), norėdami nurodytipirmasis ir paskutinieji diapazono puslapiai, kuriuos norite konvertuoti.

pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Norėdami konvertuoti apsaugotą ir užšifruotą PDF failą su savininko slaptažodžiu, naudokite "-opw" vėliavą( pirmasis ženklas vėliava yra mažoji raidė "O ", o ne nulis).

pdftotext -opw "slaptažodis" /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Pakeiskite "slaptažodį" į tą, kuris naudojamas paversti originalų PDF failą.Įsitikinkite, kad aplink "slaptažodį" yra vienkartinės kabutės, o ne dvigubos.

Jei PDF failas yra apsaugotas ir užšifruotas vartotojo slaptažodžiu, naudokite "-upw" vėliavėlę, o ne "-opw".Likusi komanda yra ta pati.

Taip pat galite nurodyti pabaigos eilutės simbolio tipą, kuris taikomas konvertuotam tekstui. Tai ypač naudinga, jei planuojate pasiekti failą kitoje operacinėje sistemoje, pvz., "Windows" arba "Mac".Norėdami tai padaryti, naudokite vėliavėlę "-eol"( vidurinis ženklas vėliavoje yra mažoji raidė "O", o ne nulis), po kurios nurodomas tarpas ir norimos naudoti pabaigos simbolio tipas( "unix "," dos "arba" mac ").

PASTABA: jei nenurodysite teksto failo pavadinimo, pdftotext automatiškai naudoja PDF failo pavadinimą ir prideda ".txt" plėtinį.Pavyzdžiui, "file.pdf" bus konvertuotas į "file.txt".Jei teksto failas yra nurodytas kaip "-", konvertuotas tekstas siunčiamas į stdout, o tai reiškia, kad tekstas rodomas terminalo lange ir neišsaugomas į failą.

Norėdami uždaryti terminalo langą, spustelėkite mygtuką "X" viršutiniame kairiajame kampe.

Norėdami gauti daugiau informacijos apie komandą pdftotext, lauke Terminas įveskite "man page pdftotext".