29Jun

Kā konvertēt PDF failu uz rediģējamu tekstu, izmantojot komandrindu Linux

Ir dažādi iemesli, kāpēc jūs varētu vēlēties pārveidot PDF failu rediģējamā tekstā.Varbūt jums ir jāpārskata vecais dokuments, un viss, kas jums ir, ir tā PDF versija. PDF failu pārvēršana sistēmā Windows ir vienkārša, bet, ja jūs lietojat Linux?

Neuztraucieties. Mēs parādīsim, kā viegli konvertēt PDF failus uz rediģējamu tekstu, izmantojot komandrindas rīku pdftotext, kas ir daļa no poppler-utils paketes.Šis rīks jau ir instalēts. Lai pārbaudītu, vai jūsu sistēmā ir instalēta pdftotext, nospiediet taustiņu kombināciju Ctrl + Alt + T, lai atvērtu termināla logu. Uzvednē ierakstiet šādu komandu un nospiediet "Enter".

dpkg -s poppler-utils

PIEZĪME. Kad mēs saka, ka šajā rakstā kaut ko ierakstiet, un tekstā ir citāti, NEDRĪKST ievadīt citātus, ja vien mēs nenorādīsim citādi.

Ja pdftotext nav instalēts, uzvednē ierakstiet šādu komandu un nospiediet "Enter".

sudo apt-get install poppler-utils

Ievadiet paroli pēc uzvednes un nospiediet "Enter".

Poppler-utils paketē ir vairāki rīki, kas ļauj pārveidot PDF dažādos formātos, manipulēt ar PDF failiem un iegūt informāciju no failiem.

Sekojošā ir pamata komanda, lai PDF failu pārveidotu rediģējamā teksta failā.Nospiediet "Ctrl + Alt + T", lai atvērtu Terminal logu, ierakstiet komandu uz uzvednes un nospiediet "Enter".

pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Mainiet ceļu uz katru failu, lai tas atbilstu sākotnējā PDF faila atrašanās vietai un nosaukumam un kur vēlaties saglabāt iegūto teksta failu. Arī nomainiet failu nosaukumus, lai tie atbilstu jūsu failu nosaukumiem.

Teksta fails ir izveidots un to var atvērt, tāpat kā Linux atvērt jebkuru citu teksta failu.

Pārveidotajā tekstā var būt līniju pārtraukumi vietās, kurās nevēlaties. Līniju pārtraukumi tiek ievietoti PDF failā pēc katras teksta rindiņas.

Jūs varat saglabāt dokumenta( galvenes, kājenes, peidžeru utt.) Izkārtojumu no sākotnējā PDF faila pārveidotā teksta failā, izmantojot karodziņu "-layout".

pdftotext-izkārtojums /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Ja vēlaties tikai pārvērst lappušu diapazonu PDF failā, izmantojiet "-f" un "-l"( mazo burtu "L") karodziņus, lai norādītupirmās un pēdējās lapas diapazonā, kuru vēlaties konvertēt.

pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Lai konvertētu PDF failu, kas ir aizsargāts un šifrēts ar īpašnieka paroli, izmantojiet karodziņu "-opw"( pirmais rakstzīme karodziņā ir mazā burti "O ", nevis nulle).

pdftotext -opw "parole" /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Mainiet "paroli" uz to, kuru izmanto, lai aizsargātu oriģinālo PDF failu, kas tiek konvertēts. Pārliecinieties, vai par "paroli" ir vienas kotācijas, nevis dubultās.

Ja PDF fails ir aizsargāts un šifrēts ar lietotāja paroli, izmantojiet karodziņu "-opw", nevis karodziņu "-opw".Pārējās komandas ir vienādas.

Varat arī norādīt, kā pārvēršamam tekstam tiek izmantots beigu līnijas rakstzīmes veids. Tas ir īpaši noderīgi, ja plānojat piekļūt failam citā operētājsistēmā, piemēram, Windows vai Mac. Lai to izdarītu, izmantojiet karodziņu "-eol"( karodziņa vidējais raksturs ir mazā burts "O", nevis nulle), kam seko atstarpe un izmantojamā beigu līnija, kuru vēlaties izmantot( "unix "," dos "vai" mac ").

PIEZĪME. Ja teksta faila nosaukumu nenosakat, pdftotext automātiski izmanto PDF faila nosaukuma bāzi un pievieno paplašinājumu. txt. Piemēram, "file.pdf" tiks konvertēts uz "file.txt".Ja teksta fails ir norādīts kā "-", pārveidotais teksts tiek nosūtīts uz stdout, kas nozīmē, ka teksts tiek parādīts Terminal logā un nav saglabāts failā.

Lai aizvērtu Terminal logu, noklikšķiniet uz pogas "X" augšējā kreisajā stūrī.

Lai iegūtu papildinformāciju par komandu pdftotext, logā Termināla uzvednē ierakstiet "man page pdftotext".