29Jun

Hogyan lehet PDF fájl átalakítani szerkeszthető szöveggé a parancssor használatával Linux alatt?

Különböző okok miatt lehet, hogy PDF fájlt szeretne átalakítani szerkeszthető szöveggé.Lehet, hogy meg kell vizsgálnod egy régi dokumentumot, és mindaz, ami van, a PDF verziója. A PDF fájlok konvertálása a Windows rendszerben egyszerű, de mi van, ha Linuxot használsz?

Nincs gond. Megmutatjuk Önnek, hogyan lehet egyszerűen konvertálni a PDF fájlokat szerkeszthető szövegekké egy pdftotext nevű parancssori eszköz segítségével, amely a "poppler-utils" csomag részét képezi. Ez az eszköz már telepítve van. Annak ellenőrzéséhez, hogy a pdftotext telepítve van-e a rendszeren, megnyissa a terminál ablak megnyitásához a "Ctrl + Alt + T" billentyűt.Írja be a következő parancsot a parancssorba, és nyomja meg az "Enter" billentyűt.

dpkg -s poppler-utils

MEGJEGYZÉS: Ha azt mondjuk, hogy írunk valamit ebben a cikkben, és idézőjelek vannak a szöveg körül, NE írja be az idézőjeleket, hacsak másképp nem jelöljük.

Ha a pdftotext nincs telepítve, írja be a parancssorba a következő parancsot, és nyomja meg az "Enter" billentyűt.

sudo apt-get telepítése poppler-utils

Írja be a jelszavát, amikor a rendszer kéri, és nyomja meg az "Enter" billentyűt.

A poppler-utils csomagban többféle eszköz áll rendelkezésre a PDF formátumok különböző formátumokká való átalakításához, PDF fájlok manipulálásához és fájlokból történő kitermeléshez.

A következő az alap parancs a PDF fájl konvertálható szerkeszthető szövegfájlba. A Terminál ablak megnyitásához nyomja meg a "Ctrl + Alt + T" billentyűkombinációt, írja be a parancsot a parancssorba, és nyomja meg az "Enter" billentyűt.

pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Módosítsa az egyes fájlok elérési útját, hogy megfeleljen az eredeti PDF fájl helyének és nevének, és ahol menteni szeretné az eredményül kapott szöveges fájlt. Szintén módosítsa a fájlneveket a fájlok nevének megfelelően.

A szövegfájl létrehozása és megnyitása éppúgy megnyitható, mint bármely más szövegfájl megnyitása Linux alatt.

A konvertált szövegnek olyan soraiban lehetnek vonalszakaszok, amelyeket nem kíván. A sorok megszakítása a PDF-fájl minden egyes sorát követően beillesztésre kerül.

A konvertált szövegfájl eredeti PDF-fájljából az "-layout" jelzővel megőrizheti a dokumentum elrendezését( fejlécek, láblécek, személyhívó stb.).

pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Ha csak egy PDF-fájlban szeretne oldalakat módosítani, használja a "-f" és "-l"( kisbetűs "L") jelzőket aaz első és az utolsó oldalakat a konvertálni kívánt tartományban.

pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

Tulajdonosi jelszóval védett és titkosított PDF fájl konvertálásához használja a "-opw" jelzőt( a zászló első karaktere egy kis betű "O ", nem nulla).

pdftotext -opw 'jelszó' /home/lori/Documents/ Példa.pdf /home/lori/Documents/ Sample.txt

A "jelszó" megváltoztatása az eredeti PDF fájl konvertálásához használt jelszóval. Győződjön meg róla, hogy vannak egyetlen idézetek, nem duplán, a "jelszó" körül.

Ha a PDF-fájl védett és titkosított felhasználói jelszóval, használja a "-upw" jelzőt a "-opw" jelző helyett. A parancs többi része ugyanaz.

Megadhatja a konvertált szöveghez tartozó végsor karakterek típusát is. Ez különösen akkor hasznos, ha a fájlt egy másik operációs rendszeren, például a Windows vagy a Mac rendszeren kívánja elérni. Ehhez használja a "-eol" jelzőt( a zászló középső karaktere egy kis "O" betű, nem nulla), majd egy szóköz és a használni kívánt végső karakter típusa( "unix "," dos "vagy" mac ").

MEGJEGYZÉS: Ha nem ad meg fájlnevet a szöveges fájlhoz, a pdftotext automatikusan használja a PDF fájlnév alapját, és hozzáadja a ".txt" kiterjesztést. Például a "file.pdf" át lesz alakítva "file.txt".Ha a szövegfájl "-" -ként van megadva, a konvertált szöveg stdoutra kerül, ami azt jelenti, hogy a szöveg a Terminál ablakban jelenik meg, és nem kerül mentésre egy fájlba.

A Terminal ablak bezárásához kattintson a "jobbra" -görbe "X" gombra.

A pdftotext parancsra vonatkozó további információkért írja be a "man page pdftotext" parancsot egy Terminál ablakban.