15Sep
Jūs galite lengvai konvertuoti PDF failus į redaguojamą tekstą "Linux" naudodami komandų eilutės įrankį "pdftotext".Tačiau, jei originalo PDF byloje yra kokių nors vaizdų, jie nėra išgauti. Norėdami išgauti atvaizdus iš PDF failo, galite naudoti kitą komandų eilutės įrankį, pavadintą "pdfimages".
PASTABA: kai sakome įvesti kažką šiame straipsnyje ir yra viso teksto citatos, NENAUDOKITE citatų, nebent nurodome kitaip.
įrankis "pdfimages" yra poppler-utils paketo dalis. Galite patikrinti, ar ji įdiegta jūsų sistemoje, ir prireikus įdiegti naudojant šiame straipsnyje aprašytus veiksmus.
Norėdami išgauti atvaizdus iš PDF failo naudodami pdf-vaizdus, paspauskite "Ctrl + Alt + T", kad atidarytumėte terminalo langą.Lauke įrašykite šią komandą.
pdfimages /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ paveikslėlis
PASTABA. Jei naudojate visas šiame straipsnyje parodytas komandas, pakeiskite pirmąjį komandos kelią ir PDF failo pavadinimą į pradinio PDF failo kelią ir failo pavadinimą.Antrasis kelias turėtų būti kelias į šakninį aplanką, į kurį norite išsaugoti išgautus atvaizdus. Antrojo kelio pabaigoje esantis žodis "vaizdas" reiškia tai, ką norite įterpti savo failo vardą.Atvaizdų failų vardai automatiškai numeruojami( 000, 001, 002, 003 ir tt).Jei norite pridėti tekstą prie kiekvieno paveikslo pradžios, įveskite šį tekstą antrojo kelio pabaigoje. Pavyzdyje kiekvieno vaizdo failo vardas prasideda "image", pvz., Image-001.ppm, image-002.ppm ir tt tarp nurodyto teksto ir skaičiaus pridedama brūkšnys.
Numatytasis atvaizdo formatas yra PPM( nešiojamoji pixmap), skirta nespalviniams vaizdams, arba PBM( nešiojamasis bitmap) monochrominiams vaizdams.Šie formatai suprojektuoti, kad lengvai būtų galima keistis platformomis.
PASTABA. Galite gauti du vaizdo failus kiekvienam paveikslėliui jūsų PDF rinkmenoje. Antras kiekvieno vaizdo atvaizdas yra tuščias, taigi jūs galėsite pasakyti, kokiuose paveikslėliuose yra failų vaizdai, esančių Failų tvarkytuvės failo miniatiūroje.
Norėdami sukurti. jpg vaizdo failus, pridėkite komandą "-j", kaip parodyta žemiau.
pdfimages -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ vaizdas
PASTABA: Taip pat galite pakeisti numatytąją išvestį į PNG, naudodami "-png" parinktį arba TIFF, naudodamiesi "-tiff" parinktimi.
Pagrindinis vaizdo failas kiekvienam vaizdui išsaugomas kaip. jpg failas. Antras tuščias vaizdas vis dar yra. ppm arba. pbm failas.
Jei norite tik paversti vaizdus tam tikrame puslapyje ir po jo, naudokite "-f" parinktį su skaičiumi, kad nurodytumėte pirmąjį konversijos puslapį, kaip parodyta žemiau esančioje pavyzdinėje komandoje.
pdfimages -f 2-j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ vaizdas
PASTABA: mes sujungėme "-j" parinktį su parinktimi "-f", kad galėtume gauti. jpg atvaizdus ir padarėme tą patį su "-l" parinktimižemiau taip pat.
Norėdami konvertuoti visus vaizdus prieš tam tikrą puslapį ir į jį, naudokite parinktį "-l"( mažoji raidė "L", o ne skaičius "1") su numeriu, nurodydama paskutinį konversijos puslapį, kaip parodyta toliau.
pdfimages -l 1 -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ vaizdas
PASTABA: galite naudoti "-f" ir "-l" parinktis, norėdami konvertuoti atvaizdus į konkretų puslapio diapazoną dokumento viduryje.
Jei PDF rinkmenoje yra savininko slaptažodis, parinktį "-opw" ir slaptažodį naudokite kaip atskiras kabutes, kaip parodyta toliau. Jei PDF failo slaptažodis yra vartotojo slaptažodis, vietoj slaptažodžio naudokite "-upw" parinktį.
PASTABA: įsitikinkite, kad komandoje yra keletas vienos kabučių.
pdfimages -opw "password" -j /home/lori/Documents/ SampleWithImages.pdf /home/lori/Documents/ExtractedImages/ image
Norėdami gauti daugiau informacijos apie komandą pdfimages, įrašykite "pdfimages" lauke terminalo lange ir paspauskite "Enter".Ekrane pateikiamas komandų sąrašas su galimybėmis, kurias galima naudoti komandoje.