29Jun

כיצד להמיר קובץ PDF לטקסט לעריכה באמצעות שורת הפקודה ב - Linux

ישנן סיבות שונות לכך שתרצה להמיר קובץ PDF לטקסט הניתן לעריכה.אולי אתה צריך לשנות מסמך ישן וכל מה שיש לך הוא גרסת PDF של זה.המרת קבצי PDF ב- Windows היא קלה, אבל מה אם אתה משתמש לינוקס?

אין דאגות.אנו נראה לכם כיצד להמיר בקלות קבצי PDF לטקסט הניתן לעריכה באמצעות כלי שורת פקודה הנקרא pdftotext, המהווה חלק מהחבילה "poppler-utils".ייתכן שכלי זה כבר מותקן.כדי לבדוק אם pdftotext מותקן במערכת שלך, הקש "Ctrl + Alt + T" כדי לפתוח חלון מסוף.הקלד את הפקודה הבאה בשורת הפקודה ולחץ על Enter.

dpkg -s poppler-utils

הערה: כאשר אנו אומרים להקליד משהו במאמר זה ויש ציטוטים מסביב לטקסט, אל תקלידו את המרכאות, אלא אם כן צוין אחרת.

אם pdftotext אינו מותקן, הקלד את הפקודה הבאה בשורת הפקודה ולחץ על Enter.

sudo apt-get התקן את ה- poppler-utils

הקלד את הסיסמה שלך כאשר תתבקש ללחוץ על "Enter".

ישנם מספר כלים הזמינים בחבילה puppler-utils להמרת PDF לפורמטים שונים, מניפולציה של קובצי PDF וחילוץ מידע מקבצים.

להלן הפקודה הבסיסית להמרת קובץ PDF לקובץ טקסט הניתן לעריכה.הקש "Ctrl + Alt + T" כדי לפתוח חלון טרמינל, הקלד את הפקודה בשורת הפקודה ולחץ על "Enter".

pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

שנה את הנתיב לכל קובץ כך שיתאים למיקום ולשם של קובץ ה- PDF המקורי שלך והיכן ברצונך לשמור את קובץ הטקסט שנוצר.כמו כן, שנה את שמות הקבצים כך שיתאימו לשמות הקבצים שלך.

קובץ הטקסט נוצר וניתן לפתוח אותו בדיוק כפי שתפתח קובץ טקסט אחר ב- Linux.

הטקסט המומר עשוי לכלול מעברי שורה במקומות שאינך מעוניין בהם.מעברי שורה מוכנסים לאחר כל שורה של טקסט בקובץ PDF.

באפשרותך לשמור על הפריסה של המסמך( כותרות עליונות, כותרות תחתונות, החלפה וכו ') מקובץ PDF המקורי בקובץ הטקסט המומר באמצעות הדגל "Layout".

pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

אם ברצונך להמיר רק מספר עמודים בקובץ PDF, השתמש בדגלים "-f" ו- "l"( אותיות קטנות "L") כדי לציין אתהדפים הראשונים והאחרונים בטווח שברצונך להמיר.

pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

כדי להמיר קובץ PDF המוגן ומוצפן באמצעות סיסמת הבעלים, השתמש בדגל "-opw"( התו הראשון בדגל הוא אות קטנה "O ", לא אפס).

pdftotext -opw 'סיסמה' /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt

שנה את "הסיסמה" לזו המשמשת להגנה על קובץ PDF המקורי המומר.ודא שיש ציטוטים בודדים, לא כפול, סביב "סיסמה".

אם קובץ ה- PDF מוגן ומוצפן באמצעות סיסמת משתמש, השתמש בדגל "-upw" במקום בדגל "-opw".שאר הפקודה היא זהה.

ניתן גם לציין את סוג תו הסיום של הקו המוחל על הטקסט המומר.אפשרות זו שימושית במיוחד אם בכוונתך לגשת לקובץ במערכת הפעלה אחרת, כגון Windows או Mac.כדי לעשות זאת, השתמש בדגל "-Eol"( התו האמצעי בדגל הוא אות קטנה "O", לא אפס) ואחריו רווח וסוג תו הקצה הרצוי לשימוש( "unix "," dos "או" mac ").

הערה: אם לא תציין קובץ קובץ טקסט, pdftotext משתמש באופן אוטומטי בבסיס קובץ ה- PDF ומוסיף את הסיומת ".txt".לדוגמה, "file.pdf" יומר ל "file.txt".אם קובץ הטקסט מוגדר כ - "", הטקסט המומר נשלח ל stdout, כלומר הטקסט מוצג בחלון טרמינל ולא נשמר בקובץ.

כדי לסגור את חלון הטרמינל, לחץ על הלחצן "X" בפינה השמאלית העליונה.

לקבלת מידע נוסף על הפקודה pdftotext, הקלד "man page pdftotext" בשורת הפקודה בחלון Terminal.