29Jun
ישנן סיבות שונות לכך שתרצה להמיר קובץ PDF לטקסט הניתן לעריכה.אולי אתה צריך לשנות מסמך ישן וכל מה שיש לך הוא גרסת PDF של זה.המרת קבצי PDF ב- Windows היא קלה, אבל מה אם אתה משתמש לינוקס?
אין דאגות.אנו נראה לכם כיצד להמיר בקלות קבצי PDF לטקסט הניתן לעריכה באמצעות כלי שורת פקודה הנקרא pdftotext, המהווה חלק מהחבילה "poppler-utils".ייתכן שכלי זה כבר מותקן.כדי לבדוק אם pdftotext מותקן במערכת שלך, הקש "Ctrl + Alt + T" כדי לפתוח חלון מסוף.הקלד את הפקודה הבאה בשורת הפקודה ולחץ על Enter.
dpkg -s poppler-utils
הערה: כאשר אנו אומרים להקליד משהו במאמר זה ויש ציטוטים מסביב לטקסט, אל תקלידו את המרכאות, אלא אם כן צוין אחרת.
אם pdftotext אינו מותקן, הקלד את הפקודה הבאה בשורת הפקודה ולחץ על Enter.
sudo apt-get התקן את ה- poppler-utils
הקלד את הסיסמה שלך כאשר תתבקש ללחוץ על "Enter".
ישנם מספר כלים הזמינים בחבילה puppler-utils להמרת PDF לפורמטים שונים, מניפולציה של קובצי PDF וחילוץ מידע מקבצים.
להלן הפקודה הבסיסית להמרת קובץ PDF לקובץ טקסט הניתן לעריכה.הקש "Ctrl + Alt + T" כדי לפתוח חלון טרמינל, הקלד את הפקודה בשורת הפקודה ולחץ על "Enter".
pdftotext /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
שנה את הנתיב לכל קובץ כך שיתאים למיקום ולשם של קובץ ה- PDF המקורי שלך והיכן ברצונך לשמור את קובץ הטקסט שנוצר.כמו כן, שנה את שמות הקבצים כך שיתאימו לשמות הקבצים שלך.
קובץ הטקסט נוצר וניתן לפתוח אותו בדיוק כפי שתפתח קובץ טקסט אחר ב- Linux.
הטקסט המומר עשוי לכלול מעברי שורה במקומות שאינך מעוניין בהם.מעברי שורה מוכנסים לאחר כל שורה של טקסט בקובץ PDF.
באפשרותך לשמור על הפריסה של המסמך( כותרות עליונות, כותרות תחתונות, החלפה וכו ') מקובץ PDF המקורי בקובץ הטקסט המומר באמצעות הדגל "Layout".
pdftotext -layout /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
אם ברצונך להמיר רק מספר עמודים בקובץ PDF, השתמש בדגלים "-f" ו- "l"( אותיות קטנות "L") כדי לציין אתהדפים הראשונים והאחרונים בטווח שברצונך להמיר.
pdftotext -f 5 -l 9 /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
כדי להמיר קובץ PDF המוגן ומוצפן באמצעות סיסמת הבעלים, השתמש בדגל "-opw"( התו הראשון בדגל הוא אות קטנה "O ", לא אפס).
pdftotext -opw 'סיסמה' /home/lori/Documents/ Sample.pdf /home/lori/Documents/ Sample.txt
שנה את "הסיסמה" לזו המשמשת להגנה על קובץ PDF המקורי המומר.ודא שיש ציטוטים בודדים, לא כפול, סביב "סיסמה".
אם קובץ ה- PDF מוגן ומוצפן באמצעות סיסמת משתמש, השתמש בדגל "-upw" במקום בדגל "-opw".שאר הפקודה היא זהה.
ניתן גם לציין את סוג תו הסיום של הקו המוחל על הטקסט המומר.אפשרות זו שימושית במיוחד אם בכוונתך לגשת לקובץ במערכת הפעלה אחרת, כגון Windows או Mac.כדי לעשות זאת, השתמש בדגל "-Eol"( התו האמצעי בדגל הוא אות קטנה "O", לא אפס) ואחריו רווח וסוג תו הקצה הרצוי לשימוש( "unix "," dos "או" mac ").
הערה: אם לא תציין קובץ קובץ טקסט, pdftotext משתמש באופן אוטומטי בבסיס קובץ ה- PDF ומוסיף את הסיומת ".txt".לדוגמה, "file.pdf" יומר ל "file.txt".אם קובץ הטקסט מוגדר כ - "", הטקסט המומר נשלח ל stdout, כלומר הטקסט מוצג בחלון טרמינל ולא נשמר בקובץ.
כדי לסגור את חלון הטרמינל, לחץ על הלחצן "X" בפינה השמאלית העליונה.
לקבלת מידע נוסף על הפקודה pdftotext, הקלד "man page pdftotext" בשורת הפקודה בחלון Terminal.