25Aug

Waarom zijn PDF-bestanden die worden gegenereerd door Microsoft Word zo groot?

waarom-zijn-pdf-files-gegenereerde-by-microsoft-word-so-large-00

Wanneer uw documenten voornamelijk in de natuur zijn geschreven, lijkt het erop dat de bestandsgrootten voor. docx- en. pdf-versies redelijk vergelijkbaar moeten zijn wanneer ze worden opgeslagen, maar dat is niet altijd het geval. De SuperUser Q & A post van vandaag heeft het antwoord op de vragen van een nieuwsgierige lezer over het grote verschil in bestandsgroottes.

De vraag van vandaag &Antwoord sessie komt naar ons met dank aan SuperUser-een onderverdeling van Stack Exchange, een community-gestuurde groepering van Q & A-websites.

Bokshandschoenen clip-art met dank aan Clker.com.

De vraag

SuperUser lezer Borek wil weten waarom PDF-bestanden gegenereerd door Microsoft Word zo groot zijn:

Ik heb een eenvoudig Microsoft Word-document gemaakt met alleen deze zin, verder niets:

  • Dit is een klein document.

Toen heb ik het document opgeslagen als. docx- en. pdf-bestanden. Hier zijn de bestandsgrootten:

  • . docx: 12 kB
  • . pdf: 89 kB

Het verschil tussen de twee bestanden is enorm( technisch) en het stoort me echt wanneer documenten die meestal tekstueel van aard zijn slechts tientallen kB bevatten.docx-indeling, maar zijn honderden kB groot als ze naar PDF-bestanden worden geconverteerd. Wat is er zo inefficiënt aan het PDF-formaat? Is het gewoon Microsoft Word dat een verschrikkelijk output-algoritme gebruikt?

Trouwens, de PDF-uitvoerinstellingen van mijn Microsoft Office-installatie zijn ingesteld om de kleinst mogelijke bestanden te maken:

waarom-zijn-pdf-files-gegenereerde-by-microsoft-word-so-large-01

Waarom zijn PDF-bestanden die door Microsoft Word worden gegenereerd zo groot?

Het antwoord

SuperUser contributor rene heeft het antwoord voor ons:

Als u het PDF-bestand opent in Notepad ++, vindt u:

waarom-zijn-pdf-files-gegenereerde-by-microsoft-word-so-large-02

En dat object wordt hier aan het eind vermeld in de instructie / FontFile2:

waarom-zijn-pdf-files-gegenereerde-by-microsoft-word-so-large-03

De lettertypen die door Microsoft worden gebruiktWord-documenten zijn ingesloten in PDF-bestanden, zodat ze op zichzelf staan. Ik heb dit dia-deck van Adobe gebruikt om de PDF-instructies te ontcijferen.

Als u wilt voorkomen dat lettertypen worden ingesloten in een PDF-bestand, moet u ervoor zorgen dat uw Microsoft Word-documenten gebruikmaken van een van de 14 standaardlettertypen die beschikbaar zijn in PDF-viewers( Bron: Wikipedia).

  • Times New Roman & gt;Tijden( v3)( in normaal, cursief, vet en vet cursief)
  • Courier Nieuw & gt;Courier( in normale, schuine, bold en bold oblique)
  • Arial & gt;Helvetica( v3)( in normale, schuine, bold en bold oblique)
  • Symbol & gt;Symbool
  • Wingdings & gt;Zapf Dingbats

Heeft u iets toe te voegen aan de uitleg? Geluid uit in de reacties. Wilt u meer antwoorden van andere technisch onderlegde Stack Exchange-gebruikers lezen? Bekijk de volledige discussiethread hier.