25Aug

Varför är PDF-filer som genereras av Microsoft Word så stor?

varför-är-pdf-filer genererade-by-microsoft-ord så stora 00

När dina dokument huvudsakligen är text endast i naturen verkar det som om filstorlekarna för. docx och. pdf-versioner ska vara ganska lika när de sparas, men det är inte alltid fallet. Dagens SuperUser Q & A-inlägg har svaret på en nyfiken läsarens frågor om den stora skillnaden i filstorlekar.

Dagens fråga &Svarssession kommer till oss med tillstånd av SuperUser-en indelning av Stack Exchange, en community-driven gruppering av Q & A-webbplatser.

Boxshandskar ClipArt med hjälp av Clker.com.

Frågan

SuperUser-läsaren Borek vill veta varför PDF-filer som genereras av Microsoft Word är så stora:

Jag skapade ett enkelt Microsoft Word-dokument som innehåller just denna mening, inget annat:

  • Detta är ett litet dokument.

Sedan sparade jag dokumentet som. docx och. pdf-filer. Här är filstorlekarna:

  • . docx: 12 kB
  • . pdf: 89 kB

Skillnaden mellan de två filerna är enorm( tekniskt) och det stör mig verkligen när dokument som mestadels är textbaserade är bara tiotals kB in.docx-format, men är hundratals kB i storlek när det konverteras till PDF-filer. Vad är så ineffektivt om PDF-formatet?Är det bara Microsoft Word med någon hemsk utdataalgoritm?

Förresten är inställningarna för PDF-utgången i min Microsoft Office-installation inställd för att skapa de minsta möjliga filerna:

varför-är-pdf-filer genererade-by-microsoft-ord så stora 01

Varför är PDF-filer som genereras av Microsoft Word så stora?

Svaret

SuperUser-bidragare Ren har svaret för oss:

Om du öppnar PDF-filen i Anteckningar ++ hittar du:

varför-är-pdf-filer genererade-by-microsoft-ord så stora 02

Och det här objektet refereras här i slutet av instruktionen / FontFile2:

varför-är-pdf-filer genererade-by-microsoft-ord så stora 03

De teckensnitt som används av en MicrosoftWord-dokument är inbäddade i PDF-filer så att de är fristående. Jag använde detta bildspel från Adobe för att dechiffrera PDF-instruktionerna.

Om du vill förhindra att teckensnitt integreras i en PDF-fil, se till att dina Microsoft Word-dokument använder sig av en av de 14 standardtecknen som finns i PDF-tittare( Källa: Wikipedia).

  • Times New Roman & gt;Tider( v3)( i vanlig, kursiv, fet och fet kursiv)
  • Courier New & gt;Courier( i regelbunden, sned, djärv och djärv snett)
  • Arial & gt;Helvetica( v3)( i regelbunden, sned, djärv och djärv snett)
  • Symbol & gt;Symbol
  • Wingdings & gt;Zapf Dingbats

Har du något att lägga till förklaringen? Ljud av i kommentarerna. Vill du läsa mer svar från andra tech-savvy Stack Exchange-användare? Kolla in hela diskussionsgängan här.