Hvorfor er PDF-filer genereret af Microsoft Word så stor?
Når dine dokumenter først og fremmest er tekstbeskyttet, så ser det ud til, at filstørrelserne for .docx og .pdf-versioner skal være ret ens, når de gemmes, men det er ikke altid tilfældet. Dagens SuperUser Q & A-indlæg har svaret på en nysgerrig læsers spørgsmål om den store forskel i filstørrelser.
Dagens Spørgsmål & Svar session kommer til os med venlig hilsen af SuperUser-en underafdeling af Stack Exchange, en community-driven gruppe af Q & A-websteder.
Boksehandsker clip-art høflighed af Clker.com.
Spørgsmålet
SuperUser-læser Borek vil vide, hvorfor PDF-filer, der genereres af Microsoft Word, er så store:
Jeg oprettede et simpelt Microsoft Word-dokument, der indeholder netop denne sætning, intet andet:
- Dette er et lille dokument.
Derefter reddede jeg dokumentet som .docx og .pdf-filer. Her er filstørrelserne:
- .docx: 12 kB
- .pdf: 89 kB
Forskellen mellem de to filer er enorm (teknisk), og det gør mig virkelig bekymret, når dokumenter, der hovedsagelig er tekstmæssige, er kun titusindvis af kB i .docx-format, men er hundredvis af kB i størrelse, når de konverteres til PDF-filer. Hvad er så ineffektivt med PDF-format? Er det bare Microsoft Word, der bruger en forfærdelig outputalgoritme?
Forresten er indstillingerne for PDF-output på min Microsoft Office-installation indstillet til at lave de mindste filer:
Hvorfor er PDF-filer, der genereres af Microsoft Word, så store?
Svaret
SuperUser bidragyder rene har svaret for os:
Hvis du åbner PDF-filen i Notepad ++, finder du:
Og dette objekt henvises her i slutningen i instruktionen / FontFile2:
Skrifttyperne, der bruges af et Microsoft Word-dokument, er integreret i PDF-filer, så de er selvstændige. Jeg brugte dette dias-dæk fra Adobe til at dechiffrere PDF-instruktionerne.
Hvis du vil forhindre skrifttyper i at blive indlejret i en PDF-fil, skal du sørge for at dine Microsoft Word-dokumenter gør brug af en af de 14 standard skrifttyper, der er tilgængelige i PDF-seere (Kilde: Wikipedia).
- Times New Roman> Times (v3) (i regelmæssig kursiv, kursiv, fed og fed kursiv)
- Courier New> Courier (i regelmæssig skrå, fed og fed skrå)
- Arial> Helvetica (v3) (i regelmæssig, skrå, fed og fed skrå)
- Symbol> Symbol
- Wingdings> Zapf Dingbats
Har du noget at tilføje til forklaringen? Lyde af i kommentarerne. Vil du læse flere svar fra andre tech-savvy Stack Exchange brugere? Tjek den fulde diskussionstråd her.