PDFs zu groß !!

K

Kleinweich

Tripel-As
Ich scanne gedruckte Textseiten (Zeitschriften, Briefe, etc.) in pdfs nun anstelle von scan2pdf (keine 64-Bit-Installations-rpms für Laien) mit Xsane und das geht eigentlich auch recht gut.
Soeben fand ich sogar raus, wie das für mehrseitige Dokumente geht! (Seitenzahl vorher einstellen und "Mehrseitenprojekt" öffnen).:)
Problem: Bei vernünftiger Auflösung (200 dpi, Graustufe) werden die Dateien viel zu groß. Eine Seite aus DER SPIEGEL hat beispielsweise dann ca. 900 kB.
Ich weiß von einem Microsoft-Nutzer, dass er 30 Seiten in 600 kB bekommen hat.:headup:

Hat jemand einen Tipp für mich?
 
Setze die Auflösung herunter und benutze einen geeignetes Grafikformat wie jpg
 
Ja, das mit der Auflösung hatte ich ja geschrieben: Unter 200 dpi ist es für meine Zwecke nicht verwendbar. Dritte sollen es noch _gut_ lesen können.

Das Grafikformat ... mmm .... die Ausgabe erfolgt doch als pdf.
Ein Grafikformat stelle ich da nirgends ein.
Sehe auch keine Möglichkeiten bei Xsane dazu.
 
Benötige mehrseitige pdfs, da kann ich nicht mit jpg arbeiten.
Außerdem wissen Laien (meine Empfänger) oft nicht, wie sie ein jpg öffnen sollen.
 
Benötige mehrseitige pdfs, da kann ich nicht mit jpg arbeiten.
Außerdem wissen Laien (meine Empfänger) oft nicht, wie sie ein jpg öffnen sollen.

Ich weiss nicht, als was die Dateien in der PDF-Datei gespeichert wird, d.h., welcher Kompressionsalgorithmus verwendet wird. Vermutlich jedoch ein verlustfreier. Dadurch werden die Dateien recht gross. Wenn Du die Scans als JPG speicherst oder sie nach dem Scannen in solche umwandelst, nutzt Du aus, dass jpg als verlustbehaftetes Format in deutlich kleineren Dateien resultiert.

Danach kannst Du sie immernoch in eine PDF-Datei zusammenfassen, z.B., indem Du Dir ein skript schreibst, dass Dir den entsprechenden LaTeX-Code generierst. Dann sollte die resultierende PDF-Datei kleiner sein.

Vielleicht gibt es auch eine Moeglichkeit, die PDF-Datei direkt zu manipulieren, also ohne den Weg (PDF->JPG->LaTeX->PDF), doch der ist mir nicht bekannt.
 
(...)
Danach kannst Du sie immernoch in eine PDF-Datei zusammenfassen, z.B., indem Du Dir ein skript schreibst, dass Dir den entsprechenden LaTeX-Code generierst. Dann sollte die resultierende PDF-Datei kleiner sein.
(...)

Naja, der Weg gänge noch etwas einfacher:
Man richtet sich nen PDF-Drucker ein, druckt die JPGs ueber den PDF-Drucker und fuegt die einzelnen PDFs dann mit pdftk (pdftk *.pdf cat output fertiges.pdf) zusammen (Find ich zumindest einfacher wie den Umweg über LaTeX)
 
Naja, der Weg gänge noch etwas einfacher:
Man richtet sich nen PDF-Drucker ein, druckt die JPGs ueber den PDF-Drucker und fuegt die einzelnen PDFs dann mit pdftk (pdftk *.pdf cat output fertiges.pdf) zusammen (Find ich zumindest einfacher wie den Umweg über LaTeX)
Full ACK.

Ich weiss nicht, als was die Dateien in der PDF-Datei gespeichert wird, d.h., welcher Kompressionsalgorithmus verwendet wird. Vermutlich jedoch ein verlustfreier.
Hatte ich auch vermutet, ist aber nicht so, da man zumindest unter "Fenstern" die Kompression bis soweit herunterschrauben (oder heraufschrauben, wie auch immer), bis die Seiten wirklich sehr "unschön" aussehen. Wie man dies unter Linux mit Tools erreicht, weis ich leider noch nicht, nehme aber an, dass es ebenfalls mit pdftk geht.

@kleinweich:
Also ich verstehe nicht so ganz, warum Du ausgerechnet 200 dpi nimmst ? Sind denn die Vorlagen für den Druck oder nur für den Monitor bestimmt ?
Falls für den Druck, dann wären wohl 300dpi besser, und falls für den Monitor, da reichen 72 dpi bzw. 96 dpi für TFT-Monitore.
 
Danke bisher.
Mit meinen 200 dpi meine ich nicht den Output-Parameter, sondern den Input, den scan-Vorgang selbst: Der Scanner muss um die 200 dpi machen, damit es seriös (kundenfreundlich) lesbar wird.

Drunter wird es "bröckelig".

Ich habe gestern 19 Seiten mit 175 dpi auf 660 KByte bekommen, indem ich nicht "grayscale" sondern "lineart" benutzt habe. Das ist immerhin schon nicht schlecht, aber immer noch viel schlechter als das, was ich von Microsoftprodukten-Windows kenne.

Das Zusammenfügen per Skript kriege ich nicht so einfach hin. Es sind ja immer unterschiedlich viele Seiten.
 
Ich habe gestern 19 Seiten mit 175 dpi auf 660 KByte bekommen, indem ich nicht "grayscale" sondern "lineart" benutzt habe. Das ist immerhin schon nicht schlecht, aber immer noch viel schlechter als das, was ich von Microsoftprodukten-Windows kenne.

Das Problem, um das Du versucht herum zu tänzeln *smile*, ist folgendes:
Du kanns keine 30 Seiten auf 600 KB in ein PDF Dokument paken, sofern Du diese Seiten nicht selber mit einem DTP-Prg. erstellt hast.
Die von Dir eingescannten Seiten, haben definitiv mehr Daten, als das original Material. Demnach kannste Dich echt auf den Kopf stellen, kommst aber nicht auf das gewünschte Ergebnis (Seitenanzahl u. kleine PDF-Datei) und das in einer anständigen Auflösung (Qualität).

Unter Windows würde ich die Seiten jetzt mit 75-150 dpi einscannen und dann mit dem Adobe-Zeugs ins PDF packen, natürlich bei entsprechender Komprimierung.
Wie das jetzt unter Linux laufen könnte, entzieht sich bislang meiner Kenntnis - leider, da ich ebenfalls viel mit PDFs arbeite.
Ich würde die Seiten jetzt (mit 75-150 dpi und Graustufenmodus, da Bitmaps bei mir echt grausig aussehen, selbst bei 600 dpi) einscannen und als PDF speichern. Danach würde ich nochmals versuchen das "PDF-Endprodukt" (falls noch weitere PDFs dazu kommen sollten) zu zippen.
Vielleicht bringt's ja was ;)

Cu
W.
 
Adobe Acrobat (unter Win) hat doch beim Erstellen eine Option für Kompressionsfaktor... Also, der nimmt doch den Original-Inhalt, rechnet aber für's PDF dann selber runter. Also käme das evtl wirklich auf's selbe hinaus, erst brauchbar einzuscannen, dann die Bilder zu verkleinern und noch mal zu erstellen. Was anderes wüßte ich auch gerade nicht...

http://www.unixboard.de/vb3/attachment.php?attachmentid=2920&stc=1&d=1204133899
 

Anhänge

  • distiller.png
    distiller.png
    9,9 KB · Aufrufe: 37
Ja, ich nehme an, dass es die von Jens beschriebene Optimierungsmöglichkeit ist, die meinem Winzigweich-Kollegen die deutlich besseren Ergebnisse ermöglicht!:headup:

Danke auch für die übrigen Stellungnahmen!:)

Ich meine, mit scan2pdf sei es besser gewesen. Leider kann ich das auf meinem 64-Bit-System (noch) nicht installieren.
 

Ähnliche Themen

Textkonsole mit KMS zu klein

Xinerama und ATI Treiber?

Zurück
Oben