Dokumente scannen automatisieren

Dieses Thema im Forum "Anwendungen" wurde erstellt von Nemesis, 04.12.2010.

  1. #1 Nemesis, 04.12.2010
    Nemesis

    Nemesis N3RD

    Dabei seit:
    28.01.2005
    Beiträge:
    2.165
    Zustimmungen:
    0
    Hi,
    ich würde gerne das Scannen von Dokumenten so vereinfachen, dass nur noch auf ein Scannen-Button geklickt werden muss, und dann das fertige PDf zur Archivierung ausgespuckt wird.
    Warum das ganze ? Damit auch Benutzer, die keine Ahnung vom Scannen und so haben ganz easy solche PDFs erzeugen können.

    Hat jemand nen Tipp für solch ein unterfangen ?

    Thx!
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 schwedenmann, 04.12.2010
    schwedenmann

    schwedenmann Foren Gott

    Dabei seit:
    18.11.2003
    Beiträge:
    2.635
    Zustimmungen:
    2
    Ort:
    Wegberg
    Hallo

    Wir wärer es denn mit scan2pdf

    http://wiki.debianforum.de/Scan2Pdf

    oder du bastelst dir selbst ein script mit scanimage und einem Programm (afaik z.B. imagmagick) zur Konvertierung nach pdf.


    mfg
    schwedenmann
     
  4. #3 Nemesis, 04.12.2010
    Nemesis

    Nemesis N3RD

    Dabei seit:
    28.01.2005
    Beiträge:
    2.165
    Zustimmungen:
    0
    ich bin gerade an nem script dran, mit scanadf, unpaper und mal schauen, was noch so kommt.
    Aber hätte ja sein können, dass es da schon was fertiges gibt ;)
     
  5. #4 schwedenmann, 04.12.2010
    schwedenmann

    schwedenmann Foren Gott

    Dabei seit:
    18.11.2003
    Beiträge:
    2.635
    Zustimmungen:
    2
    Ort:
    Wegberg
  6. #5 Nemesis, 04.12.2010
    Nemesis

    Nemesis N3RD

    Dabei seit:
    28.01.2005
    Beiträge:
    2.165
    Zustimmungen:
    0
    hm, das mit dem scannen und der texterkennung hab ich nu:
    Code:
    #!/bin/bash
    
    #Anzahl seiten
    echo "Anzahl Seiten: ";
    read AnzSeiten;
    
    for i in $AnzSeiten; do
      echo Prepare page $i and press Enter
      read
      scanimage --device '[hier muss der scanner hin]' --format=pnm --mode 'color' --resolution 300 -t 0 -x 210 -y 295 >scan-$i.pnm
    done
    
    for i in $AnzSeiten; do
      echo preparing page $i
      unpaper scan-$i.pnm unpapered-$i.pnm
      convert unpapered-$i.pnm prepared-$i.tif && rm unpapered-$i.pnm
    done
    
    for i in $AnzSeiten; do
      echo doing OCR on page $i
      tesseract prepared-$i.tif tesseract-$i -l deu
    done
    aber ... ich hätte ja gerne, dass an dem pdf der text erkannt wird ... so bekomme ich ein textfile in dem der text steht, aber ich hätte ja gerne das pdf.
     
  7. Anzeige

    Vielleicht findest du HIER Antworten.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  8. #6 schwedenmann, 04.12.2010
    schwedenmann

    schwedenmann Foren Gott

    Dabei seit:
    18.11.2003
    Beiträge:
    2.635
    Zustimmungen:
    2
    Ort:
    Wegberg
    Hallo

    Dann änder das script doch so ab, das nur gescannt wird in pnm (in dem script) und dann z.B. per convert von pnm nach pdf gewandelt wird. Laß den ocr-Quatsch raus, funktioniert sowieso nur zu 95%. selbst bei den profession ellen Winprogrammen.
    Du willst doch nur ein pdf, also scannen per scanimage oder einem andern cli , danach per convert nach pdf wandeln.

    mfg
    schwedenmann
     
  9. #7 Nemesis, 04.12.2010
    Zuletzt bearbeitet: 04.12.2010
    Nemesis

    Nemesis N3RD

    Dabei seit:
    28.01.2005
    Beiträge:
    2.165
    Zustimmungen:
    0
    hm, ok, ich hatte haltdie hoffnung, dass da noch was mit der ocr geht ;)

    edit:

    so gehts:
    Code:
    #!/bin/bash
    
    #Anzahl seiten
    echo "Anzahl Seiten: ";
    read AnzSeiten;
    
    ### Seiten Scannen ###
    for ((i=1; $i<=$AnzSeiten; i++))
    do
      echo Prepare page $i and press Enter
      read
      scanimage --device 'hpaio:/net/Photosmart_2600_series?ip=192.168.0.2' --format=pnm --mode 'color' --resolution 300 -t 0 -x 210 -y 295 >scan-$i.pnm
    done
    
    ### Seiten in .tiff wandeln ###
    echo "Creating TIFF images..."
    ls scan*.pnm | while read p; do echo $p; q=`echo $p | sed 's/scan\(.*\)\.pnm/tiff\1.tiff/'`; echo $q; cat $p | pnmtotiff -lzw > $q; done
    
    ### Zu einer Seite zusammenfügen ###
    tiffcp *.tiff all.tiff
    
    ### in pdf umwandeln ###
    tiff2pdf -z -o Document.pdf all.tiff
    
    das ergebnis ist etwas hell. die parameter brightness und contrast von scanimage funktionieren leider nicht.

    was jetzt noch cool wäre ... wenn ich am scanner sagen könnte, wann die nächste seite eingelegt ist, und er dann scannt, so muss ich nicht immer wischen pc und scanner hin und her rennen.
     
Thema:

Dokumente scannen automatisieren

Die Seite wird geladen...

Dokumente scannen automatisieren - Ähnliche Themen

  1. Wiederherstellen von überschriebenen Dokumenten auf debian samba

    Wiederherstellen von überschriebenen Dokumenten auf debian samba: Ich habe ein Problem. Vor Kurzem hat der Trojaner cryptologer einen Schaden eingerichtet. Glücklicherweise gab es eine Sicherung auf...
  2. Dokumentenmanagement mit Linux

    Dokumentenmanagement mit Linux: Hallo zusammen, ich suche nun seit Tagen das gesamte WWW ab und werde einfach nicht fündig, bin gerade kurz vorm verzweifeln. Kann eigentlich...
  3. OpenKM 6.3.1 verbessert Dokumentenerkennung

    OpenKM 6.3.1 verbessert Dokumentenerkennung: Über eineinhalb Jahre nach der letzten Version ist mit OpenKM 6.3.1 eine verbesserte Variante des Dokumentenverwaltungssystems veröffentlicht...
  4. EU-Institutionen beachten Richtlinien zu offenen Dokumentenformaten nicht

    EU-Institutionen beachten Richtlinien zu offenen Dokumentenformaten nicht: Die überwiegende Mehrheit der EU-Offiziellen, die Dokumente im Internet veröffentlichen, ignorieren die Richtlinien der EU zu offenen...
  5. EU-Institutionen beachten Richtlinien zu offenen Dokumentenformaten nicht

    EU-Institutionen beachten Richtlinien zu offenen Dokumentenformaten nicht: Die überwiegende Mehrheit der EU-Offiziellen, die Dokumente im Internet veröffentlichen, ignorieren die Richtlinien der EU zu offenen...