pdf auslesen und ausgeben

Dieses Thema im Forum "Programmieren allgemein" wurde erstellt von Graf_Ithaka, 18.11.2006.

  1. #1 Graf_Ithaka, 18.11.2006
    Graf_Ithaka

    Graf_Ithaka Routinier

    Dabei seit:
    29.01.2005
    Beiträge:
    487
    Zustimmungen:
    0
    Ort:
    Steiermark nahe Graz
    Hallo alle zusammen,

    erstmal hoffe ich dass der Thread in der richtigen Kategorie gelandet ist, falls dem nicht so ist, bitte verschieben!
    Mein momentanes Projekt betrifft ein kleine Programm (oder Script) welches täglich eine pdf mit Namen <Datumsstempel>.pdf herunterlädt, diese nach einer gewissen (variabel einstellbaren) Zeichenfolge durchsucht und die Zeile mit der Zeichenfolge ausgibt. Das ganze soll in Richtung Notifier gehen - um den Hintergrund zu erklären, ich möchte den Supplierplan unserer Schule der als pdf täglich online gestellt wird auslesen und die Supplierungen für den nächsten Tag anzeigen lassen. Die Variable ist natürlich die Klasse.
    Es sei gesagt, dass ich selbst programmiertechnisch unerfahren bin und denke ich lern durch so ein Projekt sicher etwas dazu. Allerdings stellt sich die Frage wo ich ansetzen sollte - Das ganze programmieren oder scripten? Was meint ihr? Und irgendjemand eine Idee wie man eine pdf ausliest (pdf2html oder pdf2text sind denke ich mal keine besonders gute Idee). Hier als Beispiel die pdf von Montag.

    MfG,
    Graf_Ithaka
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 supersucker, 18.11.2006
    supersucker

    supersucker Foren Gott

    Dabei seit:
    21.02.2005
    Beiträge:
    3.873
    Zustimmungen:
    0
    Ich würde dir empfehlen java in Verbindung mit der library PDFBox zu verwenden.

    Damit wirst du recht schnell sehr gute Ergebnisse erzielen.
     
  4. #3 Graf_Ithaka, 18.11.2006
    Graf_Ithaka

    Graf_Ithaka Routinier

    Dabei seit:
    29.01.2005
    Beiträge:
    487
    Zustimmungen:
    0
    Ort:
    Steiermark nahe Graz
    Danke für die Hilfe, werde mich sobald ich mal mehr Zeit finde an die Arbeit machen :)

    MfG,
    Graf_Ithaka
     
  5. PBeck

    PBeck Routinier

    Dabei seit:
    11.08.2005
    Beiträge:
    319
    Zustimmungen:
    0
    Ich glaube das man zuerst schauen sollte wie man die PDF in eine Textdatei bekommt. Auf die Textdatei kann man dann relativ einfach wieder mit Shellscript zugreifen und das wichtige Extrahieren.

    pdftotext übernimmt z. B. die Aufgabe ein PDF-Dokument in eine Textdatei umzuwandeln.

    MfG PBeck
     
  6. #5 Graf_Ithaka, 18.11.2006
    Graf_Ithaka

    Graf_Ithaka Routinier

    Dabei seit:
    29.01.2005
    Beiträge:
    487
    Zustimmungen:
    0
    Ort:
    Steiermark nahe Graz
    pdftotext bringt nicht viel, da die Supplierungen in einer Tabelle eingeschlossen sind und bei der Ausgabe in eine Textdatei dann nur als eine Zeile behandelt werden. Da mich aber nur die Supplierung in einer einzelnen Zeile betrifft waere das unpraktisch.

    MfG,
    Graf_Ithaka
     
  7. #6 madhatter, 19.11.2006
    madhatter

    madhatter Verrückter Hutmacher

    Dabei seit:
    19.03.2004
    Beiträge:
    61
    Zustimmungen:
    0
    Ort:
    Baden-Württemberg
    Du könntest dir mal das ReportLab-Kit für Python angucken, obwohl ich nicht weiß wie es da mit Einlesen aussieht.
     
  8. hengs

    hengs Tripel-As

    Dabei seit:
    21.02.2005
    Beiträge:
    217
    Zustimmungen:
    0
    Ort:
    Salzburg
    Mit

    Code:
    pdftotext -layout [pdf]
    bleibt zumindest die Tabelle erhalten
     
  9. Anzeige

    Vielleicht findest du HIER Antworten.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  10. #8 Graf_Ithaka, 19.11.2006
    Graf_Ithaka

    Graf_Ithaka Routinier

    Dabei seit:
    29.01.2005
    Beiträge:
    487
    Zustimmungen:
    0
    Ort:
    Steiermark nahe Graz
    Danke euch schon einmal für die Anregungen!

    Da ich momentan wenig Freizeit habe, werde ich das Problem wohl anfangs mit einem shellscript lösen (danke an hengs für den Tipp mit layout, jaja ich sollte mal die manpages durchlesen..) und wenn ich dann wieder einmal Zeit finde etwas komplexeres angehen.

    MfG,
    Graf_Ithaka
     
  11. #9 Kryptaesthesie, 20.11.2006
    Kryptaesthesie

    Kryptaesthesie Jungspund

    Dabei seit:
    02.02.2006
    Beiträge:
    23
    Zustimmungen:
    0
    Ort:
    NRW
    Hallo.
    bietet sich die PDFBox auch zum Schreiben an?
    Suche eine simple und schnelle Möglichkeit Text als PDF zu speichern.
    Oder habt ihr da andere Lösungsvorschläge?
    Wichtig wäre, ohne weitere Zusatzkosten...


    Danke schon mal.
    MfG Gerrit
     
Thema:

pdf auslesen und ausgeben

Die Seite wird geladen...

pdf auslesen und ausgeben - Ähnliche Themen

  1. Dateien auslesen und Daten systematisch angeordnet in Datei ausgeben

    Dateien auslesen und Daten systematisch angeordnet in Datei ausgeben: Guten Abend, ich hätte da mal eine Frage. Bin mir recht sicher, dass es in der Shell funktionieren sollte, aber kenne mich damit kaum aus....
  2. Datum aus .ics Datei auslesen und nächsten "Termin" ausgeben

    Datum aus .ics Datei auslesen und nächsten "Termin" ausgeben: Hallo. Zuersteinmal ein kurzes Danke für eure Arbeit und dieses tolle Forum. Ich habe natürlich die Suchfunktion genutzt und auch auf eigene...
  3. 2 Zeilen aus einer txt auslesen

    2 Zeilen aus einer txt auslesen: Hallo Leute, ich habe eine Datei die immer aus zwei zusammenhängenden Zeilen besteht, als Beispiel: DE0006231004 # 15,04 Infineon DE0005785604...
  4. Teil einer Variablen auslesen und in neue Variable schreiben

    Teil einer Variablen auslesen und in neue Variable schreiben: Hallo, ist für Euch bestimmt ganz einfach, aber trotz googlen komme ich nicht auf eine Lösung. In Variable x habe ich stehen: xy,ab Nun möchte...
  5. Datei auslesen und fund per MAil versenden.

    Datei auslesen und fund per MAil versenden.: Hallo folgendes Script habe ich zur Zeit in Arbeit. Und zwar führe ich über "at" ein kleines Script aus was in einem Logfile nach bestimmten...