ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern

Dieses Thema im Forum "Ruby, php, Perl, Python ..." wurde erstellt von Perl-Anfänger, 15.07.2014.

  1. #1 Perl-Anfänger, 15.07.2014
    Perl-Anfänger

    Perl-Anfänger Grünschnabel

    Dabei seit:
    15.07.2014
    Beiträge:
    1
    Zustimmungen:
    0
    Hallo Leute,

    heute brauche ich mal einen dringenden Rat von Euch.

    Ich habe hier etwas mehr als 1200 PDF-Dateien (Text), die jeweils ein Anschreiben mit verschiedenen Adressen und Kundennummern bzw. Vertragsnummern beinhaltet.
    Leider müssen wir unser System wechseln und dazu muss ich nun die Adressen, die im Empfängerfeld stehen, auslesen und vorzugsweise für Excel aufbereiten.

    Da ich so gut wie keine Erfahrung in Perol oder sonstwas habe, aber weiss, dass es damit geht, wende ich mich an Euch.

    Nun zur aktuellen IST-Situation:

    Habe in einem Verzeichnis unter Windows etwa 1200 PDF-Files, benannt nach diesem Muster: <Name, Vorname.pdf>, alles ausgedruckte Kundenstammdaten aus unserem CMS-System in je eine PDF.
    Mit ein wenig Tüfteln ist es mir gelungen, per Batch-Datei (in einem Sicherungskopie-Ordner) alle Files mit Hilfe von pdftotxt.exe so umzubenennen, dass die Adressen alle in zweiter Zeile stehen.
    Genau diese gilt es nun, auszulesen und vorzugsweise in eine Semikolon-separierte CSV-Datei zu schreiben, damit ich sie für einen Serienbrief in eine Excel-Datei bekomme.

    Weiter habe ich ergoogelt, dass ich mit z.B.:

    Code:
    #!/usr/bin/env perl
    use CGI::Carp "fatalsToBrowser";
    use strict;
    
    print "Content-type: text/html\n\n";
    print "<HTML><HEAD><TITLE>Test</TITLE></HEAD><BODY>\n";
    print "<h1>Hello!</h1>\n";
    
    # Read a text file #
    open (TXTFILE, "01.txt") or die "Err $!\n";;
    while (<TXTFILE>){
    if ($. == 2) {
    print "Zeile 2: $_\n<br>";
    last;
    }
    }
    print "</BODY></HTML>\n";
    
    genau meine gewünschte Zeile auslesen kann und zumindest auf dem Bildschirm richtig ausgeben kann.
    Ich möchte sie aber in einer importierbaren csv-Datei haben.

    Wie schriebe ich die Datei und wie sorge ich dafür, dass das Scribt alle Dateien ausliest und jeweils immer die zweite Zeile hinzufügt?

    Vielen Dank für Eure Hilfe!!!

    (oder gehts noch ganz anders, ohne viel Heckmeck???)

    Lg

    Christian
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 fresh$free, 23.09.2014
    fresh$free

    fresh$free Jungspund

    Dabei seit:
    03.10.2013
    Beiträge:
    22
    Zustimmungen:
    0
    Ist dein Problem noch aktuell?
     
  4. marce

    marce Kaiser

    Dabei seit:
    01.08.2007
    Beiträge:
    1.053
    Zustimmungen:
    8
    Direkt aus der DB des CMS auslesen?

    Ansonsten - scriptest Du unter *nix oder unter Windows? Je nach dem lässt sich das eine oder andere auch leichter erreichen...
     
  5. #4 fresh$free, 23.09.2014
    Zuletzt bearbeitet: 24.09.2014
    fresh$free

    fresh$free Jungspund

    Dabei seit:
    03.10.2013
    Beiträge:
    22
    Zustimmungen:
    0
    Er hat ja schon die entspr. Zeilen. Er hat nur noch Probleme dateiweise alle seine extrahierten PDFs auszulesen und in eine csv zu schreiben, das ist ja dann nur noch trivial.
    Wollte nur fragen ob er es schon selber hinbekommen hat, wenn nicht soll er mal eine Testdatei mit dem jeweiligen Datensatz posten, dann kann man einen vernünftige Antwort geben, bei ihm fehlt es ja an minimalen Perlkenntnissen, da helfen Tipps nicht viel sondern nur die komplette Lösung die ich ihm kurz zusammenschreibe.
     
  6. Anzeige

    Vielleicht findest du HIER Antworten.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
Thema: ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern
Besucher kamen mit folgenden Suchen
  1. pdfs daten auslesen in csv

Die Seite wird geladen...

ca. 1200 PDF-Dateien auslesen und bestimmte Daten in eine CSV-Datei speichern - Ähnliche Themen

  1. Mayhem: 1200 Abstürze in Debian »Wheezy«

    Mayhem: 1200 Abstürze in Debian »Wheezy«: Forscher der Carnegie Mellon Universität haben mittels einer Testsuite über 1200 Abstürze von Anwendungen in Debian entdeckt. Eine Liste der...
  2. Red Hat Security Advisory 2012-1200-01

    Red Hat Security Advisory 2012-1200-01: Red Hat Security Advisory 2012-1200-01 - The rhev-hypervisor6 package provides a Red Hat Enterprise Virtualization Hypervisor ISO disk image. The...
  3. Mustek 1200 CU Plus + Kernel 2.6.35.7 = Error during device I/O

    Mustek 1200 CU Plus + Kernel 2.6.35.7 = Error during device I/O: Hallo zusammen, ich habe hier einen alten Mustek 1200 CU Plus Scanner herumfliegen, den ein Arbeitskollege von mir wegwerfen wollte. Wenn...
  4. CPU Frequenz max 1200 MHZ seit kernel 2.6.24

    CPU Frequenz max 1200 MHZ seit kernel 2.6.24: Seit dem ich den Kernel 2.6.24 benutze, der mit dem Gentoo update vor kurzem kam, wird meine CPU maximal auf 1200 MHZ getaktet obwohl sie 2400...
  5. Pro-Linux: Smartphone Motorola A1200

    Pro-Linux: Smartphone Motorola A1200: Pro-Linux stellt Ihnen heute einen Erfahrungsbericht zum Smartphone Motorola A1200 vor. Weiterlesen...