PDF-Files durchsuchen

F

flugopa

Hallo,

nachdem ich nun weiss, wie man für den Hausgebrauch Daten wiederherstellen kann, würde ich gern meine pdf/txt/htm-Sammlung in die Datenbank legen.
(Hintergrundinfo: nicht alle Daten sind lokal bzw. immer verfügbar)

Erstes Hindernis: Su. Skript oder Teile eines Programm-Code(vorzugsweise bash, perl, java, oder c) mit dem ich normale PDF scannen kann.

Ich denke, daß die Konvertierung pdf->txt nicht sehr effektiv sein dürfte.
 
Apache Lucene

Mit Hilfe von Apache Lucene kannst du PDF-Dateien auch indexieren.

Google ist dein Freund
 

Ähnliche Themen

Server-Monitoring mit RRDTool

Zurück
Oben