Script zur Korrektur einer E-Book Datei

rubinski

rubinski

Grünschnabel
Hallo, wie der Titel schon sagt, suche ich ein Script (sed?) für eine E-Book Datei. In dieser kommen immer wieder "-" vor innerhalb von Worten, wo aber keine Trennung des Wortes gewünscht ist. Es liegt m.E. nach auch kein Problem mit den Einstellungen des Readers vor, da sei noch gesagt an der Stelle.

So sieht dann beispielsweise eine zu korrigierende Textstelle aus: der zukünf-tige US-Präsident und Oberbe-fehlshaber
Ich habe es mit sed versucht, habe aber leider keine funktionierende Lösung gefunden:

sed "s/-//g" >> der zukünftige USPräsident und Oberbefehlshaber
Ist nicht schlecht, berücksichtigt aber nicht die Stellen, an denen das "-" erhalten bleiben müßte

sed "s/[a-z]-[a-z]//g" >> der zukünige Uräsident und Oberbehlshaber
Auch so ist nicht das gewünschte Resultat herausgekommen, sondern es wird der jeweils um das "-" stehende Buchstabe ebenso entfernt.

Ich würde gerne jeweils drei Positionen links und rechts des "-" schauen, ob dort Zeichen aus der Gruppe [A-Za-z] stehen - falls ja, würde ich das "-" entfernen. Ich glaube damit habe ich die meisten Stellen im Text richtig/sinnvoll erfasst.
Ist das überhaupt mit sed zu bewerkstelligen? Ich nutze hier die Unix-Tools für Windows, könnte aber zur Not auch auf ein Linux-System zurückgreifen. Schönen Dank!
 

Ähnliche Themen

Mysql connect Problem

Samba als PDC [Short-HOWTO]

Zurück
Oben