Fileconverter für die Shell

Diskutiere Fileconverter für die Shell im Anwendungen Forum im Bereich Linux/Unix Allgemein; Hallo Stehe im Moment vor einem kleinen Problem. Habe hier eine CD bekommen, auf der einige 100MB Documente liegen. Diese sollen nun nach...

  1. #1 Wolfgang, 08.09.2005
    Wolfgang

    Wolfgang Foren Gott

    Dabei seit:
    24.04.2005
    Beiträge:
    3.978
    Zustimmungen:
    0
    Ort:
    Erfurt
    Hallo
    Stehe im Moment vor einem kleinen Problem.
    Habe hier eine CD bekommen, auf der einige 100MB Documente liegen.
    Diese sollen nun nach diversen Inhalten geparst werden.
    Soweit kein Problem, dafür erstelle ich ein Script.
    Nun ist aber ein Fehler passiert, sprich die Dateien haben das falsche
    M$SCHROTT Format, wo ich ASCII erwartet habe.
    :D
    Und zwar die ganze mistige Palette durch M$WORD, M$EXCEL...
    Vermutlich mit bunten Bildchen und ohne..
    :D
    Die komischen Präsentationsdateien interessieren mich nicht, und aus den anderen nur der Text.


    Was ich nun suche ist eine scriptfähiges Werkzeug für die Shell,
    welches den M$ Formatierungsmüll entsorgt und Klartext übriglässt/ausgibt,
    - möglichst auf STDOUT - und mit M$excel als auch M$word klarkommt.

    Wenn es zwei verschiedene sind ist es auch gut.
    catdoc unt antiword scheinen nicht klarzukommen, bzw sind zu fehleranfällig.

    Scheinbar handelt es sich um verschiedene Documentversionsformate. :think:
    Mit dem Hexeditor habe ich mir einige betrachtet, aber eindeutige Kennung ist
    für mich nicht erkennbar.
    Also habe ich catdoc mal mit der Option -b versucht, was in einigen Fällen wenigstens ein wenig - jedoch zu wenig - liefert.

    OpenOffice ist hier nicht verfügbar, und auch keine Lösung.
    Für diesen Einzelfall würde ich das auch nicht installieren wollen.

    Jemand eine Idee?
    Ach ja,
    GNU/LINUX Debian Sarge stable

    Danke
    Gruß Wolfgang
    <der M$ gerade mal wieder zum ko.. findet>
     
  2. Anzeige

    Anzeige

    Wenn du mehr über Linux erfahren möchtest, dann solltest du dir mal folgende Shellkommandos anschauen.


    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. khs

    khs Routinier

    Dabei seit:
    19.08.2004
    Beiträge:
    408
    Zustimmungen:
    0
    Ueberraschenderweise kommt man mit
    Code:
    strings <dokument.doc>
    
    erstaunlich weit. Weiss allerdings nicht, ob dessen output fuer deine Zwecke ausreicht.

    -khs
     
  4. #3 Wolfgang, 08.09.2005
    Wolfgang

    Wolfgang Foren Gott

    Dabei seit:
    24.04.2005
    Beiträge:
    3.978
    Zustimmungen:
    0
    Ort:
    Erfurt
    Hallo
    Mit strings habe ich es zuerst versucht, was hier natürlich nur Müll liefert.
    Das liegt schon daran, das man im Hause M$ sowohl binäre Formatierer nutzt, als auch solche im textformat.
    In mögliche Bildchen eingefügte Versionen usw.
    Alls das will man natürlich nicht wirklich.
    Damit habe ich aber die verschieden vorkommenden Documentversionen herausbekommen. Natürlich alles vertreten, war ja logisch. 97,Version 8 9..10.
    :-(
    :think:

    Was ich brauche, ist der reine Text des Dokumentes, der durch meine Regexp geschoben werden soll.

    Mach mich dann mal auf die Suche nach CPAN :D

    Der ganze Kompatibilitätswahnsinn der verschiedenen Versionen bei M$ macht das alles andere als trivial.
    seufz

    Gruß Wolfgang
     
  5. caba_

    caba_ (caba{_,}|manuw)

    Dabei seit:
    07.08.2007
    Beiträge:
    334
    Zustimmungen:
    0
    Das Thema ist zwar alt und vermutlich auch gelöst aber damit die SuFu was findet:
    Für Word-Dateien ist wv zu empfehlen:
    Code:
    cat /usr/ports/converters/wv/pkg/DESCR
    Für Excel:
    Code:
    cat /usr/ports/converters/xlhtml/pkg/DESCR
    Es gibt auch wv2, ein rewrite von wv, das soll auch Excel können. Kenne es aber nicht.

    xlhtml benutze ich für emails wenn mir wieder irgend ein hein-doof Excel-tabellen sendet.


    Also, wollt den thread nicht blöd sterben lassen.
     
Thema:

Fileconverter für die Shell

Die Seite wird geladen...

Fileconverter für die Shell - Ähnliche Themen

  1. Qt: LTS nur noch für zahlende Kunden

    Qt: LTS nur noch für zahlende Kunden: Das zum finnischen Softwareunternehmen Digia gehörende Anwendungs-Framework Qt erfährt 2020 einige wichtige Änderungen. Unter anderem werden...
  2. Genode stellt Ziele für 2020 vor

    Genode stellt Ziele für 2020 vor: Das freie Betriebssystem-Framework Genode plant im Jahr 2020 vier weitere Veröffentlichungen im Abstand von jeweils drei Monaten. Zahlreiche...
  3. Firefox-Preview-Beta für Android in Nightly-Version verfügbar

    Firefox-Preview-Beta für Android in Nightly-Version verfügbar: Die Beta-Version des neuen Mozilla-Browsers Firefox Preview für Android ist ab dem 21. Januar in der Nightly-Version von Firefox für Android...
  4. Support für Ubuntu 19.04 endet nächste Woche

    Support für Ubuntu 19.04 endet nächste Woche: Nutzer von Ubuntu 19.04 sollten spätestens in zwei Wochen über eine Migration ihrer Systeme nachdenken. Wie das Ubuntu-Projekt bekannt gab, endet...
  5. Support für Ubuntu 19.04 endet nächste Woche

    Support für Ubuntu 19.04 endet nächste Woche: Nutzer von Ubuntu 19.04 sollten spätestens in zwei Wochen über eine Migration ihrer Systeme nachdenken. Wie das Ubuntu-Projekt bekannt gab, endet...
  1. Diese Seite verwendet Cookies um Inhalte zu personalisieren. Außerdem werden auch Cookies von Diensten Dritter gesetzt. Mit dem weiteren Aufenthalt akzeptierst du diesen Einsatz von Cookies.
    Information ausblenden