Unbekannt Zeichen in einer Datei finden

Dieses Thema im Forum "Shell-Skripte" wurde erstellt von tüftler, 09.10.2008.

  1. #1 tüftler, 09.10.2008
    tüftler

    tüftler Grünschnabel

    Dabei seit:
    09.10.2008
    Beiträge:
    2
    Zustimmungen:
    0
    Brauche Eure Hilfe!!!!

    Bekomme täglich Interface mit Dateien in denen des öfteren Zeichen vorhanden sind die mein Programm nicht versteht und dadurch auch der insert abgelehnt wird. Dann fängt immer die Sucherei in der Datei nach diesen Zeichen (z.B. Ø) an.

    Kennt von Euch vielleicht einer einen Befehl in Unix mit denen ich solche Zeichen schnell finden kann, bzw. mir unbekannte Zeichen außerhalb des deutschen Zeichensatz anzeigt.

    Bin für jede Hilfe sehr Dankbar!!!!!
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 slackfan, 09.10.2008
    slackfan

    slackfan König

    Dabei seit:
    18.04.2006
    Beiträge:
    809
    Zustimmungen:
    0
    Ort:
    Bonn
    Hallo,

    vielleicht bringt dich ein
    Code:
    sed -e 's/[^[:alnum:]]/_/g' dateirein.txt > dateiraus.txt
    weiter. Du sagst ja nicht, welche Zeichen dein Programm lesen kann und welche nicht.

    cu

    P.S. Und bitte schrei nicht so: Da wird man ja taub.
     
  4. Psyjo

    Psyjo Routinier

    Dabei seit:
    15.11.2005
    Beiträge:
    259
    Zustimmungen:
    0
    Ort:
    Hinter'm Berg
    Ich habe kürzlich sowas gebaut, da Portage sowas nicht anbietet. Evtl. hilft es dir ja weiter.
    Die 2 angehängten Files bilden fixname.
    Fixname kannst du dann so aufrufen:
    Code:
     echo "text mit Ø" | ./fixname 3 0 
    das soll so viel heißen wie 'Repariere den Text mit level 3 und entferne die Leerzeichen nicht'.
     

    Anhänge:

  5. #4 Gott_in_schwarz, 09.10.2008
    Zuletzt bearbeitet: 09.10.2008
    Gott_in_schwarz

    Gott_in_schwarz ar0

    Dabei seit:
    22.04.2007
    Beiträge:
    546
    Zustimmungen:
    0
    Ort:
    Niedersachsen
    Code:
    echo -e 'Ø\nfoo\nbär\nhühü\nAHAHAHAHA\nzomgness\nµ\nhihi\n'|
    perl -ne 'BEGIN {$ascii.=chr for 0..127; $NOASCII=qr/[^$ascii]/} print if /$NOASCII/'
    Zeigt alle Zeilen vom Input an, in denen mindestens ein nicht-ascii Zeichen vorkommt. (Kann auch als Datei direkt an perl gegeben werden, kein cat nötig...)
    Für spezifisch deutschen Zeichensatz kannst das ja selber erweitern (dann vielleicht als richtiges Skript, weil cli doch etwas eng ist) oder auch nicht.

    edit:
    so kann ich die Variable $ascii natürlich nicht einfach in die RE reinklatschen, ich dachte dank qr// würd das gehen, aber fällt aus wegen is nicht.
    Hier mal eine "funzende" Version:
    Code:
    echo -e '\\\n/\n|\n-\nfoo\nµzig'|
    perl -ne 'BEGIN {$ascii.=chr for 0..127;} print if /[^\Q$ascii\E]/'
     
  6. #5 tüftler, 09.10.2008
    tüftler

    tüftler Grünschnabel

    Dabei seit:
    09.10.2008
    Beiträge:
    2
    Zustimmungen:
    0
    Erst mal ein großen DANK an alle!!!!

    Wenn es nur um das eine Zeichen ( Ø) gehen würde hätte ich auch kein Problem. Leider ist es nicht so, sondern es kommen auch allerlei russischer Zeichen vor die ich vorher nicht kenne. Folglich müsste es ein Befehl geben der mir sagt, zeige mir alle Zeilen in dem kein asci von 0-127 vorkommt. Die müsste ich dann manuell ersetzten oder noch besser diese werden ersetzt durch einen Punkt.
    Da die Dateien sehr groß (bis 100.000 Zeilen) sind, könnt Ihr euch wohl vorstellen was das für ein Aufwand ist den Fehler manuell zu suchen.
     
Thema:

Unbekannt Zeichen in einer Datei finden

Die Seite wird geladen...

Unbekannt Zeichen in einer Datei finden - Ähnliche Themen

  1. Unbekanntes Netzwerkproblem [kernel?]

    Unbekanntes Netzwerkproblem [kernel?]: Moin, ich hab ein stranges Problem mit meiner Netzwerkkarte. Leider hab ich keine Idee woran es liegt. Das ganze ist nicht wirklich...
  2. CUPS - Treiber für Windows Klienten in Petto - zuordnung unbekannt?

    CUPS - Treiber für Windows Klienten in Petto - zuordnung unbekannt?: [GELÖST] CUPS - Treiber für Windows Klienten in Petto - zuordnung unbekannt? Hallo Gemeinde, ich mache es möglichst kurz : -> CUPS läuft,...
  3. [Python]Funktionsaufruf übergibt unbekannten Parameter

    [Python]Funktionsaufruf übergibt unbekannten Parameter: Hi, ich möchte eine Funktion der selben Klasse aufrufen und dabei Werte als Parameter übergeben, also self.<Funktionsname>(Parm1, ..., ParmN)...
  4. Sed od. Awk - Ersetzen unbekannter parameter

    Sed od. Awk - Ersetzen unbekannter parameter: Hallo liebes Forum, tja mein erster Post gleich ne Frage. Sorry. Ich habe ein Textfile indem sich verschiedene Strings befinden. Diese...
  5. unbekannter mount fehler beim cdrom laufwerk

    unbekannter mount fehler beim cdrom laufwerk: Das hatte ich auch noch nie mount /dev/cdrom /mnt/cdrom/ mount: block device /dev/hdc is write-protected, mounting read-only mount: /dev/hdc:...