Wortvergleich zwischen zwei Textdateien

Dieses Thema im Forum "Shell-Skripte" wurde erstellt von garga, 14.02.2006.

  1. garga

    garga Guest

    Hallo zusammen

    Hmm, leider hab ich wieder ein kleines Problem: Ich besitze zwei Textdateien. In diesen sind unterschiedliche Wörter, jeweils eine Kolonne. Jetzt möchte ich die erste Datei mit der zweiten vergleichen. Wieviele Wörter der ersten Datei kommen in der zweiten vor?

    grep -c dateieins.txt dateizwei.txt

    Was mach ich falsch?

    Vielen Dank,
    Marc
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 tuxlover, 14.02.2006
    Zuletzt bearbeitet: 14.02.2006
    tuxlover

    tuxlover Der den Tux knuddelt

    Dabei seit:
    26.10.2005
    Beiträge:
    2.106
    Zustimmungen:
    0
    Ort:
    berlin
    hmm sieht nach ner hausaufgabe aus.

    versuchs mal mit

    grep -c datei1txt; grep -c datei2txt

    was liefert das für eine ausgabe danach musst du mal überlegen.

    gruß tuxlover
     
  4. rikola

    rikola Foren Gott

    Dabei seit:
    23.08.2005
    Beiträge:
    2.133
    Zustimmungen:
    0
    Dies sucht nach dem string 'dateieins.txt' in dateizwei.txt. Richtiger waere:
    Code:
    for i in `cat dateieins.txt` ; do grep -c $i dateizwei.txt ; done
    
    Das gibt Dir fuer jedes Wort in dateieins.txt die Anzahl (einschl. 0) der Vorkommnisse in dateizwei.txt an. Wenn Du die anzahl der vorkommenden Woerter zaehlen willst, gibt Du das ganze an awk weiter:
    Code:
    for i in `cat dateieins.txt` ; do grep -c $i dateizwei.txt ; done | awk '{ if ($1> 0) ++count } END{ print count}'
    
    @tuxlover:
    Hast Du Dein Beispiel ausprobiert? Das wartet doch nur zweimal auf Eingaben von der Standardeingabe.
     
  5. #4 tuxlover, 14.02.2006
    tuxlover

    tuxlover Der den Tux knuddelt

    Dabei seit:
    26.10.2005
    Beiträge:
    2.106
    Zustimmungen:
    0
    Ort:
    berlin
    ja das weiß ich. ich hatte gedacht dass man irgendwie mit pipes oder eingabe- und ausgabeumlenkungen arbeiten kann. deshalb ja auch danach musst du mal weiter sehen.

    offensichtlich habe ich mich geirrt.
    sorry
     
  6. heady

    heady Routinier

    Dabei seit:
    13.12.2005
    Beiträge:
    424
    Zustimmungen:
    0
    Ort:
    im Herzen Europas
    vielleicht hilft dir der befehl diff...der listet den unterschied zweier dateien auf...
     
  7. #6 Wolfgang, 14.02.2006
    Wolfgang

    Wolfgang Foren Gott

    Dabei seit:
    24.04.2005
    Beiträge:
    3.978
    Zustimmungen:
    0
    Ort:
    Erfurt
    Hallo

    Was meinst du mit Kolonne?
    Wenn du pro Zeile ein Wort hast, geht es relativ einfach:
    grep -f datei1 datei2|wc -l

    Gib mal ein paar Beispielzeilen der Daten.
    Gegebenenfalls, lassen sich durch ein festes Trennzeichen getrennte Wörter in einer Zeile mittels tr durch \n ersetzen und dies als Eingabe für grep (mis)brauchen. dann muss natürlich datei1 noch mittels sort|uniq normalisiert werden.
    ;)

    Das nur so als Denkanstoß zum Selberbasteln.

    Gruß Wolfgang
     
  8. Anzeige

    Vielleicht findest du HIER Antworten.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
Thema:

Wortvergleich zwischen zwei Textdateien

Die Seite wird geladen...

Wortvergleich zwischen zwei Textdateien - Ähnliche Themen

  1. Rechtsstreit zwischen SCO und IBM doch nicht beendet

    Rechtsstreit zwischen SCO und IBM doch nicht beendet: SCO hat ein Bundesgericht in Utah darüber informiert, dass das Unternehmen eine Berufung im Verfahren gegen IBM wegen einer vermeintlichen...
  2. Rechtsstreit zwischen SCO und IBM nach 13 Jahren wohl endgültig beendet

    Rechtsstreit zwischen SCO und IBM nach 13 Jahren wohl endgültig beendet: Nachdem das Gericht im Februar in allen wesentlichen Punkten gegen SCO entschieden hat, haben die Anwälte beider Unternehmen gemeinsam den Antrag...
  3. Rechtsstreit zwischen SCO und IBM soll fortgesetzt werden

    Rechtsstreit zwischen SCO und IBM soll fortgesetzt werden: Der im Jahr 2003 begonnene Rechtsstreit zwischen SCO und IBM war vermeintlich bereits beendet. Nach mehrjähriger Pause scheint SCO jetzt aber auf...
  4. Artikel: Datenaustausch zwischen Linux und Android

    Artikel: Datenaustausch zwischen Linux und Android: Auf das Smartphone will man unter anderem Audiodateien oder Videos kopieren, während man beispielsweise Fotos auf dem Linux-PC sichern möchte. Wie...
  5. Zusammenarbeit zwischen GCC und LLVM

    Zusammenarbeit zwischen GCC und LLVM: Auf der GCC-Entwicklerkonferenz »Cauldron« wurden im Juli Möglichkeiten der Zusammenarbeit zwischen GCC und LLVM erörtert. Trotz zahlreicher...