hehejo
blöder Purist
Hallo, ich hab ein kleines Programm geschrieben, welches aus einer Datei alle Wörter rauszieht und mitzählt wie oft ein Wort vorkommt.
Dazu nehme ich mit RegExp die Satzzeichen weg usw..
Aber so ganz will es nicht klappen..
Einige Worte werden nicht aufgenommen, aber gezählt.
Das Programm und eine Testdatei hab ich angehängt. Hier findet er z.B. das Wort toll nicht, obwohl es mitgezählt wird.
Dazu nehme ich mit RegExp die Satzzeichen weg usw..
Aber so ganz will es nicht klappen..
Einige Worte werden nicht aufgenommen, aber gezählt.
Das Programm und eine Testdatei hab ich angehängt. Hier findet er z.B. das Wort toll nicht, obwohl es mitgezählt wird.
Code:
Geben Sie eine Datei mit Text an: test.txt
Geben Sie eine Ausgabedatei an: out.txt
Bitte warten!
ANALYSEERGEBNIS
Wort Anzahl Prozent
-----------------------------------------------------------
gg 1 16.66 %
hallo 1 16.66 %
Insgesamt 6 Woerter[/quote]
Bestimmt ist es nur ein kleiner Fehler... *hoff*
Wie gehe ich vor:
Datei einlesen
Einzelne Zeilen mit RegExp bearbeiten
Zeile in Wörter aufsplitten
Ist Wort schon im Hash?
ja: Dann Counter hochzählen
nein: Einfügen und Counter auf 1 setzen
Ausgabe
Vll. kann mir ja jemand helfen.
//ADMIN EDIT
Sorry, war schneller mit dem löschen :)