text aus quellcode auslesen mit sed

S

SR166

Grünschnabel
Hallo,

wollte mir gern ein kleines Script basteln womit ich bestimmte Call by Call Vorwahlen aus einem Quellcode rausfiltern kann
Beispiel:
Code:
<a href='http://www.01072.eu' target='_blank'><font size=1 face='verdana'>01072 Telecom</font></a><br><font size=1 face='verdana'>Netzvorwahl:<b>[COLOR="Red"]01072[/COLOR],<br><font color=red>Tarif gilt nicht für alle Handy-Netze</font></b></font><br>
aus diesel Quellcode bräuchte ich die Nummer 01072.
Wie kann ich das mit grep und sed machen?
Mit folgendem Befehl bekomme ich es hin, wenn die Nummer fünfstellig ist und praktisch das Komma nicht vorhanden ist:
Code:
VORWAHL=`grep 'Netzvorwahl\:<b\.*' $TMPFILE | sed -e s/^.*\:b\//g -e s/\<'\/'b\>.*//g -e s/^.*\>//g`
Wie kreig ich aber die vierstellige Nummer und das Komma entfernt???(

Vielen Dank.
 
So auf die schnelle:
Code:
grep -Eo 'Netzvorwahl\:<b>[[:digit:]]*' file | grep -Eo '[[:digit:]]{4,5}'
(Falls die Nummern nur 4 oder 5 stellig sind)
 
so auf die schnelle???:respekt:
läuft auf Anhieb.... ich werd weich...da hab ich schon zig stunden dran verbracht...

Vielen Dank
 

Ähnliche Themen

Links aus HTML- Datei extrahieren

Zeilen filtern

Onlineumfrage programmieren (mehrseitige HTML Formular an PHP übergeben)

probleme bei emergen von x11-libs/libview

Problem beim emergen (xml parser)

Zurück
Oben