Variablen aus Textdatei extrahieren

S

seppl2

Grünschnabel
Hallo,

ich möchte gerne aus einer Zeile zwei Variablen extrahieren habe aber keine Ahnung wie.
Hier mal der Input:
Code:
<tr><td><small>http://www.google.com/images/nav_logo3.png</small></td><td>5149 KB</td><td>Upload finished.</td><td align="center"><input type="checkbox" name="killjob-9076"></td></tr>
Als output bräuchte ich: "killjob-9076" und "nav_logo3.png"

Mit sed wird es meines Wissens nach nicht klappen da man dank der sich ändernden URL und Größe nicht einfach durch NULL ersetzen kann.

Hat jemand vielleicht eine Idee für mich wie ich das anstellen kann?

Vielen Dank im Voraus.

Benny
 
Die URL koenntest Du zum Beispiel so extrahieren:
Code:
#> basename $(sed -e "s?\(.*\)\(http://\)\([^<]*\)\(.*\)?\3?g" test.text )
nav_logo3.png
Ob das immer klappt, ist natuerlich davon abhaengig, wie stark die Adresse variiert, und ob sie ein '<' enthalten kann oder nicht.
 
SUPER, Vielen Dank rikola!
Ich versteh zwar noch nicht alles vom sed statement aber das bekomme ich schon noch gebacken.

< > und alle anderen Sonderzeichen werden in URLs codiert.
"<" ist z.B. "%3C"

Benny
 

Ähnliche Themen

Onlineumfrage programmieren (mehrseitige HTML Formular an PHP übergeben)

Squid nur zum maskieren der eigenen IP, nicht für Webserver auf port 80

Zurück
Oben