HTML Dateien auf tote Links untersuchen

N

nighT

Hallo,
ich habe hier sehr viele HTML Dateien, die teilweise Tote Links beinhalten.
Nun will ich per Bash Script diese Dateien öffnen, auf tote Links untersuchen und falls vorhanden ausgeben.
Ich dachte mir folgendes:
- Datei öffnen
- Auf "<a ..." und "<img ...>" untersuchen
- Die einzelnen Links kürzen ( Aus <a href="index.php">Index </a> wird index.php )
- Überprüfen ob die jeweiligen Dateien vorhanden sind
- Die einzelnen kaputten Links passend zu den HTML Files ausgeben
- Das ganze per while-Schleife solange laufen lassen, bis alle Files durch sind

Ich bin nur nicht sehr begabt in Bash und habe darum kein Anhaltspunkt, wie ich anfangen soll.
Ich hoffe ihr könnt mir da einen Anstoß geben

mfg nighT
 
Abend,

falls die html-Dateien über einen Webserver erreichbar sind, hilft dir evtl wget mit der Option --spider weiter.

mfg
HeadCrash
 

Ähnliche Themen

Links aus HTML- Datei extrahieren

Habe da ein Problem was nicht wegbekomme

Onlineumfrage programmieren (mehrseitige HTML Formular an PHP übergeben)

[HowTo] TeamSpeak 2 - RC2 - Server (Deutsch/Englisch)

Zurück
Oben