HTML Dateien auf tote Links untersuchen

Dieses Thema im Forum "Shell-Skripte" wurde erstellt von nighT, 22.06.2009.

  1. nighT

    nighT Guest

    Hallo,
    ich habe hier sehr viele HTML Dateien, die teilweise Tote Links beinhalten.
    Nun will ich per Bash Script diese Dateien öffnen, auf tote Links untersuchen und falls vorhanden ausgeben.
    Ich dachte mir folgendes:
    - Datei öffnen
    - Auf "<a ..." und "<img ...>" untersuchen
    - Die einzelnen Links kürzen ( Aus <a href="index.php">Index </a> wird index.php )
    - Überprüfen ob die jeweiligen Dateien vorhanden sind
    - Die einzelnen kaputten Links passend zu den HTML Files ausgeben
    - Das ganze per while-Schleife solange laufen lassen, bis alle Files durch sind

    Ich bin nur nicht sehr begabt in Bash und habe darum kein Anhaltspunkt, wie ich anfangen soll.
    Ich hoffe ihr könnt mir da einen Anstoß geben

    mfg nighT
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 HeadCrash, 22.06.2009
    HeadCrash

    HeadCrash Routinier

    Dabei seit:
    16.05.2009
    Beiträge:
    482
    Zustimmungen:
    1
    Ort:
    Bayern
    Abend,

    falls die html-Dateien über einen Webserver erreichbar sind, hilft dir evtl wget mit der Option --spider weiter.

    mfg
    HeadCrash
     
Thema:

HTML Dateien auf tote Links untersuchen

Die Seite wird geladen...

HTML Dateien auf tote Links untersuchen - Ähnliche Themen

  1. Bestimmte Links aus HTML Dateien extrahieren

    Bestimmte Links aus HTML Dateien extrahieren: Moin Wir (mein Programmier-Partner und ich) sollen ein Skript schreiben, welches Links aus einer lokalen HTML Datei extrahiert,filtert und...
  2. de.vu-Domainname in HTML-Dateien beibehalten

    de.vu-Domainname in HTML-Dateien beibehalten: Hi, kennt jemand eine Lösung für folgendes Problem ? ... - Domain blabla.de.vu wird auf someone.dyndns.org:8001 umgeleitet (Prot. HTTP)....
  3. Erzeugen eines HTML-File zur Verwaltung einer Liste von Bild-Dateien

    Erzeugen eines HTML-File zur Verwaltung einer Liste von Bild-Dateien: Hallo Ich bin ein Linux Jünger und wir haben gerade als Einstieg angefangen mit Shellscripten. Dabei soll ein HTML-File zur Verwaltung einer...
  4. html seite runterladen und die Inhalte als .txt-Date speichern

    html seite runterladen und die Inhalte als .txt-Date speichern: Hallo! Ich bin noch neu auf dem Gebiet, von daher denke ich sind meine Fragen für manche von euch recht simpel. Mit den Standardbefehlen habe ich...
  5. HTML5 jetzt offizieller Standard

    HTML5 jetzt offizieller Standard: Die HTML5-Arbeitsgruppe beim W3C hat HTML5 jetzt zur »Empfehlung« erhoben, womit die neue Generation der Auszeichnungssprache nun offiziell...