wget holt nicht alle Bilder mit

Dieses Thema im Forum "Shell-Skripte" wurde erstellt von StDoe, 02.02.2008.

  1. StDoe

    StDoe Lebenskünstler

    Dabei seit:
    31.03.2006
    Beiträge:
    78
    Zustimmungen:
    0
    Hallo,

    ich will eine Website mit wget holen. Dabei werden nicht alle Bilder mit geholt.

    1. Versuch:
    Code:
    wget -r -k http://www.foo.bar.de
    2. Versuch:
    Code:
    wget -r -l 8 -p -k http://www.foo.bar.de
    Dabei sollte doch -p alle Sites so holen, daß sie komlett darstellbar sind - und -l8 ist seeehr hoch gegriffen.

    Die meisten fehlenden Bilder werden auf der Original-Site als Standart in einem neuen Fenster geöffnet - könnte das eine Ursache sein?

    ---

    GNU Wget 1.10.2
    unter GNU bash, version 3.1.17(2)-release (i586-mandriva-linux-gnu)
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 Gott_in_schwarz, 02.02.2008
    Gott_in_schwarz

    Gott_in_schwarz ar0

    Dabei seit:
    22.04.2007
    Beiträge:
    546
    Zustimmungen:
    0
    Ort:
    Niedersachsen
    Naja, werden sie denn überhaupt auf der Seite angezeigt, oder muss man nur auf irgendwelche unterstrichenen Textzeilen (sowas wie: Screenshots) klicken und es öffnet sich ein neues Fenster?

    Hört sich nämlich nach javascript an. Kannst ja mal in die Statusleiste deines Browsers gucken, da wird das zum Beispiel bei firefox angezeigt. (Statusleiste == links unten) Falls es javascript sein sollte glaube ich nicht, dass wget das kann. (<- Alles nur semigefährliches Halbwissen, warte lieber auf kompetente Antworten.)
     
  4. #3 StDoe, 02.02.2008
    Zuletzt bearbeitet: 02.02.2008
    StDoe

    StDoe Lebenskünstler

    Dabei seit:
    31.03.2006
    Beiträge:
    78
    Zustimmungen:
    0
    Wenn ich den Mauszeiger auf das Bild stelle steht in der Statusleiste:
    Code:
    http://www.foo.bar.de/pics/foo-bar.jpg

    EDIT:

    Dabei wird dann dieses Bild und die Vergrößerung dieses Bildes (die ich nach Klicken auf dieses Bild im neuen Fenster erhalte) nicht mit runter geladen.
     
  5. #4 Wolfgang, 02.02.2008
    Wolfgang

    Wolfgang Foren Gott

    Dabei seit:
    24.04.2005
    Beiträge:
    3.978
    Zustimmungen:
    0
    Ort:
    Erfurt
    Hallo
    Sieh dir den Quelltext von solchen Links an.
    Javascript generierte Links kann man auch in der Statusleiste anzeigen.
    Das ist also kein Kriterium.
    wget interpretiert keinerlei clientseitige Scriptsprache!

    Gruß Wolfgang
     
  6. #5 tuxlover, 02.02.2008
    tuxlover

    tuxlover Der den Tux knuddelt

    Dabei seit:
    26.10.2005
    Beiträge:
    2.106
    Zustimmungen:
    0
    Ort:
    berlin
    falls die website durchnummerierte bilder verwendet könntest du noch folgendes machen:

    Code:
    i=0; while true; do ((i+=1)); wget http://www.foo.bar.de/pics/foo-bar$i.jpg; done 
    du musst halt nur mal gucken, wann er fertig ist und den prozess eventuell manuell abbrechen.

    gruß tuxlover
     
  7. StDoe

    StDoe Lebenskünstler

    Dabei seit:
    31.03.2006
    Beiträge:
    78
    Zustimmungen:
    0
    Vielen Dank für Eure schnelle Antwort.

    Ich bin zwar nicht so richtig fit mit dem Quelltext-Lesen, aber soweit ich das überblicke sind das keine Javascript generierten Links. Zumal das erste Javascript dieser Site erst einige Zeilen weiter unten beginnt. Bis zum entsprechenden Link ist alles reiner HTML-Code und die Links die nicht runtergeladen werden unterscheiden sich (soweit ich das erkenne) nicht von denen, die runtergeladen werden.

    Ich traue mich nicht den Quellcode einer Site hier ins Forum zu stellen, um keine Urheberrechte zu verletzen.

    Jedoch habe ich etwas anderes festgestellt: Auf allen betreffenden Sites wird, wenn ich sie mit Konqueror öffne, unten rechts ein bug angezeigt, der bedeutet, daß die Site einen Kodierungsfehler enthält (s. Bild im Anhang). Könnte das eine Ursache sein?

    @tuxlover:

    Die Bilder haben alle völlig unterschiedliche Namen und selbst wenn, dann bleibt mir immer noch das Problem, die Bilder zu den entsprechenden Sites zuzuordnen. - Danke trotzdem.
     

    Anhänge:

  8. musiKk

    musiKk Dr. Strangelove

    Dabei seit:
    30.07.2006
    Beiträge:
    264
    Zustimmungen:
    0
    Ort:
    Leipzig
    Und wie waere es mit dem Link...?
     
  9. StDoe

    StDoe Lebenskünstler

    Dabei seit:
    31.03.2006
    Beiträge:
    78
    Zustimmungen:
    0
    Stimmt! Also:

    http://www.kaesekessel.de/kraeuter/a/apfel.htm

    Alle vier Bilder in der rechten Spalte fehlen, ebenso die vergrößerten Bilder dieser Bilder (nach klicken auf das Bild).
     
  10. Anzeige

    Vielleicht findest du HIER Antworten.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  11. #9 tuxlover, 04.02.2008
    tuxlover

    tuxlover Der den Tux knuddelt

    Dabei seit:
    26.10.2005
    Beiträge:
    2.106
    Zustimmungen:
    0
    Ort:
    berlin
    also ich hätte da nur noch mal ein tipp für dich wenn du websiten offline speichern willst, geht das besser mit der firefox erweiterung scrapbook.
     
  12. StDoe

    StDoe Lebenskünstler

    Dabei seit:
    31.03.2006
    Beiträge:
    78
    Zustimmungen:
    0
    Danke für den Tipp.
     
Thema:

wget holt nicht alle Bilder mit

Die Seite wird geladen...

wget holt nicht alle Bilder mit - Ähnliche Themen

  1. WebUI für wget opder Aria2 auf dem Raspberry Pi

    WebUI für wget opder Aria2 auf dem Raspberry Pi: Hallo, ich habe meinen Raspberry Pi mit Raspbian neu aufgesetzt und dabei die gesamte Software aktualisiert. Der Pi dient v.a. als...
  2. Probleme mit wget

    Probleme mit wget: Wenn ich den Befehlt wget benutze, um z.B. eine ZIP Datei herunterzuladen, dann ist die Ziel-Datei auf meinem PC sehr klein und enthält HTML...
  3. wget downloadproblem

    wget downloadproblem: Hallo, ich möchte mittels wget von einem Server einige Daten runterladen. Diese liegen zerstreut in einigen Unterordner :...
  4. wget zur Geschwindigkeitsmessung

    wget zur Geschwindigkeitsmessung: Hallo, ich versuche eine rudimentäre Lösung für eine Geschwindigkeitsmessung über eine busybox zu implementieren. wget -O /dev/null...
  5. wget und "get method"

    wget und "get method": Hallo zusammen, heute ist es mir aufgafallen dass sowas wget 'http://www.google.de/search?hl=de&q=xxxxxxxxxxxxxxxxxxx' nur startseite von...