sed:suche nach Textmuster

Dieses Thema im Forum "Shell-Skripte" wurde erstellt von anja_22, 26.11.2007.

  1. #1 anja_22, 26.11.2007
    anja_22

    anja_22 Grünschnabel

    Dabei seit:
    29.10.2006
    Beiträge:
    4
    Zustimmungen:
    0
    Hi,
    also ich hab ein Dateistruktur,die folgendermaße aussieht:
    ein table und mehrer Absätze sowas hier:
    <p class="text2">
    <a href="/link.htmll"><b>hier steht was...</b></a><br>
    <span class="text3">Hier auch <a href="/link2.html" class="borderline">und so weiter..-</a></span>

    </p>
    hier mal ein Dateiauszug:

    <table border="0" >
    <tr>
    <td valign="top">
    <span class="test">

    <b>26.11.2007</b>
    </span>
    </td>

    </tr>
    </table>
    <p class="text2">
    <a href="/link.htmll"><b>hier sthet was...</b></a><br>
    <span class="text3">Hier auch <a href="/link2.html" class="borderline">und so weiter..-</a></span>

    </p>
    ...
    <p class="text2">
    <a href="/link.htmll"><b>hier sthet was...</b></a><br>
    <span class="text3">Hier auch <a href="/link2.html" class="borderline">und so weiter..-</a></span>

    </p>

    <table border="0" cellpadding="4" cellspacing="0" width="480" style="border: solid 1px #4a5a74">
    <tr>

    Ich will jetzt nur alles im jew. Absatz haben: ab <b> bis </span>
    es soll nur der text da stehen ohne html Tags...
    mehrere Zeilen mit : getrennt:
    z:b. soll eine gefundene Zeile laut Beispiel source dann so ausshehen:
    hier steht was...:Hier auch

    ->das "und so weiter.." will ich nicht haben.

    ich hab echt schon alles versucht,verzweifele total: wenn also jemand eine Idee hat : Biiiittttttttte !!
    Lieben Gruß
    Anja
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 Wolfgang, 26.11.2007
    Wolfgang

    Wolfgang Foren Gott

    Dabei seit:
    24.04.2005
    Beiträge:
    3.978
    Zustimmungen:
    0
    Ort:
    Erfurt
    Hallo

    Wenn ich deinen Beispieltext in eine Datei Namens test.html gebe, dann funktioniert folgendes:
    Sed Multiline, da du ja alles in einer Zeile willst und tags auch über mehrere Zeilen gehen können:

    Code:
    wolle@Nietzsche:/tmp
    $ sed -ne '/^$/d;:l;$!{N;b l};$s/\n//g;s/[<][^>]*[>]\([^<]*\)/:\1/g;s/:\{2,\}/:/g;p' test.html
    :hier steht was...:Hier auch :und so weiter..-:hier mal ein Dateiauszug:26.11.2007:hier sthet was...:Hier auch :und so weiter..-:...:hier sthet was...:Hier auch :und so weiter..-:
    
    HTML zu parsen ist allerdings immer recht heikel.
    Wenn das wenigstens einigermaßen fehlerfrei erstellt ist, sollte das funktionieren. Garantieren kann das aber keiner.
    ;)

    Gruß Wolfgang
     
  4. JBR

    JBR Fichtenschonung

    Dabei seit:
    18.03.2007
    Beiträge:
    561
    Zustimmungen:
    0
    Ort:
    Nolop
    es gibt dafür ein cpan modul
     
  5. #4 Wolfgang, 01.12.2007
    Wolfgang

    Wolfgang Foren Gott

    Dabei seit:
    24.04.2005
    Beiträge:
    3.978
    Zustimmungen:
    0
    Ort:
    Erfurt
    Ja sicher doch, sogar mehrere für Perl.
    Aber von Perl war ja hier nicht die Rede!
     
  6. Anzeige

    Vielleicht findest du HIER Antworten.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
Thema:

sed:suche nach Textmuster

Die Seite wird geladen...

sed:suche nach Textmuster - Ähnliche Themen

  1. Keine Benachrichtigungen im Vollbild Modus

    Keine Benachrichtigungen im Vollbild Modus: Arch Linux Plasma 5.8 Weiss einer ob das gehen sollte, bzw kann mal einer testen ob es bei ihm geht, gerne auch mit anderen kde/plasma versionen....
  2. SRV Records nicht erstellt nach dcpromo

    SRV Records nicht erstellt nach dcpromo: Hallo zusammen, leider sind beim Join meines 2. DC in eine Samba 4 Domäne die SRV-DNS Records nicht erstellt worden... Hatte jemand schonmal das...
  3. CentOS 7: Falsche Metric bei regelbasiertem Routing nach Server-Reboot

    CentOS 7: Falsche Metric bei regelbasiertem Routing nach Server-Reboot: Hallo zusammen Ich möchte unseren existierenden SFTP Server durch einen neuen Server mit CentOS 7 ersetzen. Da der Server einerseits direkt via...
  4. Nicht erkannte Zeichen nach Update

    Nicht erkannte Zeichen nach Update: Hi, nachdem ich mein Kali Linux geupdated habe, ist mir aufgefallen dass viele Zeichen auf verschiedenen Nutzeroberflächen nur fehlerhaft...
  5. Nach Update debian 8 ist der Zugriff auf samba4 nicht möglich

    Nach Update debian 8 ist der Zugriff auf samba4 nicht möglich: Gerade habe ich debian mit dem Befehl "apt-get ugrade" aktualisiert. Es gab zahlreiche neue Daten unteranderen samba files. Nach neuem Start kann...