String ausschneiden klappt nicht

M

megger

Grünschnabel
Hallo zusammen,

ich lese eine HTML-Datei ein und speicher die unter anderem Namen weg

cat index.html > index_megger.html

In dieser Datei kommt immer eine bestimmte Passage vor, die ich wegwerfen möchte..alles von

Code:
<script language="JavaScript" type="text/JavaScript" src="/xx/yy/flashmovie.js"></script>
bis inklusive zum nächsten auftretenden
Code:
</noscript><br/><br/></div>
soll entfernt werden...das muss doch irgendwie mit nem sed-Befehl hinzukriegen sein, oder?
ich beiss mir momentan noch voll die zähne aus...

gruss, michbeck
 
Hallo

Da sed zeilenweise arbeitet, ist es wichtig zu wissen, ob der zu löschende Part in Zeilen steht.

Wenn du das sicher stellen kannst, dann ist es ganz einfach :

Code:
 sed -e '/anfangzeile/,/endzeile/d' datei >neue_datei

sed -e '/^<script.*/,/^<\/noscript.*/d' datei >neue_datei
Hier wird alles (alle Zeilen) von ersten Auftreten eines <script am Zeilenanfang bis zu eimem Auftreten eines </noscript am Anfang gelöscht.
Sollte es aber mehrere Abschnitte dieser Art geben, musst du die Bedingung genauer spezifizieren.

Solltest du Kraut und Rüben HTML vorliegen haben, wird es etwas komplizierter.
Aber dann kannst du einfach dafür sorgen, dass vorher jeder script und noscript Tag am Zeilenanfang steht.


Gruß Wolfgang
 
Vielen Dank!

Hallo Wolfgang,

vielen Dank, funktioniert genauso, wie ich mir dat vorstelle :-)

Gruss, michbeck
 

Ähnliche Themen

Open-Xchange auf OpenSuse mit Commu. Installer - Compiler Fehler

Zurück
Oben