B
Bamboo156
Grünschnabel
Hallo zusammen.
Ich habe folgendes Anliegen:
Ich habe eine HTML Datei mit entsprechenden Tags usw. . Diese möchte ich in eine normale Textdatei mittels sed konvertieren und dabei diverse Aufgaben erledigen. Der Text zwischen den Tags <hx> und </hx> soll in Großbuchstaben mit einem Leerzeichen zwischen den Buchstaben, drei Leerzeichen zwischen den Worten und abschließend noch die Tags entfernt werden.
Ich lerne gerade Linux/sed/Terminal kennen und hänge hier an vielleicht trivialen Dingen.
Ich war natürlich nicht ganz untätig und habe gerade folgende Dinge bereits gemacht.
s!\<h1\>.*\<h1\>!\U&!g; #für die Großbuchstaben
s!.!& !g; #Leerzeichen, aber nach JEDEM Zeichen. Nicht nur innerhalb der Tags.
s!<[^>]*>!!g; #alle Tags entfernen
Dazu habe ich noch alle HTML Umlaute in "normale" Umlaute geändert und die prinzipielle Ausgabe in .txt klappt auch. Ich schreibe das alles in einem sed-Skript mittels gedit bzw vim.
Ich wäre euch dankbar für Tipps und Hilfe.
Ich habe folgendes Anliegen:
Ich habe eine HTML Datei mit entsprechenden Tags usw. . Diese möchte ich in eine normale Textdatei mittels sed konvertieren und dabei diverse Aufgaben erledigen. Der Text zwischen den Tags <hx> und </hx> soll in Großbuchstaben mit einem Leerzeichen zwischen den Buchstaben, drei Leerzeichen zwischen den Worten und abschließend noch die Tags entfernt werden.
Ich lerne gerade Linux/sed/Terminal kennen und hänge hier an vielleicht trivialen Dingen.
Ich war natürlich nicht ganz untätig und habe gerade folgende Dinge bereits gemacht.
s!\<h1\>.*\<h1\>!\U&!g; #für die Großbuchstaben
s!.!& !g; #Leerzeichen, aber nach JEDEM Zeichen. Nicht nur innerhalb der Tags.
s!<[^>]*>!!g; #alle Tags entfernen
Dazu habe ich noch alle HTML Umlaute in "normale" Umlaute geändert und die prinzipielle Ausgabe in .txt klappt auch. Ich schreibe das alles in einem sed-Skript mittels gedit bzw vim.
Ich wäre euch dankbar für Tipps und Hilfe.
Zuletzt bearbeitet: