RegEx Problem

foexle

foexle

Kaiser
Hi Leute,

bräuchte hilfe bei einem RegEx Ausdruck.
Hab shcon einiges versucht, aber bisher weder nichts oder das falsche raus bekommen, evtl wisst ihr ja ne lösung.

Code:
<div class="wideUserInfo" id="ctl00_ctl00_cpMain_GoogleSearchResults_searchResultsRepeater_ctl00_webBody">
                <a id="ctl00_ctl00_cpMain_GoogleSearchResults_searchResultsRepeater_ctl00_titleLink" href="http://www.myspace.com/jochenarbeit">MySpace.com - Arbeit - DE - Experimental / Electronica...<br/></a>
                <b>JOCHEN</b> ARBEIT Moved 1980 to Berlin and became part of the loose artist and music   movement “Geniale Dilettanen”. Which had its...<br/>
                <span class="vanity">www.myspace.com/jochenarbeit</span>
                
                <span class="line" id="ctl00_ctl00_cpMain_GoogleSearchResults_searchResultsRepeater_ctl00_line"/>
            </div>

Nun will ich nur den Text haben der zwischen
</a> und dem ersten <span liegt. Aber ich bekomms einfach nicht hin.

Hoffe jmd kennt sich damit aus :>

greetz und danke
 
Hi,

und auch hier sehe ich das Problem nicht...
Code:
</a>.*<span
Und fertig, einfacher koennen regexes doch schon fast nicht mehr aussehen. Je nachdem welche Sprache du konkret verwendest und wie das Ganze hinterher aussehen soll, muss das natuerlich noch leicht angepasst werden.

mfg,
bytepool
 
Zuletzt bearbeitet:
genau das habe ich auch so versucht ... nur leider matcht der diesen ausdruck oder ähnliche nicht :>
 
Je nachdem welche Sprache du konkret verwendest und wie das Ganze hinterher aussehen soll, muss das natuerlich noch leicht angepasst werden.
Ohne konkreter zu werden, wird dir hier kaum jemand helfen koennen. Ich dachte du wuesstest mittlerweile das "funzt nicht" keine Fehlerbeschreibung ist. ;p
Regulaere Ausdruecke funktionieren nicht ueberall gleich, es gibt nur eine gemeinsame Theorie.
 
Natürlich ... funktionieren regex überall gleich. Sonst würde das gegen den sinn von RegEx sprechen. Es gibt leichte unterschiede in sachen entwerten von Sonderzeichen aber im grossen und ganzen ist das immer das gleiche.
"Das geht nicht" ist ein ausdruck dafür das ich keinerlei anhaltspunkt habe wiso das nicht klappt. Ich bekomme nichts zurück => string wird nicht gematcht. Also was soll ich deiner meinung nach schreiben.
Willste noch die sprache wissen ?
Ruby

Das spielt im endeffekt aber keine rolle
 
Hi,

Das spielt im endeffekt aber keine rolle

Doch. Ich vermute das dein Problem die Zeilenumbrueche sind. Schonmal versucht die Zeilenumbrueche rauszunehmen? Ohne die Zeilenumbrueche klappt das bei mir wie's soll.

mfg,
bytepool
 
Wenn du nur bis zum ersten "<span" matchen willst, musst du den Quantifier "*" nongreedy machen. In perl geht das mit nem nachgestellen Fragenzeichen, also "*?".

Wenn du mit dem Punkt (".") auch newlines matchen willst, musst du das als flag angeben. Entweder m (multiline) oder s (singleline). Habs grade vergessen welcher was macht. Einer lässt die Anchors "^" und "$" auch auf Zeilenanfänge matchen und der andere lässt den Punkt "." auch Newlines matchen.

All that said, schau lieber mal hier und hier.
Parsing HTML with regular expressions considered harmful!
 

Ähnliche Themen

dovecot und postfix Konfiguration Problem

CMS Problem [php]

Jaunty + Zend + Gdata + xampp

Amavis & Benachrichtigungen

Zurück
Oben