Generator für reguläre Ausdrücke

Haben Sie eine tolle Idee für eine neue Funktion?

Moderator: Forum-Team

Generator für reguläre Ausdrücke

Beitragvon TomJoad » 12. Nov 2007, 13:00

Hi,

Spam-Wörter variieren bekanntlich in ihrer Schreibweise. Diese Variation wird durch reguläre Ausdrücke abgefangen. Dabei werden erfahrungsgemäß ganz bestimmte Zeichen immer wieder als Ersatz für den echten Buchstaben verwendet (z.B. 3 für e oder 4 für A).

Aufgrund dieser Erfahrungen sollte es möglich sein, die komplizierten regulären Ausdrücke mittels eines Generators auch weitgehend automatisiert zu erzeugen. So etwas habe ich bereits im Web gefunden, allerdings nicht hundertprozentig auf die Belange von Spamihilator angepaßt.

Ich glaube hier würde Handlungsbedarf bestehen. Sonst ist die Erweiterung der eigenen Spamwortliste einfach zu aufwendig.

Die Frage ist auch, ob es nicht eine zentrale Sammelstelle für bekannte Spamwörter geben könnte, mit Online-Update-Funktion.

Gruß TJ
TomJoad
User
User
 
Beiträge: 2
Registriert: 12. Nov 2007, 12:52

Re: Generator für reguläre Ausdrücke

Beitragvon Chactory » 12. Nov 2007, 14:06

Hi TJ,

das sind gute Ideen.
Bitte zitiere mal, wo im Internet man eine solche RegEx automatisiert generieren lassen kann.
Siehe auch hier: RegEx in Spamihilator.

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5, 8 GB RAM, Windows 7 Pro 64 Bit
Neu: Inspiron 14 5000, Intel Core i7, 16 GB RAM, Win 10 Pro 64 Bit
Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9612
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Generator für reguläre Ausdrücke

Beitragvon TomJoad » 12. Nov 2007, 16:41

Schau mal auf dieser Seite... da gibt es so eine Art Generator.

http://espresso.tippscout.de/go/assgen.php

Die Ergebnisse sind für Spamihilator nicht ganz perfekt, glaube ich :) Aber das Prinzip an sich dürfte passen.

Da fällt mir ein: fällt auch der Betreff einer Mail unter die Spamwort-Suche? Ich habe bisher den Eindruck, daß nicht!
TomJoad
User
User
 
Beiträge: 2
Registriert: 12. Nov 2007, 12:52

Re: Generator für reguläre Ausdrücke

Beitragvon Chactory » 12. Nov 2007, 20:39

Toller Hyperlink!

Ich komme allerdings mit seiner Schreibweise nicht ganz klar ...

/r.?(?:o|0|\(\)).?[l1\|].?[e3].?x.?/i

Weißt Du, was der Backslash am Anfang des Ausdrucks bewirkt?
Und was "?:" und "\i"?
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5, 8 GB RAM, Windows 7 Pro 64 Bit
Neu: Inspiron 14 5000, Intel Core i7, 16 GB RAM, Win 10 Pro 64 Bit
Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9612
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Generator für reguläre Ausdrücke

Beitragvon Andreas_Z » 12. Nov 2007, 20:50

Hallo Chactory!

Da ist dann auch schon die große bei RegExp. Es gibt viele verschiedene Varianten. Alle haben eine ähnliche Syntax. Aber die kleinen, feinen Unterschiede machen die Sache erst so kompliziert. Es besteht aus meiner Sicht durchaus die Gefahr, daß die RegExp-Bibliothek, die Michel verwendet hat, nicht alle Feinheiten kennt oder unerwartet reagiert. Hier wäre also ein Hinweis angebracht, welchen Still Spami versteht. Leider bin ich auf diesem Gebiet nicht fit. Ich kann also nicht sagen, was die beiden Angaben bedeuten.

Gruß Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Generator für reguläre Ausdrücke

Beitragvon AlexV » 13. Nov 2007, 08:45

Chactory hat geschrieben:/r.?(?:o|0|\(\)).?[l1\|].?[e3].?x.?/i

Weißt Du, was der Backslash am Anfang des Ausdrucks bewirkt?
Und was "?:" und "\i"?

In Perl, Ausdrüke anfangen und beenden mit /, den nach dem letzten / komme die Optionen. Hier, die Option i beteutet "case insensitive", order "Groß-/Kleinschreibung nicht unterschieden".

?: macht teil dem Ausdruckstiel (?: ... ), was bedeutet dasselbe wie ( ... ) (zusammenfassen), aber ohne Rückwärtsreferenzen (\1, \2, ...) machen.

Gruß, Alex
AlexV
Spam-Massenmörder
Spam-Massenmörder
 
Plugin-Programmierer
 
Beiträge: 139
Registriert: 26. Nov 2005, 12:25

Re: Generator für reguläre Ausdrücke

Beitragvon Chactory » 13. Nov 2007, 13:23

Danke, Andreas_Z und AlexV! :)
Möglicherweise ist die Perl-Syntax nicht einzueins auf Spamihilator übertragbar.
C.
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5, 8 GB RAM, Windows 7 Pro 64 Bit
Neu: Inspiron 14 5000, Intel Core i7, 16 GB RAM, Win 10 Pro 64 Bit
Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9612
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Generator für reguläre Ausdrücke

Beitragvon michel » 13. Nov 2007, 20:17

Hi!

Das könnte sein. Spamihilator verwendet übrigens folgende RegEx-Bibliothek:
http://www.boost.org/libs/regex/doc/index.html

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck


Zurück zu Feature Requests

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron

 industrious-southeast